Meta ha publicado un paper muy interesante sobre LLaMA, un nuevo modelo de aprendizaje automático que es diferente a ChatGPT. En este nuevo artículo, analizaremos con profundidad el contenido de esta investigación.
LLaMA: la nueva IA de Meta
¿Qué es LLaMA? Si piensas que es como ChatGPT o Bing Chatbot, te equivocas. Meta ha creado una herramienta de investigación con la intención de «democratizar el acceso a este cambio en rápida evolución». Básicamente, esta herramienta tiene como objetivo ayudar a los expertos a abordar los problemas que enfrentan los modelos lingüísticos de IA, tales como el sesgo, la toxicidad en internet y la generación de información falsa.
LLaMA es un conjunto de cuatro modelos de diferentes tamaños que están disponibles bajo una «licencia de uso no comercial para fines de investigación». Esta herramienta se encuentra disponible para diversos grupos, como universidades, ONG y laboratorios industriales.
Según Meta:
«Creemos que toda la comunidad de la IA -investigadores académicos, sociedad civil, responsables políticos e industria- debe trabajar conjuntamente para desarrollar directrices claras sobre la IA responsable en general y los grandes modelos lingüísticos responsables en particular».
Avances y hallazgos interesantes
Meta afirma que la segunda versión más pequeña, LLaMA-13B, rinde mejor que el popular modelo GPT-3 de Open AI, «en la mayoría de los puntos de referencia». No obstante, la más grande, LLaMA-65B, es competitiva con los mejores modelos», como Chinchilla70B de DeepMind y PaLM 540B de Google.
Según The Verge, «los números en estos nombres se refieren a los miles de millones de parámetros en cada modelo, una medida del tamaño del sistema y una aproximación de su sofisticación, aunque estas dos cualidades no necesariamente se escalan al mismo tiempo»
Después de ser entrenado, LLaMA-13B es capaz de funcionar en una sola GPU Nvidia Tesla V100 que es adecuada para centros de datos. Esta capacidad resulta especialmente valiosa para instituciones más pequeñas que deseen realizar pruebas en este tipo de sistemas. No obstante, para los investigadores individuales esta opción no resulta viable, ya que se trata de equipos costosos y fuera de su alcance.
Gracias al lanzamiento de LLaMA, se ha perdido parte de la expectación en torno a los chatbots de IA. Esto no es malo, debido a las críticas que ha recibido Microsoft por precipitarse en el lanzamiento de Bing y la caída de las acciones de Google, luego de la respuesta errónea de Bard.
Los intentos fallidos de Meta
Sin embargo, Meta no ha tenido tanto éxito en el lanzamiento de chatbots de IA. BlenderBot era un desastre y Galactica fue retirado después de sólo tres días después de que siguiera produciendo tonterías científicas.
Probablemente, LLaMA tendría una acogida más amable y sería un gran avance para la industria.
LLaMA: conclusiones
En medio de tantas copias de features en Facebook e Instagram, además de la broma cara del metaverso, es positivo que se atrevan a crear nuevos modelos de aprendizaje automático, con el objetivo de democratizar el acceso en un campo tan fascinante (como aterrador, en algunos casos) como la Inteligencia Artificial.
¡Comenta! Tu opinión nos importa 😎