Meta lanza Llama 3.1: el modelo de IA de código abierto más potente hasta el momento

Meta ha anunciado el lanzamiento de Llama 3.1, su último y más avanzado modelo de inteligencia artificial de código abierto. Esta nueva versión representa un avance significativo en la tecnología de IA y Meta afirma que supera a los principales modelos propietarios de empresas como OpenAI.

El modelo insignia Llama 3.1 405B, con 405 mil millones de parámetros, es ahora el modelo base más grande disponible públicamente. Demuestra capacidades de vanguardia en conocimiento general, matemáticas, uso de herramientas y traducción multilingüe. El modelo se entrenó en más de 15 billones de tokens utilizando más de 16 000 GPU H100 de Nvidia.

Una de las mejoras clave de Llama 3.1 es la ampliación de la longitud del contexto a 128 000 tokens, que es 16 veces la capacidad de los modelos Llama anteriores. Esto permite que la IA procese y comprenda pasajes de texto mucho más largos, lo que mejora su capacidad para gestionar tareas complejas y generar respuestas más matizadas.

El nuevo modelo admite ocho idiomas: inglés, alemán, francés, italiano, portugués, hindi, español y tailandés. Esta capacidad multilingüe convierte a Llama 3.1 en una herramienta versátil para desarrolladores y empresas que trabajan en aplicaciones de IA globales.

Meta está lanzando Llama 3.1 en tres tamaños: parámetros 405B , 70B y 8B . Cada tamaño está optimizado para diferentes casos de uso:

El modelo 405B es ideal para aplicaciones empresariales e investigación avanzada, capaz de generar textos largos, traducción multilingüe, codificación y tareas de razonamiento complejo.
El modelo 70B es adecuado para la creación de contenido, la inteligencia artificial conversacional y la comprensión de idiomas.
El modelo 8B está diseñado para aplicaciones con recursos computacionales limitados, como dispositivos móviles.

Para facilitar su adopción, Meta está colaborando con importantes empresas tecnológicas como Amazon, Google y Databricks para que Llama 3.1 esté disponible en varias plataformas. Por ejemplo, los modelos ahora están disponibles en Amazon Web Services (AWS) a través de servicios como Amazon SageMaker JumpStart y Amazon Bedrock.

Mark Zuckerberg, director ejecutivo de Meta, destaca la importancia de la IA de código abierto y afirma que es fundamental para democratizar los beneficios de la IA. Cree que los modelos de código abierto como Llama 3.1 acabarán superando a los de código propietario en cuanto a capacidades y tasas de adopción.

El lanzamiento de Llama 3.1 también incluye una licencia actualizada que permite a los desarrolladores utilizar los resultados del modelo para mejorar otros sistemas de IA. Se espera que esta medida acelere la innovación en el campo de la IA y proporcione a los desarrolladores más flexibilidad para crear y personalizar aplicaciones de IA.

El compromiso de Meta con la IA de código abierto recuerda a cómo Linux se convirtió en el sistema operativo de código abierto dominante para muchos dispositivos y servidores. La empresa espera que Llama 3.1 se convierta de manera similar en una piedra angular para el desarrollo de la IA.

A medida que la IA continúa evolucionando rápidamente, el lanzamiento de Llama 3.1 marca un hito importante en la tarea de hacer que los modelos de IA más potentes sean más accesibles para los desarrolladores y las empresas de todo el mundo. Prepara el terreno para una nueva era de innovación en IA, en la que los modelos de código abierto compiten directamente con sus contrapartes patentadas y, potencialmente, las superan.