Meta lanza Llama 3.1 405B para competir en rendimiento y habilidad

Ser capaz de proporcionar comentarios de alta calidad en una variedad de contextos, desde breves hasta ampliados.

MADRID, 23 de julio (Portaltic/EP) –

Meta lanza nueva versión del modelo de Inteligencia Artificial, Convocatoria 3.1, posiciones Con una impresionante cantidad de 405 mil millones de parámetros (405B), está a la par de los modelos de automóviles cerrados más sofisticados. Esta innovación demuestra habilidades excepcionales en áreas como conocimiento general, orientación, matemáticas, manejo de herramientas y traducción multilingüe.

Con la innovación, Llama 3.1 405B se convierte en el mejor modelo básico de código abierto hasta la fecha. Está diseñado con el objetivo de revolucionar los flujos de trabajo actuales, fomentando la creación de datos sintéticos y la optimización de los modelos existentes.

Según informó la compañía, este modelo compite en rendimiento con alternativas cerradas avanzadas como GPT-4, GPT-4o y Claude 3.5 Sonnet en pruebas de escenarios del mundo real, al mismo tiempo que marca la diferencia en las áreas de conocimiento, potencia informática y capacidad de gestión de herramientas.
Para crear lo mencionado anteriormente Para este modelo, llevamos a cabo una capacitación de usuarios que utiliza 15 mil millones de tokens, una disposición que requiere el uso de aproximadamente 16 000 GPU Nvidia H100, optimizando así tanto la calidad como la cantidad de información procesada durante la fase de selección y capacitación previa.
Permisos de entrenamiento Llama 3.1 Meta elige implementar una arquitectura de transformador de decodificador único y sigue un enfoque iterativo basado en ajuste supervisado y optimización de preferencias directas

Este modelo avanzado admite contextos de hasta 128.000 tokens, mostrándose. ser capaz de proporcionar comentarios de alta calidad en una variedad de contextos, desde breves hasta ampliados. Actualmente está disponible para pruebas en los EE. UU. a través de WhatsApp y meta.ai, y admite preguntas relacionadas con matemáticas y programación.

Además, Meta ha introducido versiones nuevas de los modelos Llama 8B y 70B, que admiten contextos de 128.000 tokens. y demostrar capacidades de inferencia mejoradas. Estas plantillas están diseñadas para ayudar a crear resúmenes de texto extensos, conversaciones multilingües y ayudar con la codificación.

Además, Meta se ha centrado en promover la IA responsable y ha lanzado un conjunto de herramientas de código abierto, incluido Llama 3 Guard. . y Prompt Protection para mejorar la seguridad y el filtrado de índices respectivamente, y Llama Stack, dirigido a desarrolladores en GitHub para promover la interoperabilidad dentro del ecosistema.

Sobre el Autor

TRA Noticias

Te interesara ver

Córdoba Biotech: un motor para el desarrollo de startups científicas La Incubadora Córdoba Biotech fomenta la creación de nuevos emprendimientos con una

Córdoba intensifica su presencia global como destino turístico

Un informe revela que las redes sociales afectan de manera negativa el bienestar de los jóvenes

Sobre el Autor

TRA Noticias