NUEVA YORK (EFE). — Google lanzó ayer a un grupo selecto de desarrolladores Gemini 1.5 Pro, un modelo de inteligencia artificial (IA) capaz de procesar grandes cantidades de información a la vez, incluida una hora de vídeo, 11 horas de audio, 30.000 líneas de código y más. 700.000 palabras.
Hace unos años, memorizar o comprender el contexto de cientos de palabras era bastante difícil, incluso allá por los años 50, cuando (Claude) Shannon (el matemático que inventó la teoría de la información) ideó el lenguaje, que consiste en analizar dos palabras”, dijo Oriol Vinyals, vicepresidente de investigación de Google DeepMind y director ejecutivo de Gemini. Para ilustrar las capacidades de Gemini 1.5 Pro, Vinyals demostró, mediante un vídeo pregrabado, que el modelo podía analizar 402 páginas de texto grabadas desde el Apolo 11, la primera misión humana a la Tierra. – y encuentra tres citas divertidas.
Además del texto, los usuarios podrán interactuar con el modelo a través de fotografías o dibujos. En el ejemplo del vídeo tutorial, el usuario muestra al Gemini 1.5 Pro un dibujo muy sencillo de una bota golpeando el suelo y pregunta: ¿Qué hora es? Responda con una cita exacta.
La respuesta de la máquina es una cita famosa del astronauta Neil A. Armstrong: Ése es un pequeño paso para el hombre. Vinyals ofrece ejemplos similares, en los que se utiliza como fondo una película muda de 45 minutos de Buster Keaton en lugar de texto.
Con respecto a la programación, en un comunicado, la compañía señaló sobre Gemini 1.5 Pro: Puede realizar tareas de solución de problemas más consistentes en bloques de código más largos. Cuando vea un mensaje que contiene más de 100.000 líneas de código, podrá razonar mejor entre ejemplos, sugerir cambios útiles y proporcionar explicaciones de cómo funcionan las diferentes partes del código. En cierto modo, funciona de forma muy parecida a cómo funciona nuestro cerebro, explica Vinyals.
Gemini 1.5 rinde al mismo nivel que 1.0 Ultra, el modelo más complejo de Google hasta la fecha. Una declaración del director ejecutivo de Google y Alphabet, Sundar Pichai, dijo que Gemini 1.5 Pro ayudará a los desarrolladores a crear plantillas y aplicaciones más útiles. ‘Estamos entusiasmados de ofrecer una vista previa limitada de esta función experimental a desarrolladores y clientes empresariales’, enfatizó Pichai.
A partir de hoy, desarrolladores selectos y clientes de la nube podrán comenzar a construir con 1.0 Ultra, con la interfaz de programación de aplicaciones (API) Gemini en AI Studio y Vertex AI. En cuanto a la ilusión (respuestas bien estructuradas a respuestas incorrectas), Vinyals señala que sigue siendo un problema en la IA general que aún se está resolviendo. La semana pasada, Google cambió el nombre de su chatbot de inteligencia artificial (IA) de Bard a Gemini, anunciando que la tecnología estaría disponible en la nueva aplicación Gemini para Android y a través de la aplicación de Google en iOS, y también lanzó una versión paga mejorada de el servicio, utilizando Gemini.
1.0 súper.