Tecnologia

Google avanza hacia el asistente universal del Proyecto Astra de la

8687377019.png
Este modelo se ha ampliado con dos variantes: Gemini 2.5 Pro, ideado para tareas más complejas, y Gemini 2.5 Flash, más eficiente.

Este contenido fue hecho con la asistencia de una inteligencia artificial y contó con la revisión del editor/periodista.

MADRID, 20 de mayo (Portaltic/EP) – Google ha expandido las habilidades de su modelo más avanzado hasta la fecha, Gemini 2.5, que se ha actualizado con nuevas versiones diseñadas para satisfacer las necesidades de los desarrolladores y funciones directamente de su proyecto de asistente universal.

Google celebró este martes su evento anual de desarrolladores, donde compartió las novedades en inteligencia artificial, enfocándose en la actualización de Gemini 2.5 y los avances en sus principales proyectos: Astra, Starline y Mariner.

Gemini 2.5 es actualmente el modelo más sofisticado de Google, liderando en todas las categorías de LMArena y ocupando el primer lugar en WebDevArena, como subrayó el director ejecutivo de Google, Sundar Pichai, durante su discurso.

Este modelo se ha ampliado con dos variantes: Gemini 2.5 Pro, ideado para tareas más complejas, y Gemini 2.5 Flash, más eficiente. El primero, además, ofrecerá un modo de pensamiento profundo, que considerará diferentes hipótesis antes de ofrecer una respuesta.

Gemini 2.5 Flash, por otro lado, proporciona un buen rendimiento a un costo más accesible, con mejoras en razonamiento, programación y longitud de contexto. Estará disponible en julio en vista previa en AI Studio, Vertex y Gemini API.

Y para que los desarrolladores tengan un mayor control sobre los tokens que utilizan, Google ha anunciado Thinking Budgets en Gemini 2.5 Pro. En este modelo, y también en 2.5 Flash, se ha presentado la función experimental Thoughts, que detallará el proceso de razonamiento de los modelos.

La empresa también ha mejorado Gemini 2.5 con nuevas funciones, como ‘Native audio output’, que introduce la compatibilidad con dos voces, con la posibilidad de alternar entre ellas para acceder a diferentes tonos e idiomas.

Asimismo, ha anunciado los nuevos modelos Gemini Diffusion, para explorar la técnica de la difusión en nuevos modelos de lenguaje que permitirán a los usuarios tener más control y creatividad y agilizar la generación de texto. A esto se suman los llamados World models, modelos que simulan el mundo real a partir de una comprensión profunda de la física para avanzar en robótica.

Google ha compartido los avances en los tres proyectos con los que busca modelar la interacción con inteligencia artificial. Uno de ellos es el Proyecto Starline, una plataforma de videocomunicación que pretende transmitir la sensación de estar físicamente junto a la persona con la que se está hablando a través de una pantalla.

Google Beam es la nueva solución que busca romper las barreras de la comunicación transformando retransmisiones bidimensionales en retransmisiones tridimensionales, más realistas, con la ayuda de un sistema de seis cámaras ubicado estratégicamente en la pantalla.

Además, la tecnología de traducción en tiempo real de Starline llegará a Google Meet, inicialmente en inglés y español para los suscriptores, con la intención de ampliar los idiomas disponibles.

En cuanto a Astra, el proyecto para crear un asistente de inteligencia artificial universal, la compañía ha destacado las capacidades de Gemini Live, tomadas directamente de esa iniciativa, que utiliza la cámara del móvil para que la IA vea lo que ve el usuario y pueda ofrecer información en tiempo real. Esta función ya está disponible para todos los usuarios de Android e iOS.

El Proyecto Mariner, por su parte, introduce un agente con capacidad para navegar por la web y realizar acciones en lugar del usuario. Como novedad, soporta la multitarea, con capacidad para realizar hasta diez acciones simultáneamente.

Google también facilitará la comunicación entre agentes con Gemini SDK, que es compatible con las herramientas MCP. A esto se suma la llegada del modo agente a la ‘app’ de Gemini, para que el asistente realice tareas por el usuario, como buscar un apartamento.

Para los agentes, la personalización es muy importante. Al respecto, Google ha destacado la función de contexto personal, que permite que la IA recopile información del usuario de las aplicaciones propias de la marca. Una novedad son las ‘Respuestas inteligentes personalizadas’ de Gmail, con las que Gemini capta el tono y el estilo del usuario en sus respuestas.

Google también ha actualizado su modelo de generación de imágenes. Imagen 4, que ofrece imágenes más ricas con colores más vibrantes y más detalles, prestando atención a los contrastes de luz y sombra.

La herramienta de generación de vídeo Veo 3, por su parte, mejora la calidad de la imagen del vídeo con un mejor control de la física del mundo e introduce la generación de audio, para crear efectos de sonido, de fondo y diálogo.

TRA Digital

GRATIS
VER