Tecnologia

Chatbot Grok retroalimentará imágenes implementando

8140063002.png
8140063002.png
Una nueva actualización de su modelo Grok-1.5V, agregando capacidades multimodales.

MADRID, 22 mayo. (Portaltic/EP) –

X (antiguo Twitter) compartió avances con las capacidades multimodales del artificial Grok modelo de inteligencia artificial (IA), que puede procesar imágenes y contenido visual, para responder preguntas relacionadas con este contenido.
La plataforma liderada por Elon Musk presentó su «chatbot» en noviembre pasado, lanzado en una versión de prueba para Suscriptores Premium+, con capacidad de dar respuestas al usuario. tiempo real. La herramienta funciona con el modelo de lenguaje del mismo nombre, la versión Grok-1.5 se anunció a finales de marzo, que incluye mejoras en el rendimiento y tareas relacionadas con la codificación y las matemáticas.
Recientemente, se presentó X. una nueva actualización de su modelo Grok-1.5V, agregando capacidades multimodales. Es decir, puede procesar información visual, como documentos, cuadros, diagramas, capturas de pantalla, cuadros y fotografías.

Ahora, la empresa de inteligencia artificial de Elon Musk, xAI, compartió los avances de Grok en información visual. Procesando. y confirmar que el “chatbot” es capaz de analizar y procesar imágenes, así como responder preguntas relacionadas con la implementación de Grok-1.5V.

Esto se indica en el documento Documentación actualizada para el desarrollo de software. kit (SDK), que muestra una demostración de IA multimodal, ahora está disponible para los desarrolladores.

Además, las líneas de código Python explican cómo usar el SDK de la biblioteca xAI para que los chatbots generen respuestas basadas tanto en texto como en imágenes. Entonces, en el ejemplo compartido, el código detalla que la IA recibe la imagen y la lee para su análisis. Luego, el chatbot recibe la pregunta «¿Qué es esto?» y use el SDK de xAI para resolverlo.

Como X mostró recientemente en una publicación de blog de xAI, gracias a sus capacidades multimodales, Grok puede escribir código a partir de imágenes de diagramas, obtener memes y dar explicaciones, analizar imágenes. de etiquetas con valor nutricional y calcular las calorías de los alimentos que contienen esa etiqueta, o incluso crear una historia a partir de un dibujo.
Así que, en general, X continúa desarrollando las capacidades de IA de su chatbot, para que Las capacidades multimodales del chatbot Grok llegarán a los usuarios principales en el futuro.

TRA Digital

GRATIS
VER