La IA general está evolucionando rápidamente y hemos pasado de hablar de LLM (modelado de lenguaje amplio) a LMM (modelo de lenguaje). lenguaje multimodal). Para poner las cosas en contexto, LLM o LMM permite la interacción funcional con inteligencia artificial, ChatGPT es un ejemplo perfecto de este caso. ChatGPT es un medio interactivo. GPT-4 (o GPT-5, próximamente), LLM, es lo que hace posible esta interacción tras largos periodos de entrenamiento con grandes volúmenes de datos. ¿Cuál es la diferencia entre LLM y LMM? ¿Y por qué todo pasó a LMM? Esto es similar a lo que hemos visto en la evolución de las redes sociales, donde comenzaron con texto y terminaron con multimedia. En principio, el LLM está diseñado para procesamiento de textos. Por otro lado, LMM gestiona texto e imágenes para que sean multimodales. Gemini, presentado por Google en los últimos días, es un ejemplo de LMM accesible a través de Bard, el chatbot que lanzó hace unos meses en respuesta a la moda de ChatGPT. Según los planes de Google, Gemini estará en plena vigencia en 2024, pero por ahora, Gemini Pro se puede utilizar en Bard. La demostración de Gemini presentada por Google da una idea de qué esperar en términos de IA sintética impulsada por LMM, y aunque el futuro inmediato parece impresionante, debemos tomarnos las expectativas con calma. Impresionante y entretenida a partes iguales, la demostración del Gemini lamentablemente refleja la realidad actual: es una versión mejorada y hasta cierto punto engañosa de las capacidades del modelo Este. Falsificar manifestaciones y exagerar las capacidades tecnológicas se ha convertido en una práctica común en el campo, un caso observado a nivel de cámara, aplicación y otros teléfonos inteligentes. Quizás Gemini sea tan bueno como Google quiere mostrar con su presentación, pero no deja de ser un engaño, sobre todo porque no se advirtió claramente al público sobre la realidad de la supuesta demostración. En todo Silicon Valley parece haber una cultura de optimismo poco realista, de intentar vender ideas tan audaces que resultan imposibles, demostrando con el tiempo que muchas de ellas no son más que un error. Ejemplos no faltan, y uno que destaca en particular es Theranos y la promesa de su fundadora, Elizabeth Holmes, de diagnósticos médicos rápidos y fiables a partir de tan solo una gota de sangre. Veremos qué pasa con Gemini, pero por ahora Google tiene dos soluciones a los problemas de IA que surgen.
Acerca de Google Gemini, así es como está evolucionando la IA general: El Nacional
La IA general está evolucionando rápidamente y hemos pasado de hablar de LLM (modelado de lenguaje amplio) a LMM (modelo de lenguaje). lenguaje multimodal). Para poner las cosas en contexto, LLM o.