Madrid, 21 de febrero (Portatics/EP) –
Microsoft ha introducido Magma, un nuevo modelo básico que ejecuta las tareas de inteligencia artificial multimodal en formato digital y físico, ya que es capaz de visual y visual y puede ser procesado información visual y de idioma para planificar y llevar a cabo acciones de la navegación de la interfaz de usuario Antes de procesar robots. Cumplimiento de acciones para lograrlo incluso en entornos digitales como físico (VL). Esto se debe al hecho de que no solo la capacidad de comprender la visión y el lenguaje, sino también de estar equipado con la capacidad de planificar y actuar en el “espacio visual”, es decir, tiene inteligencia espacial para que Microsoft enfatice que lo Tiene las habilidades necesarias para realizar tareas que provienen de la navegación de la interfaz gráfica de usuario (IU) a la manipulación de robots.
, sin embargo, en estos registros de datos, los objetivos visuales efectivos, por ejemplo, los botones en los que puede hacer clic en IU, están marcados como un conjunto de marca (SOM). Del mismo modo, los movimientos de los objetos en el video, como. B. El curso de una mano robot, marcada como persecución (volumen). Tom en grandes datos educativos facilita la producción de “software” de inteligencia espacial para el procesamiento de robots. Wisconsin Madison y la Universidad de Washington.
Microsoft está representado por Magma, su nuevo modelo base multimodal, el ..

Cumplimiento de acciones para lograrlo incluso en entornos digitales como físico (VL).