MADRID, 21 de febrero. (Portal/EP) – Google ha lanzado dos nuevos modelos de inteligencia artificial (IA) de código abierto, Gemma 2B y 7B, diseñados para ayudar a los desarrolladores e investigadores a crear IA de manera responsable, utilizando la misma tecnología utilizada en su Gemini Multimodal AI. El gigante tecnológico compartió sus planes para hacer que la IA sea útil para todos, incluido hacer que los nuevos modelos de IA sean de código abierto, garantizando que cualquier desarrollador pueda acceder y probar esta tecnología.
En este sentido, Google ha presentado la nueva línea de modelos de IA de código abierto Gemma, que incluye dos modelos de diferentes tamaños, Gemma 2B y Gemma 7B, diseñados para ayudar a los desarrolladores a crear IA de forma responsable. Cada dimensión tiene variaciones previamente entrenadas y permite tanto la investigación como el desarrollo. Así lo detalla la compañía en un comunicado en su blog, en el que aclara que están desarrollados por Google DeepMind y otros grupos tecnológicos, inspirados en los grandes modelos de IA multimodal Gemini, ya que están construidos a partir de la misma investigación y tecnología.
, además de compartir componentes técnicos e infraestructura. De esta forma, según se explicó, los modelos Gemma 2B y 7B pueden lograr el mejor rendimiento en su categoría de tamaño, en comparación con otros modelos abiertos de la industria. En concreto, la compañía se ha asegurado de que su nueva línea de modelos supere significativamente a otros modelos más grandes en criterios clave.
Por lo tanto, los modelos Gemma se pueden utilizar a través de las herramientas de desarrollo Kaggle y Hugging Face. También están optimizados para Google Cloud, con la plataforma de aprendizaje automático de la compañía, Vertex AI, que proporciona un conjunto completo de herramientas MLOps que permiten una variedad de opciones de ajuste e implementación con un solo clic, utilizando optimización de inferencia integrada. Google incluso se asoció con Nvidia para hacer que Gemma sea compatible con las GPU de la empresa.
Además, Google aclaró que se trata de dos modelos capaces de ejecutarse directamente en computadoras portátiles o de escritorio, así como en dispositivos móviles y en la nube, para hacer posible un acceso generalizado a sus capacidades de IA. Asimismo, la compañía destaca que se trata de una familia de modelos diseñados para crear IA de forma responsable. En este contexto, garantiza el respeto de los estándares de Google para ofrecer resultados seguros y responsables.
Para garantizar esta seguridad, Google detalla que ha utilizado técnicas automatizadas en los modelos preentrenados de Gemma para filtrar cierta información personal y otros datos sensibles de la colección. También utilizan el aprendizaje reforzado a partir de la retroalimentación humana (RLHF) para entrenar modelos para un comportamiento empresarial responsable. Con todo esto, tras el entrenamiento, Gemma fue evaluada por equipos rojos manuales, es decir, personal especializado que realiza pruebas adversas automatizadas y evalúa la capacidad para realizar sus actividades peligrosas.
Además, los desarrolladores podrán acceder a un conjunto de herramientas de inteligencia artificial responsable. El conjunto de herramientas tiene características que permiten a los desarrolladores establecer barreras, como limitar el uso de ciertas palabras por parte de la IA. También incluyen otras herramientas que ayudan a los desarrolladores a analizar fácilmente el comportamiento del modelo para identificar problemas y solucionarlos más adelante.
Google ha aclarado que Gemma ya está disponible para todos los desarrolladores a nivel mundial. Además, los términos de uso de estas plantillas permiten el uso comercial y la distribución responsable por parte de todas las organizaciones, independientemente de su tamaño. Sin embargo, Tris Warkentin, directora de gestión de productos de Google DeepMind, dijo a The Verge que los modelos actualmente funcionan mejor para tareas en inglés, aunque esperan poder colaborar con la comunidad para responder preguntas y satisfacer las necesidades de los desarrolladores en más idiomas.