Tecnologia

Google mejora un 38% la detección de spam en Gmail

caruri 511.png
caruri 511.png
Madrid, 4 Dic (Portaltic/EP) -. Google ha anunciado una mejora del 38% en la detección de spam en Gmail con la introducción de una herramienta vectorizadora de texto multilingüe llamada RETVec. .

Madrid, 4 Dic (Portaltic/EP) -.

Google ha anunciado una mejora del 38% en la detección de spam en Gmail con la introducción de una herramienta vectorizadora de texto multilingüe llamada RETVec.

Según la compañía, sistemas como Gmail, YouTube y Google Play se basan en un modelo de clasificación de texto para identificar contenido perjudicial para los usuarios, como ataques de phishing, comentarios dañinos y estafas.

Estos tipos de texto son más difíciles de clasificar mediante modelos de aprendizaje automático. Esto se debe a que los actores maliciosos pueden manipular el contenido para evitar estas herramientas mediante el uso de homónimos, caracteres invisibles, etc.

Para mejorar las condiciones de la clasificación de textos y hacerla más robusta y eficaz, la empresa desarrolló RETVec, un vectorizador de textos multilingües robusto y eficaz.

RETVec redujo significativamente los costes computacionales y mejoró el clasificador de spam del servicio de correo electrónico de Google, mejorando la detección de spam de Gmail en un 38%.

Además, Google reconoce que el uso de RETVec redujo la tasa de falsos positivos en un 19,4% y, según comparte en un post de su blog, también señala que el uso de RETVec redujo el uso de TPU del modelo en un 83%.

Para Google, estos datos convierten la implementación de RETVec en una de las mayores mejoras de defensa de los últimos años, ya que combina un codificador de caracteres novedoso y muy compacto, un régimen de aprendizaje basado en aumentos y el uso del aprendizaje métrico para lograr estas mejoras.

Al estar construido sobre una arquitectura novedosa, no requiere preprocesamiento de texto y funciona de forma inmediata con todos los idiomas y caracteres UTF-8, lo que lo convierte en un candidato ideal para implementaciones de clasificación de texto en dispositivos, web y a gran escala.

Google también señala que los modelos entrenados con la herramienta son más rápidos de razonar, ya que requieren una representación compacta. Además, pueden convertirse a TFLite para dispositivos móviles.

TRA Digital

GRATIS
VER