Google Revela ScreenAI, Innovación en Modelos de Visión y Lenguaje

By Staff

Published: 21 abril, 2024

Google Research ha anunciado el lanzamiento de ScreenAI, un modelo de visión y lenguaje diseñado para comprender y procesar interfaces de usuario (UI) e infografías con una eficacia sin precedentes. Este modelo representa un avance significativo en la comprensión del lenguaje visual situado y promete establecer nuevos estándares en la interacción humano-máquina.

- Advertisement -

Desarrollado por los ingenieros de software Srinivas Sunkara y Gilles Baechler, ScreenAI mejora la arquitectura PaLI con una estrategia de parcheo flexible derivada de pix2struct. Entrenado con una mezcla única de conjuntos de datos y tareas, incluida una novedosa tarea de anotación de pantalla, ScreenAI ha logrado resultados de vanguardia en tareas basadas en UI e infografías, superando a modelos de tamaño similar.

El modelo no solo entiende y razona sobre las interfaces gráficas, sino que también interactúa con ellas, lo que facilita experiencias de usuario ricas e interactivas. Además, Google Research ha liberado tres nuevos conjuntos de datos: Anotación de Pantalla para evaluar la capacidad de comprensión de la disposición del modelo, así como ScreenQA Corto y ScreenQA Complejo para una evaluación más exhaustiva de su capacidad de respuesta a preguntas.

Con solo 5 mil millones de parámetros, ScreenAI establece un nuevo punto de referencia en el rendimiento en tareas relacionadas con UI e infografías, y muestra un rendimiento líder en su clase en Chart QA, DocVQA e InfographicVQA.

Este lanzamiento es un testimonio del compromiso continuo de Google con la innovación y la mejora de la experiencia del usuario a través de la tecnología de punta.

TAGGED:Google Tecnologías

Share This Article

“Por aquí andamos, aquí leemos”: memorable reunión de poetas guanajuatenses (Crónica)

Conectividad para el Desarrollo: La Iniciativa de Samantha Smith y Starlink

No hay comentarios

Google Revela ScreenAI, Innovación en Modelos de Visión y Lenguaje

Deja un comentarioCancelar respuesta

Categories

Nosotros

Subscribe US

Mira esto

You Might Also Like

Deja un comentarioCancelar respuesta

Etiquetas

Mira esto

Donald Trump se alista para su regreso a la Casa Blanca con un segundo mandato

Honda y Nissan exploran una posible fusión para fortalecer su posición en el mercado global

Donald Trump: Figura del Año 2024 según la Revista Time

Google lanza el chip cuántico más potente de la historia: Willow

Categories

Nosotros

Subscribe US