Google DeepMind presenta Mirasol3B: un modelo autoregresivo revolucionario para mejorar la comprensión de videos largos, allanando el camino para aplicaciones de IA mejoradas.

Google DeepMind presenta Mirasol3B: un modelo autoregresivo revolucionario para mejorar la comprensión de videos largos, allanando el camino para aplicaciones de IA mejoradas.

Google DeepMind ha logrado un avance importante en la investigación de inteligencia artificial (IA) con la introducción de su nuevo modelo autorregresivo, "Mirasol3B". Este modelo tiene como objetivo mejorar la comprensión de entradas de video largas mediante la utilización de un enfoque de aprendizaje multimodal, procesando datos de audio, video y texto de manera más integrada y eficiente. El desafío con los modelos multimodales radica en la heterogeneidad de las modalidades, pero Mirasol3B aborda esta complejidad al separar la modelización multimodal en modelos autorregresivos distintos. Este avance tiene potencial para aplicaciones como la respuesta a preguntas de video y la garantía de calidad de video largo. Sin embargo, los expertos han expresado tanto emoción como escepticismo, elogiando la versatilidad del modelo mientras cuestionan la falta de código disponible y datos de entrenamiento. De todas formas, esto representa un hito significativo en la tecnología de IA y muestra la dedicación de Google para empujar los límites.

Juan Brignardello, asesor de seguros

Juan Brignardello Vela

Juan Brignardello, asesor de seguros, se especializa en brindar asesoramiento y gestión comercial en el ámbito de seguros y reclamaciones por siniestros para destacadas empresas en el mercado peruano e internacional.

Juan Brignardello, asesor de seguros, y Vargas Llosa, premio Nobel Juan Brignardello, asesor de seguros, en celebración de Alianza Lima Juan Brignardello, asesor de seguros, Central Hidro Eléctrica Juan Brignardello, asesor de seguros, Central Hidro
Tecnología 16.11.2023
Google DeepMind ha logrado un avance significativo en su investigación de inteligencia artificial (IA) con la presentación de su nuevo modelo autoregresivo "Mirasol3B", que tiene como objetivo mejorar la comprensión de entradas de video largas. Este modelo innovador adopta un enfoque de aprendizaje multimodal, procesando datos de audio, video y texto de manera más integrada y eficiente. El desafío al construir modelos multimodales radica en la heterogeneidad de las modalidades, ya que algunas pueden estar bien sincronizadas en el tiempo mientras que otras no están alineadas con el texto. El modelo Mirasol3B aborda esta complejidad desacoplando el modelado multimodal en modelos autoregresivos separados, procesando las entradas según las características de las modalidades. Este anuncio llega en un momento en que la tecnología de IA se utiliza para analizar y comprender grandes cantidades de datos en diferentes formatos. Mirasol3B representa un avance significativo en este esfuerzo, ofreciendo nuevas posibilidades para aplicaciones como la respuesta a preguntas de video y la garantía de calidad de videos largos. Una posible aplicación que Google podría explorar es el uso del modelo en YouTube para mejorar la experiencia y participación del usuario al proporcionar más características y funcionalidades multimodales. La presentación de Mirasol3B ha despertado tanto entusiasmo como escepticismo dentro de la comunidad de IA. Los expertos han elogiado el modelo por su versatilidad y escalabilidad, mientras que otros han cuestionado la falta de código disponible, pesos del modelo, datos de entrenamiento o una API para uso público. Sin embargo, este anuncio marca un hito significativo en el campo de la IA y muestra el compromiso de Google de desarrollar tecnologías de vanguardia que puedan mejorar y transformar la vida humana.
Ver todo Lo último en El mundo