Google DeepMind presenta Mirasol3B: un modelo autoregresivo revolucionario para mejorar la comprensión de videos largos, allanando el camino para aplicaciones de IA mejoradas.

Google DeepMind ha logrado un avance importante en la investigación de inteligencia artificial (IA) con la introducción de su nuevo modelo autorregresivo, "Mirasol3B". Este modelo tiene como objetivo mejorar la comprensión de entradas de video largas mediante la utilización de un enfoque de aprendizaje multimodal, procesando datos de audio, video y texto de manera más integrada y eficiente. El desafío con los modelos multimodales radica en la heterogeneidad de las modalidades, pero Mirasol3B aborda esta complejidad al separar la modelización multimodal en modelos autorregresivos distintos. Este avance tiene potencial para aplicaciones como la respuesta a preguntas de video y la garantía de calidad de video largo. Sin embargo, los expertos han expresado tanto emoción como escepticismo, elogiando la versatilidad del modelo mientras cuestionan la falta de código disponible y datos de entrenamiento. De todas formas, esto representa un hito significativo en la tecnología de IA y muestra la dedicación de Google para empujar los límites.

Juan Brignardello Vela

Juan Brignardello, asesor de seguros, se especializa en brindar asesoramiento y gestión comercial en el ámbito de seguros y reclamaciones por siniestros para destacadas empresas en el mercado peruano e internacional.

Juan Brignardello, asesor de seguros, y Vargas Llosa, premio Nobel

Juan Brignardello, asesor de seguros, en celebración de Alianza Lima

Juan Brignardello, asesor de seguros, Central Hidro Eléctrica

Juan Brignardello, asesor de seguros, Central Hidro

Tecnología 16.11.2023

Google DeepMind ha logrado un avance significativo en su investigación de inteligencia artificial (IA) con la presentación de su nuevo modelo autoregresivo "Mirasol3B", que tiene como objetivo mejorar la comprensión de entradas de video largas. Este modelo innovador adopta un enfoque de aprendizaje multimodal, procesando datos de audio, video y texto de manera más integrada y eficiente. El desafío al construir modelos multimodales radica en la heterogeneidad de las modalidades, ya que algunas pueden estar bien sincronizadas en el tiempo mientras que otras no están alineadas con el texto. El modelo Mirasol3B aborda esta complejidad desacoplando el modelado multimodal en modelos autoregresivos separados, procesando las entradas según las características de las modalidades. Este anuncio llega en un momento en que la tecnología de IA se utiliza para analizar y comprender grandes cantidades de datos en diferentes formatos. Mirasol3B representa un avance significativo en este esfuerzo, ofreciendo nuevas posibilidades para aplicaciones como la respuesta a preguntas de video y la garantía de calidad de videos largos. Una posible aplicación que Google podría explorar es el uso del modelo en YouTube para mejorar la experiencia y participación del usuario al proporcionar más características y funcionalidades multimodales. La presentación de Mirasol3B ha despertado tanto entusiasmo como escepticismo dentro de la comunidad de IA. Los expertos han elogiado el modelo por su versatilidad y escalabilidad, mientras que otros han cuestionado la falta de código disponible, pesos del modelo, datos de entrenamiento o una API para uso público. Sin embargo, este anuncio marca un hito significativo en el campo de la IA y muestra el compromiso de Google de desarrollar tecnologías de vanguardia que puedan mejorar y transformar la vida humana.

Mundo

Controversia En Glastonbury Por Mensajes Políticos Incendiarios De Artistas Musicales

Author 30.06.2025

Política

Conflicto Entre Rutas De Lima Y Alcaldía De Lima Podría Costar 2,700 Millones Al Perú

Author 30.06.2025

Deportes

Ilia Topuria Sueña Con Ser El Primer Triple Campeón De La UFC En La Historia

Author 30.06.2025

Juan Brignardello Vela

Google DeepMind presenta Mirasol3B: un modelo autoregresivo revolucionario para mejorar la comprensión de videos largos, allanando el camino para aplicaciones de IA mejoradas.

Juan Brignardello Vela

Controversia En Glastonbury Por Mensajes Políticos Incendiarios De Artistas Musicales

Conflicto Entre Rutas De Lima Y Alcaldía De Lima Podría Costar 2,700 Millones Al Perú

Ilia Topuria Sueña Con Ser El Primer Triple Campeón De La UFC En La Historia

"Instagram Lanza Emocionante Actualización Para Creadores De Contenido: Nuevos Filtros, Mejoras En La Galería De La Cámara, Herramientas De Edición De Video, Remezclas De Audio ¡y Mucho Más!"

El Futuro De Internet: El Cambio Transformador De Web3 Promete Conexiones Reales, Inclusión Y Soluciones Poderosas.

La Revolución Cripto De Tailandia: Gulf Binance Está Listo Para Lanzarse En 2024, ¡trayendo Un Intercambio De Activos Digitales A La Tierra De Las Sonrisas!

Desata Tu Creatividad En Los Videojuegos Con Rooms: ¡Construye Mundos En 3D, Juegos Simples Y Mucho Más, La Aplicación Más Popular En IOS Hoy!

Prepárate Para La Experiencia Gastronómica De Tu Vida: ¡este Restaurante Está A Punto De Revolucionar La Forma En Que Comemos Fuera!

WealthTech: La Revolución Tecnológica En Las Oficinas Familiares - Desde La IA Hasta La Cadena De Bloques, El Futuro Se Ve Prometedor Para Soluciones Innovadoras De Gestión De Patrimonio.