Microsoft abre el código de su agente de IA multimodal - Magma
A las 3 a.m. hora de Singapur, Microsoft liberó el modelo base del Agente de IA multimodal - Magma en su sitio web oficial. En comparación con los Agentes tradicionales, Magma tiene capacidades multimodales en los mundos digital y físico, siendo capaz de procesar automáticamente diferentes tipos de datos como imágenes, videos, textos, etc. Por ejemplo, puedes usar Magma para realizar pedidos de comercio electrónico automáticamente o verificar el clima; también puede operar robots físicos automáticamente o brindar asistencia al jugar partidas de ajedrez reales. Además, Magma también tiene funciones integradas de predicción psicológica que mejoran su comprensión de la dinámica espaciotemporal en futuros fotogramas de video y predicen con precisión las intenciones y comportamientos futuros de personajes u objetos en videos.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
En tendencia
MásPrecios de las criptos
Más








