Gata lanza el conjunto de datos global de conversaciones reales de usuarios de ChatGPT, ChatGPT-RealUser-2.2M
Según ChainCatcher, la empresa de infraestructura de IA descentralizada Gata ha anunciado el lanzamiento del conjunto de datos global de conversaciones reales de usuarios de ChatGPT, denominado ChatGPT-RealUser-2.2M. Este conjunto de datos fue recopilado a través del programa GPT-to-Earn de Gata (con participación voluntaria de los usuarios) y, entre 2024 y 2025, ha reunido más de 2.24 millones de conversaciones reales y cerca de 3.56 millones de pares de preguntas y respuestas, provenientes de más de 15,000 usuarios reales, abarcando interacciones con GPT-3.5, GPT-4 y o1.
Según la presentación, este conjunto de datos es aproximadamente el doble del tamaño de conjuntos de datos similares previos del Allen Institute for AI, cubre escenarios reales y conversaciones de múltiples turnos, y debido a su mecanismo de incentivos on-chain, incluye una gran cantidad de interacciones relacionadas con criptomonedas. Una versión preliminar ya está disponible en Hugging Face, incluyendo 600 muestras de conversaciones, y el conjunto de datos completo puede ser utilizado para investigación y aplicaciones comerciales.
Se informa que en mayo de 2025, Gata anunció la finalización de una ronda de financiación semilla de 4 millones de dólares, en la que participaron YZi Labs, IDG Blockchain, entre otros.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
En tendencia
MásPrecios de las criptos
Más








