Gata lança o maior conjunto de dados de conversas reais de usuários do ChatGPT no mundo: ChatGPT-RealUser-2.2M
ChainCatcher reporta que a empresa de infraestrutura de IA descentralizada Gata anunciou o lançamento do conjunto de dados global em larga escala de conversas reais de usuários do ChatGPT, chamado ChatGPT-RealUser-2.2M. Este conjunto de dados foi coletado por meio do programa GPT-to-Earn da Gata (com participação voluntária dos usuários), reunindo, entre 2024 e 2025, mais de 2,24 milhões de conversas reais e quase 3,56 milhões de pares de perguntas e respostas, provenientes de mais de 15 mil usuários reais, abrangendo interações com GPT-3.5, GPT-4 e o1.
Segundo informações, este conjunto de dados tem aproximadamente o dobro do tamanho de conjuntos de dados similares anteriores do Allen Institute for AI, cobre cenários reais, múltiplas rodadas de diálogo e, devido ao mecanismo de incentivo on-chain, inclui uma grande quantidade de interações relacionadas a criptoativos. Uma versão de prévia já está disponível no Hugging Face, contendo 600 amostras de conversas, e o conjunto de dados completo pode ser utilizado para pesquisa e aplicações comerciais.
Consta que, em maio de 2025, a Gata anunciou a conclusão de uma rodada seed de financiamento no valor total de 4 milhões de dólares, com participação de YZi Labs, IDG Blockchain e outros investidores.
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
Talvez também goste
O depósito da USD.AI atingiu o limite inicial de 100 milhões de dólares
Populares
MaisPreços de criptomoedas
Mais








