
Grass Network usa sua largura de banda de Internet não utilizada para se tornar um minerador de dados e, junto com a inteligência coletiva do Reddit, eles criaram um dos maiores conjuntos de dados de código aberto gerados pela tecnologia blockchain Solana.
Em um marco significativo, Grass Network, a inovadora camada de dados de IA construída em Solana, lançou como software livre um enorme conjunto de dados chamado UpvoteWeb-24-600. Este conjunto de dados contém 600 milhões de postagens e comentários principais do Reddit do ano de 2024, marcando um passo revolucionário em direção à democratização do treinamento em IA e ressaltando o potencial da tecnologia blockchain para impulsionar a inovação neste campo.
Grass Network, uma ponte entre Solana e AI
Rede de grama posicionou-se como um projeto pioneiro na intersecção da inteligência artificial e da tecnologia blockchain. O projeto foi idealizado por Andrej Radonjic, junto com cinco funcionários com formação em Engenharia de Software e protocolos DeFi.
Para atingir seu objetivo, a Grass Network criou toda uma rede descentralizada que opera em Solana. Esta rede permite que as pessoas que a compõem vendam a largura de banda da Internet que não estão utilizando.. Ou seja, uma pessoa instala um nó Grass e automaticamente, esse nó pode utilizar parte de sua largura de banda na Internet, a fim de buscar informações e classificá-las para alimentar conjuntos de dados e operações de dados Grass. Em nenhum momento os dados do usuário ou seus dados de navegação são rastreados, apenas o seu computador é utilizado como minerador de dados da Internet.
Isso deixa muito claro seu objetivo principal: coletando dados públicos da web para transformá-los em conjuntos de dados de IA que os desenvolvedores podem usar. Toda essa tarefa de classificação de dados é feita pelo Socrates, ferramenta criada pela Wynd Labs, que serve para extrair dados não estruturados e convertê-los em um formato legível. Sócrates não só é capaz de extrair as informações, mas também de anonimizá-las por meio de um processo de criptografia de conhecimento zero (ZKP), que busca proteger a identidade dos geradores desses dados públicos.
Assim, a visão da Grass Network é democratizar o acesso a dados de alta qualidade para treinamento em IA, nivelando o campo de atuação para desenvolvedores independentes e pequenas empresas que competem com gigantes da tecnologia. E os resultados nesse sentido têm sido surpreendentes, já que a Grass Network é atualmente capaz de processar mais de 1 TB de dados diariamente, o que nos dá uma ideia do enorme potencial desta tecnologia.
UpvoteWeb-24-600, uma conquista sem precedentes
A criação do UpvoteWeb-24-600 representa uma conquista técnica e logística impressionante. Em apenas uma semana, a Grass Network mobilizou uma rede global de 2 milhões de nós para recolher e processar esta enorme quantidade de dados.
O conjunto inclui não apenas o texto das postagens e comentários, mas também links para mídias e a estrutura das conversas (linhagem das respostas). Além disso, todos os dados foram meticulosamente anonimizados para proteger a privacidade do usuário.
A importância deste conjunto de dados reside no seu volume, diversidade, atualidade e acessibilidade, proporcionando um recurso inestimável para investigadores, desenvolvedores e entusiastas de IA em todo o mundo. Os desenvolvedores da Grass Network tornaram públicos os resultados do conjunto de dados no maior repositório de IA do mundo, Abraçando o Rosto e eles o libertaram sob licença ODC v1.0.
Por uma IA mais aberta
Graças a este tratamento, o conjunto de dados UpvoteWeb-24-600 é um recurso valioso para desenvolvedores que buscam treinar modelos de IA em dados do mundo real. Este conjunto de dados contém uma ampla gama de tópicos, desde cultura e entretenimento até política e ciência, permitindo aos desenvolvedores criar modelos de IA que podem compreender e responder a uma variedade de consultas.
Além disso, o conjunto de dados inclui informações sobre a popularidade de postagens e comentários, o que pode ser útil para treinar modelos de IA para prever relevância e engajamento, tudo isso sem colocar em risco as informações de seus criadores.
Por outro lado, o lançamento do UpvoteWeb-24-600 como software de código aberto é um passo importante em direção a uma IA mais aberta e acessível. Historicamente, os conjuntos de dados de treinamento de IA pertencem a grandes empresas de tecnologia, criando uma barreira de entrada para desenvolvedores individuais e pequenas empresas. Através do UpvoteWeb-24-600 de código aberto, a Grass Network está democratizando o acesso aos dados de treinamento de IA e permitindo que uma comunidade mais ampla de desenvolvedores contribua para o ecossistema descentralizado de IA.
Em última análise, o sucesso da Grass Network e de projetos semelhantes poderá catalisar uma transformação fundamental na forma como a IA é desenvolvida, treinada e implementada, aproximando-nos de um futuro onde a inteligência artificial avançada esteja ao alcance de todos, alimentada pelo poder da tecnologia blockchain e global. colaboração.