Grass Network e Reddit impulsionam IA em Solana

Grass Network usa sua largura de banda de Internet não utilizada para se tornar um minerador de dados e, junto com a inteligência coletiva do Reddit, eles criaram um dos maiores conjuntos de dados de código aberto gerados pela tecnologia blockchain Solana.

Grass Network usa sua largura de banda de Internet não utilizada para se tornar um minerador de dados e, junto com a inteligência coletiva do Reddit, eles criaram um dos maiores conjuntos de dados de código aberto gerados pela tecnologia blockchain Solana.

Em um marco significativo, Grass Network, a inovadora camada de dados de IA construída em Solana, lançou como software livre um enorme conjunto de dados chamado UpvoteWeb-24-600. Este conjunto de dados contém 600 milhões de postagens e comentários principais do Reddit do ano de 2024, marcando um passo revolucionário em direção à democratização do treinamento em IA e ressaltando o potencial da tecnologia blockchain para impulsionar a inovação neste campo.

Grass Network, uma ponte entre Solana e AI

Rede de grama posicionou-se como um projeto pioneiro na intersecção da inteligência artificial e da tecnologia blockchain. O projeto foi idealizado por Andrej Radonjic, junto com cinco funcionários com formação em Engenharia de Software e protocolos DeFi.

Para atingir seu objetivo, a Grass Network criou toda uma rede descentralizada que opera em Solana. Esta rede permite que as pessoas que a compõem vendam a largura de banda da Internet que não estão utilizando.. Ou seja, uma pessoa instala um nó Grass e automaticamente, esse nó pode utilizar parte de sua largura de banda na Internet, a fim de buscar informações e classificá-las para alimentar conjuntos de dados e operações de dados Grass. Em nenhum momento os dados do usuário ou seus dados de navegação são rastreados, apenas o seu computador é utilizado como minerador de dados da Internet.

Grass Network oferece um painel simples para permitir que você veja como sua Internet é usada no processo de mineração de dados
Grass Network oferece um painel simples para permitir que você veja como sua Internet é usada no processo de mineração de dados

Isso deixa muito claro seu objetivo principal: coletando dados públicos da web para transformá-los em conjuntos de dados de IA que os desenvolvedores podem usar. Toda essa tarefa de classificação de dados é feita pelo Socrates, ferramenta criada pela Wynd Labs, que serve para extrair dados não estruturados e convertê-los em um formato legível. Sócrates não só é capaz de extrair as informações, mas também de anonimizá-las por meio de um processo de criptografia de conhecimento zero (ZKP), que busca proteger a identidade dos geradores desses dados públicos.

Assim, a visão da Grass Network é democratizar o acesso a dados de alta qualidade para treinamento em IA, nivelando o campo de atuação para desenvolvedores independentes e pequenas empresas que competem com gigantes da tecnologia. E os resultados nesse sentido têm sido surpreendentes, já que a Grass Network é atualmente capaz de processar mais de 1 TB de dados diariamente, o que nos dá uma ideia do enorme potencial desta tecnologia.

UpvoteWeb-24-600, uma conquista sem precedentes

A criação do UpvoteWeb-24-600 representa uma conquista técnica e logística impressionante. Em apenas uma semana, a Grass Network mobilizou uma rede global de 2 milhões de nós para recolher e processar esta enorme quantidade de dados.

O conjunto inclui não apenas o texto das postagens e comentários, mas também links para mídias e a estrutura das conversas (linhagem das respostas). Além disso, todos os dados foram meticulosamente anonimizados para proteger a privacidade do usuário.

A importância deste conjunto de dados reside no seu volume, diversidade, atualidade e acessibilidade, proporcionando um recurso inestimável para investigadores, desenvolvedores e entusiastas de IA em todo o mundo. Os desenvolvedores da Grass Network tornaram públicos os resultados do conjunto de dados no maior repositório de IA do mundo, Abraçando o Rosto e eles o libertaram sob licença ODC v1.0.

Grass Network lançou seu conjunto de dados de IA no conhecido espaço HuggingFace
Grass Network lançou seu conjunto de dados de IA no conhecido espaço HuggingFace

Por uma IA mais aberta

Graças a este tratamento, o conjunto de dados UpvoteWeb-24-600 é um recurso valioso para desenvolvedores que buscam treinar modelos de IA em dados do mundo real. Este conjunto de dados contém uma ampla gama de tópicos, desde cultura e entretenimento até política e ciência, permitindo aos desenvolvedores criar modelos de IA que podem compreender e responder a uma variedade de consultas.

Além disso, o conjunto de dados inclui informações sobre a popularidade de postagens e comentários, o que pode ser útil para treinar modelos de IA para prever relevância e engajamento, tudo isso sem colocar em risco as informações de seus criadores.

Por outro lado, o lançamento do UpvoteWeb-24-600 como software de código aberto é um passo importante em direção a uma IA mais aberta e acessível. Historicamente, os conjuntos de dados de treinamento de IA pertencem a grandes empresas de tecnologia, criando uma barreira de entrada para desenvolvedores individuais e pequenas empresas. Através do UpvoteWeb-24-600 de código aberto, a Grass Network está democratizando o acesso aos dados de treinamento de IA e permitindo que uma comunidade mais ampla de desenvolvedores contribua para o ecossistema descentralizado de IA.

Em última análise, o sucesso da Grass Network e de projetos semelhantes poderá catalisar uma transformação fundamental na forma como a IA é desenvolvida, treinada e implementada, aproximando-nos de um futuro onde a inteligência artificial avançada esteja ao alcance de todos, alimentada pelo poder da tecnologia blockchain e global. colaboração.