
Grass Network utilizza la larghezza di banda Internet inutilizzata per diventare un data miner e, insieme all'intelligenza collettiva di Reddit, ha creato uno dei più grandi set di dati open source generati dalla tecnologia blockchain di Solana.
Con un traguardo significativo, Grass Network, l'innovativo livello dati AI basato su Solana, ha rilasciato come software gratuito un enorme set di dati chiamato UpvoteWeb-24-600. Questo set di dati contiene 600 milioni di post e commenti principali di Reddit dell'anno 2024, segnando un passo rivoluzionario verso la democratizzazione della formazione sull'intelligenza artificiale e sottolineando il potenziale della tecnologia blockchain per guidare l'innovazione in questo campo.
Grass Network, un ponte tra Solana e l'intelligenza artificiale
Rete in erba si è posizionato come un progetto pionieristico all’intersezione tra intelligenza artificiale e tecnologia blockchain. Il progetto è stato creato da Andrej Radonjic, insieme a cinque dipendenti con esperienza in ingegneria del software e protocolli DeFi.
Per raggiungere il suo obiettivo, Grass Network ha creato un'intera rete decentralizzata che opera su Solana. Questa rete consente alle persone che la compongono di vendere la larghezza di banda Internet che non utilizzano.. Cioè, una persona installa un nodo Grass e automaticamente questo nodo può utilizzare parte della sua larghezza di banda su Internet, per cercare informazioni e classificarle per alimentare i set di dati Grass e le operazioni sui dati. In nessun momento vengono tracciati i dati dell'utente o i suoi dati di navigazione, solo il tuo computer viene utilizzato come data miner su Internet.
Ciò rende molto chiaro il suo obiettivo principale: raccogliere dati web pubblici per trasformarli in set di dati AI che gli sviluppatori possono utilizzare. L'intera attività di classificazione dei dati è gestita da Socrates, uno strumento creato da Wynd Labs, che viene utilizzato per estrarre dati non strutturati e convertirli in un formato leggibile. Socrates non solo è in grado di estrarre le informazioni, ma anche di renderle anonime utilizzando un processo di crittografia a conoscenza zero (ZKP), che cerca di proteggere l'identità dei generatori di questi dati pubblici.
Pertanto, la visione di Grass Network è quella di democratizzare l'accesso a dati di alta qualità per la formazione sull'intelligenza artificiale, livellando il campo di gioco per gli sviluppatori indipendenti e le piccole imprese che competono con i giganti della tecnologia. E i risultati in questo senso sono stati sorprendenti, dal momento che Grass Network è attualmente in grado di elaborare più di 1 TB di dati al giorno, il che ci dà un'idea dell'enorme potenziale di questa tecnologia.
UpvoteWeb-24-600, un risultato senza precedenti
La creazione di UpvoteWeb-24-600 rappresenta un risultato tecnico e logistico impressionante. In una sola settimana, Grass Network ha mobilitato una rete globale di 2 milioni di nodi per raccogliere ed elaborare questa enorme quantità di dati.
L'insieme comprende non solo il testo dei post e dei commenti, ma anche i collegamenti ai media e la struttura delle conversazioni (lignaggio delle risposte). Inoltre, tutti i dati sono stati meticolosamente resi anonimi per proteggere la privacy degli utenti.
L’importanza di questo set di dati risiede nel suo volume, diversità, tempestività e accessibilità, fornendo una risorsa inestimabile per ricercatori, sviluppatori e appassionati di intelligenza artificiale di tutto il mondo. Gli sviluppatori di Grass Network hanno reso pubblici i risultati del set di dati nel più grande repository AI del mondo, abbracciare il viso e lo hanno rilasciato su licenza ODC v1.0.
Per un'IA più aperta
Grazie a questo trattamento, il set di dati UpvoteWeb-24-600 è una risorsa preziosa per gli sviluppatori che desiderano addestrare modelli di intelligenza artificiale su dati del mondo reale. Questo set di dati contiene una vasta gamma di argomenti, dalla cultura e intrattenimento alla politica e alla scienza, consentendo agli sviluppatori di creare modelli di intelligenza artificiale in grado di comprendere e rispondere a una varietà di domande.
Inoltre, il set di dati include informazioni sulla popolarità di post e commenti, che possono essere utili per addestrare i modelli di intelligenza artificiale a prevedere la pertinenza e il coinvolgimento, il tutto senza mettere a rischio le informazioni dei loro creatori.
D’altra parte, il rilascio di UpvoteWeb-24-600 come software open source è un passo importante verso un’intelligenza artificiale più aperta e accessibile. Storicamente, i set di dati di formazione sull’intelligenza artificiale sono stati di proprietà di grandi aziende tecnologiche, creando una barriera all’ingresso per i singoli sviluppatori e le piccole imprese. Attraverso UpvoteWeb-24-600 open source, Grass Network sta democratizzando l'accesso ai dati di formazione sull'intelligenza artificiale e consentendo a una comunità più ampia di sviluppatori di contribuire all'ecosistema IA decentralizzato.
In definitiva, il successo di Grass Network e di progetti simili potrebbe catalizzare una trasformazione fondamentale nel modo in cui l’intelligenza artificiale viene sviluppata, addestrata e distribuita, avvicinandoci a un futuro in cui l’intelligenza artificiale avanzata sarà alla portata di tutti, alimentata dal potere della tecnologia blockchain e globale collaborazione.