Grass Network et Reddit poussent l'IA sur Solana

Grass Network utilise votre bande passante Internet inutilisée pour devenir un mineur de données et, avec l'intelligence collective de Reddit, ils ont créé l'un des plus grands ensembles de données open source générés par la technologie blockchain Solana.

Grass Network utilise votre bande passante Internet inutilisée pour devenir un mineur de données et, avec l'intelligence collective de Reddit, ils ont créé l'un des plus grands ensembles de données open source générés par la technologie blockchain Solana.

Dans le cadre d'une étape importante, Grass Network, la couche de données d'IA innovante construite sur Solana, a publié sous forme de logiciel libre un ensemble de données massif appelé UpvoteWeb-24-600. Cet ensemble de données contient 600 millions de publications et de commentaires sur Reddit de l'année 2024, marquant une étape révolutionnaire vers la démocratisation de la formation en IA et soulignant le potentiel de la technologie blockchain pour stimuler l'innovation dans ce domaine.

Grass Network, un pont entre Solana et l'IA

Réseau d'herbe se positionne comme un projet pionnier à l’intersection de l’intelligence artificielle et de la technologie blockchain. Le projet a été créé par Andrej Radonjic, avec cinq employés ayant une formation en génie logiciel et en protocoles DeFi.

Pour atteindre son objectif, Grass Network a créé tout un réseau décentralisé qui fonctionne sur Solana. Ce réseau permet aux personnes qui le composent de vendre la bande passante Internet qu'ils n'utilisent pas.. Autrement dit, une personne installe un nœud Grass et automatiquement, ce nœud peut utiliser une partie de sa bande passante sur Internet, afin de rechercher des informations et de les classer pour alimenter les ensembles de données Grass et les opérations de données. A aucun moment les données de l'utilisateur ou ses données de navigation ne sont tracées, seul votre ordinateur est utilisé comme mineur de données Internet.

Grass Network propose un tableau de bord simple pour vous permettre de voir comment votre Internet est utilisé dans le processus d'exploration de données
Grass Network propose un tableau de bord simple pour vous permettre de voir comment votre Internet est utilisé dans le processus d'exploration de données

Cela rend son objectif principal très clair : collecter des données Web publiques pour les transformer en ensembles de données d'IA que les développeurs peuvent utiliser. Toute cette tâche de classification des données est gérée par Socrates, un outil créé par Wynd Labs, qui est utilisé pour extraire des données non structurées et les convertir dans un format lisible. Socrates est non seulement capable d'extraire les informations, mais aussi de les anonymiser grâce à un processus de cryptographie à connaissance nulle (ZKP), qui vise à protéger l'identité des générateurs de ces données publiques.

Ainsi, la vision de Grass Network est de démocratiser l'accès à des données de haute qualité pour la formation en IA, en uniformisant les règles du jeu pour les développeurs indépendants et les petites entreprises qui rivalisent avec les géants de la technologie. Et les résultats en ce sens ont été surprenants, puisque Grass Network est actuellement capable de traiter plus de 1 To de données par jour, ce qui nous donne une idée de l'énorme potentiel de cette technologie.

UpvoteWeb-24-600, une réussite sans précédent

La création d'UpvoteWeb-24-600 représente une réussite technique et logistique impressionnante. En seulement une semaine, Grass Network a mobilisé un réseau mondial de 2 millions de nœuds pour collecter et traiter cette quantité massive de données.

L'ensemble comprend non seulement le texte des publications et des commentaires, mais également des liens vers les médias et la structure des conversations (lignée des réponses). De plus, toutes les données ont été méticuleusement anonymisées pour protéger la confidentialité des utilisateurs.

L’importance de cet ensemble de données réside dans son volume, sa diversité, son actualité et son accessibilité, constituant une ressource inestimable pour les chercheurs, les développeurs et les passionnés d’IA du monde entier. Les développeurs de Grass Network ont ​​rendu publics les résultats de l'ensemble de données dans le plus grand référentiel d'IA au monde, Étreindre et ils l'ont libéré sous licence ODC v1.0.

Grass Network a publié son ensemble de données d'IA dans le célèbre espace HuggingFace
Grass Network a publié son ensemble de données d'IA dans le célèbre espace HuggingFace

Pour une IA plus ouverte

Grâce à ce traitement, l'ensemble de données UpvoteWeb-24-600 est une ressource précieuse pour les développeurs cherchant à former des modèles d'IA sur des données du monde réel. Cet ensemble de données contient un large éventail de sujets, allant de la culture et du divertissement à la politique et à la science, permettant aux développeurs de créer des modèles d'IA capables de comprendre et de répondre à une variété de requêtes.

De plus, l'ensemble de données comprend des informations sur la popularité des publications et des commentaires, qui peuvent être utiles pour entraîner les modèles d'IA afin de prédire la pertinence et l'engagement, le tout sans mettre en danger les informations de leurs créateurs.

D’un autre côté, la sortie d’UpvoteWeb-24-600 en tant que logiciel open source constitue une étape importante vers une IA plus ouverte et accessible. Historiquement, les ensembles de données de formation à l’IA appartenaient à de grandes entreprises technologiques, créant ainsi une barrière à l’entrée pour les développeurs individuels et les petites entreprises. Grâce à l'open source UpvoteWeb-24-600, Grass Network démocratise l'accès aux données de formation en IA et permet à une communauté plus large de développeurs de contribuer à l'écosystème décentralisé de l'IA.

En fin de compte, le succès de Grass Network et de projets similaires pourrait catalyser une transformation fondamentale dans la manière dont l'IA est développée, formée et déployée, nous rapprochant ainsi d'un avenir où l'intelligence artificielle avancée est à la portée de tous, alimentée par la puissance de la technologie blockchain et mondiale. collaboration.