DataFi : la nouvelle opportunité à l'ère de l'IA, comment Web3 mène la course des données

Potentiel de développement de DataFi vu à travers la piste de données AI

Le monde d'aujourd'hui est à l'ère de la concurrence mondiale pour construire les meilleurs modèles de base. Bien que la puissance de calcul et l'architecture des modèles soient importantes, la véritable barrière est constituée par les données d'entraînement. Cet article commencera par Scale AI et explorera le potentiel de la course aux données AI.

Le chemin du succès de Scale AI

Scale AI est actuellement évaluée à 29 milliards de dollars, ses clients incluent le département de la Défense des États-Unis et plusieurs géants de l'IA en concurrence. Le cœur de métier de Scale AI est de fournir une grande quantité de données annotées précises, et elle a su se démarquer parmi de nombreuses licornes grâce à sa compréhension précoce de l'importance des données dans l'industrie de l'IA.

La puissance de calcul, les modèles et les données sont les trois piliers des modèles d'IA. Au cours du développement rapide des grands modèles linguistiques, l'accent de l'industrie a progressivement évolué du modèle vers la puissance de calcul. Aujourd'hui, la plupart des modèles ont établi le transformer comme cadre de modèle, et les grands acteurs ont également résolu le problème de la puissance de calcul en construisant leurs propres supercalculateurs ou en signant des accords à long terme avec des fournisseurs de services cloud. Dans ce contexte, l'importance des données devient progressivement plus évidente.

Scale AI ne se contente pas d'exploiter les données existantes, mais se tourne également vers des activités de génération de données à plus long terme. Elle forme des équipes d'entraînement IA composées d'experts humains de différents domaines pour fournir des données d'entraînement de meilleure qualité pour l'entraînement des modèles IA.

Les deux phases de l'entraînement des modèles d'IA

L'entraînement des modèles d'IA est divisé en deux parties : pré-entraînement et ajustement fin.

La phase de pré-entraînement est similaire au processus d'apprentissage de la parole chez les bébés humains. Nous devons fournir à l'IA un grand nombre de textes, de codes et d'autres informations extraits d'Internet, permettant au modèle d'acquérir des compétences de communication de base par auto-apprentissage.

La phase de réglage fin est similaire à l'éducation scolaire, avec des réponses et des directions claires. Grâce à des ensembles de données prétraités et ciblés, nous pouvons former le modèle à acquérir des compétences spécifiques.

Ainsi, les données nécessaires à l'entraînement de l'IA sont également classées en deux catégories :

  1. Des données massives nécessitant peu de traitement, généralement issues de données de web scraping de grandes plateformes UGC, de bases de données de littérature publique, de bases de données privées d'entreprises, etc.

  2. Des données nécessitant une conception et une sélection minutieuses, similaires à des manuels professionnels, nécessitant un nettoyage des données, une sélection, un étiquetage, des retours humains, etc.

Ces deux types de jeux de données constituent le cœur de la piste de données AI. Avec l'amélioration continue des capacités des modèles, des données d'entraînement plus fines et spécialisées deviendront des facteurs clés influençant les capacités des modèles.

Web3 DataFi : Le terreau idéal pour les données d'IA

Comparé aux méthodes traditionnelles de traitement des données, le Web3 possède des avantages naturels dans le domaine des données AI, ce qui a donné naissance au nouveau concept de DataFi. Les avantages de Web3 DataFi se manifestent principalement dans les aspects suivants :

  1. La souveraineté des données, la sécurité et la vie privée garanties par des contrats intelligents
  2. Avantages d'arbitrage géographique offerts par l'architecture distribuée
  3. Avantages clairs d'incitation et de règlement de la blockchain
  4. Favorise la construction d'un marché des données "clé en main" plus efficace et ouvert.

Pour les utilisateurs ordinaires, DataFi est le projet d'IA décentralisé le plus facile auquel participer. Les utilisateurs n'ont pas besoin de signer des contrats complexes ou d'investir dans du matériel coûteux, ils peuvent simplement participer en effectuant des tâches simples, comme fournir des données, évaluer des modèles ou utiliser des outils d'IA pour des créations simples.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Projets potentiels de Web3 DataFi

Actuellement, plusieurs projets Web3 DataFi ont obtenu un financement important, montrant le grand potentiel de ce domaine. Voici quelques projets représentatifs :

  1. Sahara AI : s'engage à créer une super infrastructure et un marché de trading décentralisés pour l'IA.

  2. Yupp : une plateforme de retour d'expérience pour les modèles d'IA, collectant les retours des utilisateurs sur le contenu généré par les modèles.

  3. Vana : transforme les données personnelles des utilisateurs en actifs numériques monétisables.

  4. Chainbase : Axé sur les données on-chain, couvrant plus de 200 blockchains.

  5. Sapien : vise à transformer les connaissances humaines à grande échelle en données d'entraînement AI de haute qualité.

  6. Prisma X : S'engage à devenir la couche de coordination ouverte des robots, la collecte de données physiques en est la clé.

  7. Masa : le projet de sous-réseau principal de l'écosystème Bittensor, gérant le sous-réseau de données et le sous-réseau d'Agent.

  8. Irys : axé sur le stockage de données et le calcul programmables.

  9. ORO : permettre aux gens ordinaires de participer à la contribution en IA.

  10. Gata : Positionné comme une couche de données décentralisée, offrant plusieurs modes de participation.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Réflexions sur le projet actuel

Actuellement, les barrières à l'entrée de ces projets ne sont généralement pas très élevées, mais une fois qu'ils auront accumulé des utilisateurs et une certaine fidélité à l'écosystème, les avantages de la plateforme s'accumuleront rapidement. Par conséquent, les projets en phase de démarrage devraient se concentrer sur les incitations et l'expérience utilisateur.

En même temps, ces plateformes de données doivent également prendre en compte comment gérer le travail humain et garantir la qualité de la production de données, afin d'éviter le phénomène de la mauvaise monnaie chassant la bonne. Certains projets comme Sahara et Sapien ont déjà commencé à renforcer la gestion de la qualité des données.

En outre, l'amélioration de la transparence est également un problème important auquel sont confrontés les projets en chaîne actuels. De nombreux projets manquent encore de données publiques et traçables suffisantes, ce qui est préjudiciable au développement durable de Web3 DataFi.

Enfin, l'adoption à grande échelle de DataFi nécessite d'attirer suffisamment de participants individuels et d'obtenir la reconnaissance des entreprises traditionnelles. Certains projets comme Sahara AI et Vana ont déjà fait de bons progrès à cet égard.

DataFi représente une relation de coexistence à long terme entre l'intelligence humaine et l'intelligence des machines. Pour ceux qui sont à la fois impatients et inquiets à l'égard de l'ère de l'IA, participer à DataFi est un bon choix qui s'inscrit dans la tendance.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

SAHARA6.9%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Partager
Commentaire
0/400
ReverseFOMOguyvip
· Il y a 6h
On recommence à parler de DataFi.
Voir l'originalRépondre0
CryptoCross-TalkClubvip
· Il y a 6h
Ah ah, enfin on commence à prendre les gens pour des idiots avec l'IA, la dernière fois c'était le Metaverse, et cette fois-ci, une nouvelle histoire arrive.
Voir l'originalRépondre0
ParanoiaKingvip
· Il y a 6h
Les données d'entraînement peuvent-elles également être regroupées ?
Voir l'originalRépondre0
BTCRetirementFundvip
· Il y a 7h
290 milliards, Se faire prendre pour des cons...
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)