Web3如何在AI產業鏈各環節發揮作用

AI+Web3:塔樓與廣場

TL;DR

  1. AI概念的Web3項目在一二級市場成爲吸金標的。

  2. Web3在AI行業的機會主要體現在:利用分布式激勵協調長尾潛在供應(跨數據、存儲和計算);同時建立開源模型和AI Agent的去中心化市場。

  3. AI在Web3行業主要應用於鏈上金融(加密支付、交易、數據分析)以及輔助開發。

  4. AI+Web3的效用體現在雙方互補:Web3有望對抗AI集中化,AI有望幫助Web3破圈。

AI+Web3:塔樓與廣場

引言

近兩年,AI發展迅猛,ChatGPT的出現開啓了生成式人工智能的新紀元,也在Web3領域掀起了熱潮。

AI概念的加持下,Web3項目融資明顯提振。僅2024上半年就有64個Web3+AI項目完成融資,其中基於AI的操作系統Zyber365在A輪實現1億美元最高融資。

二級市場更爲繁榮,Coingecko數據顯示,AI賽道總市值已達485億美元,24小時交易量近86億美元。主流AI技術進展帶來明顯利好,如OpenAI的Sora發布後,AI板塊平均價格漲151%。AI效應也輻射至加密貨幣吸金板塊Meme:首個AI Agent概念的MemeCoin GOAT迅速走紅,估值達14億美金,掀起AI Meme熱潮。

AI+Web3相關研究和話題火熱,從AI+Depin到AI Memecoin再到AI Agent和AI DAO,FOMO情緒已難以跟上新敘事輪換速度。

AI+Web3這個充滿熱錢、風口和未來幻想的概念組合,難免被視爲一場資本撮合的包辦婚姻。我們很難判斷這是投機者的主場,還是黎明爆發的前夜。

要回答這個問題,關鍵在於思考:有了對方它會變得更好嗎?是否能從對方模式中受益?本文試圖審視這一格局:Web3如何在AI技術堆棧各環節發揮作用,AI又能給Web3帶來什麼新的生機?

Part.1 AI堆棧下Web3有何機會?

在展開這個話題前,我們需要了解AI大模型的技術堆棧:

AI大模型可類比人類大腦,早期階段如嬰兒需要觀察攝入海量外界信息去理解世界,這是數據"收集"階段。由於計算機不具備人類多感官,訓練前需要"預處理"將無標注信息轉化爲計算機可理解格式。

輸入數據後AI通過"訓練"構建具理解預測能力的模型,類似嬰兒逐漸理解學習外界。模型參數如嬰兒不斷調整的語言能力。學習內容分科或與人交流獲得反饋修正,進入"微調"環節。

孩童長大學會說話後,能在新對話中理解並表達,類似AI大模型"推理"階段,能對新輸入進行預測分析。嬰兒通過語言表達感受、描述物體和解決問題,類似AI大模型完成訓練後應用於各類特定任務,如圖像分類、語音識別等。

AI Agent則更趨近大模型下一形態:能獨立執行任務追求復雜目標,具備思考、記憶、規劃能力,且能運用工具與世界互動。

針對AI各堆棧痛點,Web3目前初步形成多層次相互連接的生態系統,涵蓋AI模型流程各階段。

AI+Web3:塔樓與廣場

一、基礎層:算力與數據的Airbnb

算力

當前,AI最高成本之一是訓練和推理模型所需算力與能源。

如Meta的LLAMA3需16000個NVIDIA H100GPU 30天才能完成訓練。80GB版單價3-4萬美元,需4-7億美元硬件投資,每月訓練耗電16億千瓦時,能源支出近2000萬美元。

對AI算力解壓是Web3最早與AI交叉領域------DePin(去中心化物理基礎設施網路)。DePin Ninja已列出1400多個項目,GPU算力共享代表如io.net、Aethir、Akash、Render Network等。

主要邏輯:平台允許閒置GPU資源擁有者無需許可去中心化貢獻計算能力,類似Uber或Airbnb買賣雙方在線市場,提高未充分利用GPU資源使用率,終端用戶獲得低成本高效計算資源;同時質押機制確保違反質量控制或中斷網路時資源提供者受懲罰。

特點:

  • 聚集閒置GPU資源:主要爲第三方中小數據中心、加密礦場等過剩算力,PoS挖礦硬件如FileCoin與ETH礦機。也有項目致力於啓動門檻更低設備,如exolab利用MacBook、iPhone、iPad等本地設備建立運行大模型推理算力網路。

  • 面向AI算力長尾市場: a. 技術端:更適合推理步驟。訓練依賴超大集羣GPU,推理對GPU運算性能要求較低,如Aethir專注低延遲渲染和AI推理。 b. 需求端:中小算力需求方不會單獨訓練大模型,僅圍繞頭部大模型優化微調,天然適合分布式閒置算力資源。

  • 去中心化所有權:區塊鏈技術意義在於資源所有者始終保留對資源控制權,靈活調整同時獲得收益。

數據

數據是AI的地基。如無數據,計算如浮萍毫無用處,數據與模型關係如"Garbage in, Garbage out",數據數量與質量決定最終模型輸出質量。對AI模型訓練而言,數據決定語言能力、理解能力、價值觀和人性化表現。目前AI數據需求困境主要有:

  • 數據飢渴:AI模型訓練依賴海量數據輸入。OpenAI訓練GPT-4參數量達萬億級。

  • 數據質量:隨着AI與各行業結合,對數據時效性、多樣性、專業性、新興數據源如社交媒體情緒攝入也提出新要求。

  • 隱私與合規:各國企業逐漸注意優質數據集重要性,正在限制數據集爬取。

  • 數據處理成本高:數據量大,處理復雜。AI公司超30%研發成本用於基礎數據採集處理。

Web3解決方案體現在四方面:

  1. 數據收集:免費抓取真實世界數據迅速耗盡,AI公司數據付費支出逐年升高,但未反哺真正貢獻者,平台享受全部價值創造,如Reddit通過AI公司數據授權協議獲2.03億美元收入。

讓真正貢獻用戶參與數據價值創造,通過分布式網路與激勵機制低成本獲取更私人valuable數據,是Web3願景。

  • Grass:去中心化數據層和網路,用戶運行節點貢獻閒置帶寬中繼流量捕獲實時數據,獲取代幣獎勵。

  • Vana:引入數據流動性池(DLP)概念,用戶上傳私人數據至特定DLP,靈活選擇是否授權第三方使用。

  • PublicAI:用戶在X上使用#AI或#Web3標籤並@PublicAI即可實現數據收集。

  1. 數據預處理:AI數據處理中,收集數據通常嘈雜且有錯誤,訓練前必須清理轉換爲可用格式,涉及標準化、過濾、處理缺失值等重復任務。此階段是AI行業少數人工環節,衍生出數據標注師行業,隨模型對數據質量要求提高,門檻也提升,天然適合Web3去中心化激勵機制。
  • Grass與OpenLayer考慮加入數據標注環節。

  • Synesis提出"Train2earn"概念,強調數據質量,用戶提供標注數據、注釋等獲得獎勵。

  • 數據標注項目Sapien將標記任務遊戲化,用戶質押積分賺取更多積分。

  1. 數據隱私與安全:需釐清數據隱私與安全是兩個概念。數據隱私涉及敏感數據處理,數據安全保護數據免遭未授權訪問、破壞和盜竊。Web3隱私技術優勢和潛在應用場景:(1)敏感數據訓練;(2)數據協作:多數據所有者共同參與AI訓練,無需共享原始數據。

當前Web3普遍隱私技術:

  • 可信執行環境(TEE),如Super Protocol

  • 完全同態加密(FHE),如BasedAI、Fhenix.io、Inco Network

  • 零知識技術(zk),如Reclaim Protocol使用zkTLS技術生成HTTPS流量零知識證明,允許用戶安全導入外部網站活動、聲譽和身分數據,無需暴露敏感信息。

該領域仍處早期,大部分項目在探索,目前困境是計算成本高,如:

  • zkML框架EZKL需約80分鍾生成1M-nanoGPT模型證明。

  • Modulus Labs數據顯示zkML開銷比純計算高1000倍以上。

  1. 數據存儲:需要鏈上存儲數據及生成LLM的地方。以數據可用性(DA)爲核心問題,以太坊danksharding升級前吞吐量爲0.08MB。AI模型訓練和實時推理通常需每秒50-100GB數據吞吐量。這種量級差距使現有鏈上解決方案難以應對資源密集型AI應用。
  • 0g.AI是代表項目。針對AI高性能需求設計的中心化存儲解決方案,關鍵特性:高性能與擴展性,通過高級分片和糾刪碼技術支持快速上傳下載大規模數據集,數據傳輸速度接近每秒5GB。

二、中間件:模型的訓練與推理

開源模型去中心化市場

AI模型閉源vs開源爭論持續。開源帶來集體創新是閉源無法比擬優勢,但無盈利模式下如何提高開發者驅動力?百度創始人李彥宏4月斷言"開源模型會越來越落後"。

Web3提出去中心化開源模型市場可能性:對模型本身代幣化,爲團隊保留一定比例代幣,將部分未來收入流向代幣持有者。

  • Bittensor協議建立開源模型P2P市場,由數十個"子網"組成,資源提供者(計算、數據收集/存儲、機器學習人才)相互競爭滿足特定子網所有者目標,各子網可交互相互學習實現更強大智能。獎勵由社區投票分配,並根據競爭表現進一步分配各子網。

  • ORA引入初始模型發行(IMO)概念,將AI模型代幣化,可通過去中心化網路購買、出售和開發AI模型。

  • Sentient,去中心化AGI平台,激勵人們合作、構建、復制和擴展AI模型,並獎勵貢獻者。

  • Spectral Nova,聚焦AI和ML模型創建與應用。

可驗證推理

針對AI推理"黑盒"難題,標準Web3解決方案是多驗證者重復操作比較結果,但高端"Nvidia芯片"短缺導致AI推理成本高昂,這種做法面臨挑戰。

更有希望的是對鏈下AI推理計算執行ZK證明,在鏈上無需許可驗證AI模型計算。需在鏈上加密證明鏈下計算正確完成(如數據集未篡改),同時確保所有數據保密。

主要優點:

  • 可擴展性:零知識證明可快速確認大量鏈下計算。即使交易數量增加,單個證明也可驗證所有交易。

  • 隱私保護:數據和AI模型詳細信息保密,各方可驗證數據和模型未被破壞。

  • 無需信任:無需依賴中心化各方即可確認計算。

  • Web2集成:定義上Web2是鏈下集成,可驗證推理可幫助將其數據集和AI計算帶到鏈上,有助提高Web3採用率。

目前Web3針對可驗證推理的技術:

  • zkML:將零知識證明與機器學習結合,確保數據和模型隱私機密性,允許可驗證計算而無需透露底層屬性,如Modulus Labs基於ZKML發布AI構建的ZK證明器,有效檢查AI提供商在鏈上是否正確執行算法,目前客戶基本爲鏈上DApp。

  • opML:利用樂觀匯總原則,通過驗證爭議發生時間,提高ML計

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 3
  • 分享
留言
0/400
薅毛自由职业者vip
· 6小時前
还不是被大资金割韭菜
回復0
链上数据侦探vip
· 6小時前
盯了三天的资金流向 所有巨鲸都在囤ai概念
回復0
MEV受害者互助会vip
· 6小時前
资本家们的新玩具罢了
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)