Dự án Web3 với khái niệm AI trở thành mục tiêu thu hút vốn ở thị trường sơ cấp và thứ cấp.
Cơ hội của Web3 trong ngành AI chủ yếu thể hiện ở việc: sử dụng động lực phân phối để phối hợp với nguồn cung tiềm năng dài hạn ( trên dữ liệu, lưu trữ và tính toán ); đồng thời xây dựng mô hình mã nguồn mở và thị trường phi tập trung cho AI Agent.
AI chủ yếu được ứng dụng trong ngành Web3 vào tài chính trên chuỗi ( thanh toán tiền mã hóa, giao dịch, phân tích dữ liệu ) và hỗ trợ phát triển.
Tính hữu ích của AI+Web3 thể hiện ở sự bổ sung lẫn nhau: Web3 hy vọng chống lại sự tập trung của AI, AI hy vọng giúp Web3 vượt ra ngoài ranh giới.
Giới thiệu
Trong hai năm qua, AI phát triển nhanh chóng, sự xuất hiện của ChatGPT đã mở ra một kỷ nguyên mới cho trí tuệ nhân tạo sinh sinh, đồng thời cũng đã dấy lên một cơn sốt trong lĩnh vực Web3.
Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn cho các dự án Web3 đã rõ rệt được cải thiện. Chỉ trong nửa đầu năm 2024, đã có 64 dự án Web3+AI hoàn thành huy động vốn, trong đó hệ điều hành dựa trên AI Zyber365 đã đạt mức huy động vốn cao nhất 100 triệu USD trong vòng A.
Thị trường thứ cấp ngày càng phát triển, dữ liệu từ Coingecko cho thấy tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD. Những tiến bộ công nghệ AI chủ đạo mang lại lợi ích rõ rệt, chẳng hạn như sau khi OpenAI ra mắt Sora, giá trung bình của lĩnh vực AI tăng 151%. Hiệu ứng AI cũng lan tỏa đến lĩnh vực thu hút tiền mã hóa Meme: Đồng MemeCoin GOAT với khái niệm AI Agent đầu tiên nhanh chóng nổi tiếng, đạt giá trị 1,4 tỷ USD, mở ra cơn sốt AI Meme.
Nghiên cứu và chủ đề liên quan đến AI+Web3 đang rất nóng, từ AI+Depin đến AI Memecoin rồi đến AI Agent và AI DAO, cảm xúc FOMO đã khó theo kịp tốc độ xoay vòng của những câu chuyện mới.
Khái niệm kết hợp AI+Web3 đầy tiền nóng, cơ hội và ảo tưởng tương lai này, khó tránh khỏi bị coi là một cuộc hôn nhân sắp đặt giữa các nhà đầu tư. Chúng ta rất khó để xác định đây là sân chơi của những kẻ đầu cơ, hay là đêm trước cuộc bùng nổ.
Để trả lời câu hỏi này, chìa khóa nằm ở việc suy nghĩ: Liệu có bên kia sẽ trở nên tốt hơn không? Có thể hưởng lợi từ mô hình của bên kia không? Bài viết này cố gắng xem xét cấu trúc này: Web3 sẽ phát huy vai trò như thế nào trong từng khâu của công nghệ AI, và AI có thể mang lại sức sống mới gì cho Web3?
Phần 1: Cơ hội nào cho Web3 dưới đống AI?
Trước khi mở rộng chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn.
Mô hình AI lớn có thể so sánh với não người, giai đoạn đầu giống như trẻ sơ sinh cần quan sát và tiếp nhận một khối lượng lớn thông tin từ bên ngoài để hiểu thế giới, đây là giai đoạn "thu thập" dữ liệu. Do máy tính không có đa giác quan như con người, trước khi đào tạo cần "tiền xử lý" để chuyển đổi thông tin không có nhãn thành định dạng mà máy tính có thể hiểu.
Sau khi nhập dữ liệu, AI thông qua "huấn luyện" để xây dựng một mô hình có khả năng hiểu và dự đoán, tương tự như cách mà trẻ em dần dần hiểu và học hỏi về thế giới bên ngoài. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ em liên tục được điều chỉnh. Nội dung học tập được phân chia theo chuyên ngành hoặc giao tiếp với người khác để nhận phản hồi và điều chỉnh, tiến vào giai đoạn "tinh chỉnh".
Trẻ em khi lớn lên và biết nói, có thể hiểu và diễn đạt trong các cuộc đối thoại mới, tương tự như giai đoạn "suy diễn" của mô hình AI lớn, có khả năng dự đoán và phân tích đầu vào mới. Trẻ sơ sinh thông qua ngôn ngữ để diễn đạt cảm xúc, mô tả vật thể và giải quyết vấn đề, tương tự như mô hình AI lớn sau khi hoàn thành đào tạo được áp dụng vào các nhiệm vụ cụ thể khác nhau, như phân loại hình ảnh, nhận diện giọng nói, v.v.
AI Agent thì gần giống như hình thái tiếp theo của mô hình lớn: có khả năng thực hiện nhiệm vụ một cách độc lập, theo đuổi các mục tiêu phức tạp, có khả năng tư duy, ghi nhớ, lập kế hoạch, và có thể sử dụng công cụ để tương tác với thế giới.
Đối với các điểm đau của từng lớp AI, Web3 hiện đang hình thành một hệ sinh thái đa tầng kết nối lẫn nhau, bao gồm các giai đoạn quy trình mô hình AI.
Một, Cơ sở hạ tầng: Airbnb về sức mạnh tính toán và dữ liệu
sức mạnh tính toán
Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết để huấn luyện và suy luận mô hình.
Meta's LLAMA3 cần 16.000 GPU NVIDIA H100 trong 30 ngày để hoàn thành việc đào tạo. Phiên bản 80GB có giá từ 30.000 đến 40.000 USD, cần đầu tư phần cứng từ 400 đến 700 triệu USD, tiêu thụ điện năng 1,6 tỷ kWh mỗi tháng, chi phí năng lượng gần 20 triệu USD.
Giải nén sức mạnh AI là lĩnh vực giao thoa đầu tiên giữa Web3 và AI ------ DePin( mạng lưới cơ sở hạ tầng vật lý phi tập trung). DePin Ninja đã liệt kê hơn 1400 dự án, chia sẻ sức mạnh GPU đại diện như io.net, Aethir, Akash, Render Network và nhiều dự án khác.
Logic chính: Nền tảng cho phép các chủ sở hữu tài nguyên GPU nhàn rỗi đóng góp sức mạnh tính toán phi tập trung mà không cần giấy phép, tương tự như thị trường trực tuyến giữa người mua và người bán của Uber hoặc Airbnb, tăng cường tỷ lệ sử dụng tài nguyên GPU chưa được khai thác. Người dùng cuối nhận được nguồn tài nguyên tính toán hiệu quả với chi phí thấp; đồng thời, cơ chế staking đảm bảo rằng các nhà cung cấp tài nguyên sẽ bị phạt khi vi phạm kiểm soát chất lượng hoặc ngắt kết nối mạng.
Đặc điểm:
Tập hợp tài nguyên GPU nhàn rỗi: chủ yếu cho các trung tâm dữ liệu nhỏ và vừa của bên thứ ba, các mỏ khai thác tiền điện tử và các tài nguyên tính toán thừa, phần cứng khai thác PoS như máy khai thác FileCoin và ETH. Cũng có những dự án hướng tới việc khởi động các thiết bị có ngưỡng tham gia thấp hơn, chẳng hạn như exolab sử dụng MacBook, iPhone, iPad và các thiết bị cục bộ khác để thiết lập mạng lưới tính toán suy diễn mô hình lớn.
Hướng tới thị trường dài hạn về sức mạnh tính toán AI:
a. Phần kỹ thuật: Thích hợp hơn cho các bước suy luận. Đào tạo phụ thuộc vào GPU cụm siêu lớn, suy luận yêu cầu hiệu suất tính toán GPU thấp hơn, như Aethir tập trung vào render độ trễ thấp và suy luận AI.
b. Phía cầu: Những người có nhu cầu tính toán nhỏ và vừa sẽ không tự đào tạo mô hình lớn, chỉ tối ưu hóa và tinh chỉnh xung quanh các mô hình lớn hàng đầu, tự nhiên phù hợp với nguồn tài nguyên tính toán nhàn rỗi phân tán.
Quyền sở hữu phi tập trung: Ý nghĩa của công nghệ blockchain là chủ sở hữu tài nguyên luôn giữ quyền kiểm soát tài nguyên, điều chỉnh linh hoạt trong khi vẫn nhận được lợi nhuận.
Dữ liệu
Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán như cỏ dại không có ích gì, mối quan hệ giữa dữ liệu và mô hình giống như "Rác vào, rác ra", số lượng và chất lượng dữ liệu quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo mô hình AI, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu biết, giá trị quan và biểu hiện tính nhân văn. Hiện tại, những khó khăn trong nhu cầu dữ liệu AI chủ yếu có:
Cơn khát dữ liệu: Đào tạo mô hình AI phụ thuộc vào việc nhập dữ liệu khổng lồ. OpenAI đào tạo GPT-4 với số lượng tham số lên đến hàng nghìn tỷ.
Chất lượng dữ liệu: Cùng với việc AI kết hợp với các ngành, yêu cầu mới về tính kịp thời, đa dạng, chuyên môn của dữ liệu và các nguồn dữ liệu mới nổi như cảm xúc từ phương tiện truyền thông xã hội cũng đã được đưa ra.
Quyền riêng tư và tuân thủ: Các doanh nghiệp ở các quốc gia ngày càng chú ý đến tầm quan trọng của bộ dữ liệu chất lượng, đang hạn chế việc thu thập bộ dữ liệu.
Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, xử lý phức tạp. Các công ty AI chi hơn 30% chi phí nghiên cứu và phát triển cho việc thu thập và xử lý dữ liệu cơ bản.
Giải pháp Web3 được thể hiện ở bốn khía cạnh:
Thu thập dữ liệu: Việc thu thập dữ liệu từ thế giới thực miễn phí nhanh chóng cạn kiệt, chi phí dữ liệu của các công ty AI tăng hàng năm, nhưng không hồi phục cho những người đóng góp thực sự, các nền tảng hưởng toàn bộ giá trị tạo ra, chẳng hạn như Reddit đã thu được 203 triệu USD từ thỏa thuận cấp phép dữ liệu với các công ty AI.
Để người dùng thực sự tham gia vào việc tạo ra giá trị dữ liệu, việc thu thập dữ liệu giá trị riêng tư với chi phí thấp thông qua mạng phân tán và cơ chế khuyến khích là tầm nhìn của Web3.
Grass: Lớp dữ liệu và mạng phi tập trung, người dùng vận hành nút đóng góp băng thông nhàn rỗi để chuyển tiếp lưu lượng, thu thập dữ liệu thời gian thực, nhận phần thưởng bằng token.
Vana: Giới thiệu khái niệm về bể thanh khoản dữ liệu (DLP), người dùng tải lên dữ liệu cá nhân đến DLP cụ thể, linh hoạt lựa chọn có cho phép bên thứ ba sử dụng hay không.
PublicAI: Người dùng có thể thu thập dữ liệu bằng cách sử dụng #AI或# thẻ Web3 trên X và @PublicAI.
Tiền xử lý dữ liệu: Trong xử lý dữ liệu AI, việc thu thập dữ liệu thường ồn ào và có sai sót, trước khi đào tạo phải làm sạch và chuyển đổi thành định dạng có thể sử dụng, bao gồm các nhiệm vụ lặp đi lặp lại như chuẩn hóa, lọc, xử lý giá trị thiếu, v.v. Giai đoạn này là một trong số ít các khâu thủ công trong ngành AI, dẫn đến ngành nghề người đánh dấu dữ liệu. Khi yêu cầu về chất lượng dữ liệu của mô hình tăng lên, ngưỡng cũng được nâng cao, tự nhiên phù hợp với cơ chế khuyến khích phi tập trung Web3.
Grass và OpenLayer đang xem xét việc thêm giai đoạn đánh dấu dữ liệu.
Synesis đã đề xuất khái niệm "Train2earn", nhấn mạnh chất lượng dữ liệu, người dùng cung cấp dữ liệu được chú thích, ghi chú, v.v. để nhận thưởng.
Dự án đánh dấu dữ liệu Sapien đã biến nhiệm vụ đánh dấu thành trò chơi, người dùng đặt cược điểm để kiếm thêm điểm.
Quyền riêng tư và bảo mật dữ liệu: Cần làm rõ quyền riêng tư dữ liệu và bảo mật dữ liệu là hai khái niệm khác nhau. Quyền riêng tư dữ liệu liên quan đến việc xử lý dữ liệu nhạy cảm, bảo mật dữ liệu bảo vệ dữ liệu khỏi việc truy cập trái phép, phá hoại và đánh cắp. Lợi thế công nghệ quyền riêng tư Web3 và các kịch bản ứng dụng tiềm năng: (1) Đào tạo dữ liệu nhạy cảm; (2) Hợp tác dữ liệu: Nhiều chủ sở hữu dữ liệu cùng tham gia đào tạo AI mà không cần chia sẻ dữ liệu gốc.
Công nghệ bảo mật phổ biến hiện nay trong Web3:
Môi trường thực thi đáng tin cậy(TEE), như Super Protocol
Mã hóa đồng hình hoàn toàn ( FHE ), như BasedAI, Fhenix.io, Inco Network
Công nghệ zero-knowledge (zk), như Reclaim Protocol sử dụng công nghệ zkTLS để tạo ra chứng minh zero-knowledge cho lưu lượng HTTPS, cho phép người dùng an toàn nhập các hoạt động, danh tiếng và dữ liệu danh tính từ các trang web bên ngoài mà không cần tiết lộ thông tin nhạy cảm.
Lĩnh vực này vẫn ở giai đoạn đầu, hầu hết các dự án đang trong quá trình khám phá, hiện tại khó khăn là chi phí tính toán cao, chẳng hạn như:
Khung zkML EZKL cần khoảng 80 phút để tạo ra chứng minh mô hình 1M-nanoGPT.
Dữ liệu từ Modulus Labs cho thấy chi phí zkML cao hơn 1000 lần so với tính toán thuần túy.
Lưu trữ dữ liệu: Cần có nơi để lưu trữ dữ liệu trên chuỗi và tạo ra LLM. Vấn đề cốt lõi là khả năng sử dụng dữ liệu (DA), trước khi nâng cấp Danksharding của Ethereum, thông lượng là 0.08MB. Việc huấn luyện mô hình AI và suy diễn theo thời gian thực thường cần từ 50-100GB thông lượng dữ liệu mỗi giây. Sự chênh lệch về quy mô này khiến các giải pháp trên chuỗi hiện có khó có thể đáp ứng các ứng dụng AI yêu cầu nhiều tài nguyên.
0g.AI là đại diện cho dự án. Giải pháp lưu trữ tập trung được thiết kế cho nhu cầu hiệu suất cao của AI, các tính năng chính: hiệu suất cao và khả năng mở rộng, hỗ trợ tải lên và tải xuống nhanh chóng các tập dữ liệu quy mô lớn thông qua công nghệ phân mảnh nâng cao và mã sửa lỗi, tốc độ truyền dữ liệu gần 5GB mỗi giây.
Hai, Middleware: Đào tạo và suy diễn mô hình
Thị trường phi tập trung mô hình mã nguồn mở
Cuộc tranh luận về mô hình AI đóng nguồn vs mở nguồn vẫn tiếp diễn. Mở nguồn mang lại sự đổi mới tập thể là lợi thế mà đóng nguồn không thể so sánh được, nhưng làm thế nào để tăng cường động lực cho các nhà phát triển khi không có mô hình lợi nhuận? Người sáng lập Baidu, Lý Ngạn Hồng, đã khẳng định vào tháng 4 rằng "mô hình mở nguồn sẽ ngày càng lạc hậu".
Web3 đề xuất khả năng thị trường mô hình nguồn mở phi tập trung: mã hóa chính mô hình, giữ lại một tỷ lệ nhất định token cho đội ngũ, chuyển một phần dòng thu nhập tương lai cho người nắm giữ token.
Giao thức Bittensor xây dựng thị trường mô hình P2P mã nguồn mở, bao gồm hàng chục "mạng con", nơi các nhà cung cấp tài nguyên ( tính toán, thu thập/lưu trữ dữ liệu, và tài năng học máy ) cạnh tranh lẫn nhau để đáp ứng mục tiêu của các chủ sở hữu mạng con cụ thể, các mạng con có thể tương tác và học hỏi lẫn nhau để đạt được trí tuệ mạnh mẽ hơn. Phần thưởng được phân phối dựa trên bỏ phiếu của cộng đồng và được phân bổ thêm cho từng mạng con dựa trên hiệu suất cạnh tranh.
ORA giới thiệu khái niệm phát hành mô hình ban đầu (IMO), biến AI thành mã thông báo, có thể mua, bán và phát triển mô hình AI thông qua mạng phi tập trung.
Sentient, nền tảng AGI phi tập trung, khuyến khích mọi người hợp tác, xây dựng, sao chép và mở rộng các mô hình AI, và thưởng cho những người đóng góp.
Spectral Nova, tập trung vào việc tạo ra và ứng dụng các mô hình AI và ML.
Lập luận có thể xác minh
Để giải quyết vấn đề "hộp đen" trong suy luận AI, giải pháp Web3 tiêu chuẩn là so sánh kết quả của các thao tác lặp lại từ nhiều người xác thực, nhưng sự thiếu hụt "chip Nvidia" cao cấp đã làm cho chi phí suy luận AI trở nên cao, cách làm này đang đối mặt với thách thức.
Điều đáng hy vọng hơn là thực hiện chứng minh ZK cho việc tính toán suy diễn AI ngoại tuyến, không cần xác minh có giấy phép cho việc tính toán mô hình AI trên chuỗi. Cần mã hóa chứng minh trên chuỗi rằng việc tính toán ngoại tuyến đã hoàn thành đúng ( nếu tập dữ liệu không bị can thiệp ), đồng thời đảm bảo tất cả dữ liệu đều được bảo mật.
Lợi ích chính:
Khả năng mở rộng: Chứng minh không kiến thức có thể xác nhận nhanh chóng một lượng lớn tính toán ngoài chuỗi. Ngay cả khi số lượng giao dịch tăng, một chứng minh duy nhất cũng có thể xác minh tất cả giao dịch.
Bảo vệ quyền riêng tư: Thông tin dữ liệu và mô hình AI được giữ bí mật, các bên có thể xác minh dữ liệu và mô hình không bị phá hoại.
Không cần tin tưởng: Không cần dựa vào các bên tập trung để xác nhận tính toán.
Tích hợp Web2: Về định nghĩa, Web2 là tích hợp ngoại tuyến, việc suy diễn có thể xác minh có thể giúp đưa tập dữ liệu và tính toán AI lên chuỗi, giúp tăng cường tỷ lệ chấp nhận Web3.
Hiện tại Web3 đang tập trung vào công nghệ suy diễn có thể xác minh:
zkML: Kết hợp chứng minh không biết (zero-knowledge proof) với học máy (machine learning), đảm bảo tính bảo mật của dữ liệu và mô hình, cho phép tính toán có thể xác minh mà không cần tiết lộ các thuộc tính cơ bản, như bộ chứng ZK được xây dựng bởi AI của Modulus Labs dựa trên ZKML, kiểm tra hiệu quả xem nhà cung cấp AI có thực hiện thuật toán đúng trên chuỗi hay không, hiện tại khách hàng chủ yếu là DApp trên chuỗi.
opML: Sử dụng nguyên tắc tổng hợp lạc quan, thông qua việc xác minh thời gian xảy ra tranh chấp, cải thiện ML tính toán.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
7 thích
Phần thưởng
7
3
Chia sẻ
Bình luận
0/400
AirdropHunter
· 16giờ trước
còn chưa bị đại vốn chơi đùa với mọi người
Xem bản gốcTrả lời0
OnChainDetective
· 16giờ trước
Theo dõi dòng tiền trong ba ngày, tất cả các Cá voi đều đang tích trữ khái niệm ai.
Web3 có thể phát huy vai trò của mình trong các giai đoạn của chuỗi ngành AI như thế nào
AI+Web3: Tháp và Quảng trường
TL;DR
Dự án Web3 với khái niệm AI trở thành mục tiêu thu hút vốn ở thị trường sơ cấp và thứ cấp.
Cơ hội của Web3 trong ngành AI chủ yếu thể hiện ở việc: sử dụng động lực phân phối để phối hợp với nguồn cung tiềm năng dài hạn ( trên dữ liệu, lưu trữ và tính toán ); đồng thời xây dựng mô hình mã nguồn mở và thị trường phi tập trung cho AI Agent.
AI chủ yếu được ứng dụng trong ngành Web3 vào tài chính trên chuỗi ( thanh toán tiền mã hóa, giao dịch, phân tích dữ liệu ) và hỗ trợ phát triển.
Tính hữu ích của AI+Web3 thể hiện ở sự bổ sung lẫn nhau: Web3 hy vọng chống lại sự tập trung của AI, AI hy vọng giúp Web3 vượt ra ngoài ranh giới.
Giới thiệu
Trong hai năm qua, AI phát triển nhanh chóng, sự xuất hiện của ChatGPT đã mở ra một kỷ nguyên mới cho trí tuệ nhân tạo sinh sinh, đồng thời cũng đã dấy lên một cơn sốt trong lĩnh vực Web3.
Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn cho các dự án Web3 đã rõ rệt được cải thiện. Chỉ trong nửa đầu năm 2024, đã có 64 dự án Web3+AI hoàn thành huy động vốn, trong đó hệ điều hành dựa trên AI Zyber365 đã đạt mức huy động vốn cao nhất 100 triệu USD trong vòng A.
Thị trường thứ cấp ngày càng phát triển, dữ liệu từ Coingecko cho thấy tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD. Những tiến bộ công nghệ AI chủ đạo mang lại lợi ích rõ rệt, chẳng hạn như sau khi OpenAI ra mắt Sora, giá trung bình của lĩnh vực AI tăng 151%. Hiệu ứng AI cũng lan tỏa đến lĩnh vực thu hút tiền mã hóa Meme: Đồng MemeCoin GOAT với khái niệm AI Agent đầu tiên nhanh chóng nổi tiếng, đạt giá trị 1,4 tỷ USD, mở ra cơn sốt AI Meme.
Nghiên cứu và chủ đề liên quan đến AI+Web3 đang rất nóng, từ AI+Depin đến AI Memecoin rồi đến AI Agent và AI DAO, cảm xúc FOMO đã khó theo kịp tốc độ xoay vòng của những câu chuyện mới.
Khái niệm kết hợp AI+Web3 đầy tiền nóng, cơ hội và ảo tưởng tương lai này, khó tránh khỏi bị coi là một cuộc hôn nhân sắp đặt giữa các nhà đầu tư. Chúng ta rất khó để xác định đây là sân chơi của những kẻ đầu cơ, hay là đêm trước cuộc bùng nổ.
Để trả lời câu hỏi này, chìa khóa nằm ở việc suy nghĩ: Liệu có bên kia sẽ trở nên tốt hơn không? Có thể hưởng lợi từ mô hình của bên kia không? Bài viết này cố gắng xem xét cấu trúc này: Web3 sẽ phát huy vai trò như thế nào trong từng khâu của công nghệ AI, và AI có thể mang lại sức sống mới gì cho Web3?
Phần 1: Cơ hội nào cho Web3 dưới đống AI?
Trước khi mở rộng chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn.
Mô hình AI lớn có thể so sánh với não người, giai đoạn đầu giống như trẻ sơ sinh cần quan sát và tiếp nhận một khối lượng lớn thông tin từ bên ngoài để hiểu thế giới, đây là giai đoạn "thu thập" dữ liệu. Do máy tính không có đa giác quan như con người, trước khi đào tạo cần "tiền xử lý" để chuyển đổi thông tin không có nhãn thành định dạng mà máy tính có thể hiểu.
Sau khi nhập dữ liệu, AI thông qua "huấn luyện" để xây dựng một mô hình có khả năng hiểu và dự đoán, tương tự như cách mà trẻ em dần dần hiểu và học hỏi về thế giới bên ngoài. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ em liên tục được điều chỉnh. Nội dung học tập được phân chia theo chuyên ngành hoặc giao tiếp với người khác để nhận phản hồi và điều chỉnh, tiến vào giai đoạn "tinh chỉnh".
Trẻ em khi lớn lên và biết nói, có thể hiểu và diễn đạt trong các cuộc đối thoại mới, tương tự như giai đoạn "suy diễn" của mô hình AI lớn, có khả năng dự đoán và phân tích đầu vào mới. Trẻ sơ sinh thông qua ngôn ngữ để diễn đạt cảm xúc, mô tả vật thể và giải quyết vấn đề, tương tự như mô hình AI lớn sau khi hoàn thành đào tạo được áp dụng vào các nhiệm vụ cụ thể khác nhau, như phân loại hình ảnh, nhận diện giọng nói, v.v.
AI Agent thì gần giống như hình thái tiếp theo của mô hình lớn: có khả năng thực hiện nhiệm vụ một cách độc lập, theo đuổi các mục tiêu phức tạp, có khả năng tư duy, ghi nhớ, lập kế hoạch, và có thể sử dụng công cụ để tương tác với thế giới.
Đối với các điểm đau của từng lớp AI, Web3 hiện đang hình thành một hệ sinh thái đa tầng kết nối lẫn nhau, bao gồm các giai đoạn quy trình mô hình AI.
Một, Cơ sở hạ tầng: Airbnb về sức mạnh tính toán và dữ liệu
sức mạnh tính toán
Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết để huấn luyện và suy luận mô hình.
Meta's LLAMA3 cần 16.000 GPU NVIDIA H100 trong 30 ngày để hoàn thành việc đào tạo. Phiên bản 80GB có giá từ 30.000 đến 40.000 USD, cần đầu tư phần cứng từ 400 đến 700 triệu USD, tiêu thụ điện năng 1,6 tỷ kWh mỗi tháng, chi phí năng lượng gần 20 triệu USD.
Giải nén sức mạnh AI là lĩnh vực giao thoa đầu tiên giữa Web3 và AI ------ DePin( mạng lưới cơ sở hạ tầng vật lý phi tập trung). DePin Ninja đã liệt kê hơn 1400 dự án, chia sẻ sức mạnh GPU đại diện như io.net, Aethir, Akash, Render Network và nhiều dự án khác.
Logic chính: Nền tảng cho phép các chủ sở hữu tài nguyên GPU nhàn rỗi đóng góp sức mạnh tính toán phi tập trung mà không cần giấy phép, tương tự như thị trường trực tuyến giữa người mua và người bán của Uber hoặc Airbnb, tăng cường tỷ lệ sử dụng tài nguyên GPU chưa được khai thác. Người dùng cuối nhận được nguồn tài nguyên tính toán hiệu quả với chi phí thấp; đồng thời, cơ chế staking đảm bảo rằng các nhà cung cấp tài nguyên sẽ bị phạt khi vi phạm kiểm soát chất lượng hoặc ngắt kết nối mạng.
Đặc điểm:
Tập hợp tài nguyên GPU nhàn rỗi: chủ yếu cho các trung tâm dữ liệu nhỏ và vừa của bên thứ ba, các mỏ khai thác tiền điện tử và các tài nguyên tính toán thừa, phần cứng khai thác PoS như máy khai thác FileCoin và ETH. Cũng có những dự án hướng tới việc khởi động các thiết bị có ngưỡng tham gia thấp hơn, chẳng hạn như exolab sử dụng MacBook, iPhone, iPad và các thiết bị cục bộ khác để thiết lập mạng lưới tính toán suy diễn mô hình lớn.
Hướng tới thị trường dài hạn về sức mạnh tính toán AI: a. Phần kỹ thuật: Thích hợp hơn cho các bước suy luận. Đào tạo phụ thuộc vào GPU cụm siêu lớn, suy luận yêu cầu hiệu suất tính toán GPU thấp hơn, như Aethir tập trung vào render độ trễ thấp và suy luận AI. b. Phía cầu: Những người có nhu cầu tính toán nhỏ và vừa sẽ không tự đào tạo mô hình lớn, chỉ tối ưu hóa và tinh chỉnh xung quanh các mô hình lớn hàng đầu, tự nhiên phù hợp với nguồn tài nguyên tính toán nhàn rỗi phân tán.
Quyền sở hữu phi tập trung: Ý nghĩa của công nghệ blockchain là chủ sở hữu tài nguyên luôn giữ quyền kiểm soát tài nguyên, điều chỉnh linh hoạt trong khi vẫn nhận được lợi nhuận.
Dữ liệu
Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán như cỏ dại không có ích gì, mối quan hệ giữa dữ liệu và mô hình giống như "Rác vào, rác ra", số lượng và chất lượng dữ liệu quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo mô hình AI, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu biết, giá trị quan và biểu hiện tính nhân văn. Hiện tại, những khó khăn trong nhu cầu dữ liệu AI chủ yếu có:
Cơn khát dữ liệu: Đào tạo mô hình AI phụ thuộc vào việc nhập dữ liệu khổng lồ. OpenAI đào tạo GPT-4 với số lượng tham số lên đến hàng nghìn tỷ.
Chất lượng dữ liệu: Cùng với việc AI kết hợp với các ngành, yêu cầu mới về tính kịp thời, đa dạng, chuyên môn của dữ liệu và các nguồn dữ liệu mới nổi như cảm xúc từ phương tiện truyền thông xã hội cũng đã được đưa ra.
Quyền riêng tư và tuân thủ: Các doanh nghiệp ở các quốc gia ngày càng chú ý đến tầm quan trọng của bộ dữ liệu chất lượng, đang hạn chế việc thu thập bộ dữ liệu.
Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, xử lý phức tạp. Các công ty AI chi hơn 30% chi phí nghiên cứu và phát triển cho việc thu thập và xử lý dữ liệu cơ bản.
Giải pháp Web3 được thể hiện ở bốn khía cạnh:
Để người dùng thực sự tham gia vào việc tạo ra giá trị dữ liệu, việc thu thập dữ liệu giá trị riêng tư với chi phí thấp thông qua mạng phân tán và cơ chế khuyến khích là tầm nhìn của Web3.
Grass: Lớp dữ liệu và mạng phi tập trung, người dùng vận hành nút đóng góp băng thông nhàn rỗi để chuyển tiếp lưu lượng, thu thập dữ liệu thời gian thực, nhận phần thưởng bằng token.
Vana: Giới thiệu khái niệm về bể thanh khoản dữ liệu (DLP), người dùng tải lên dữ liệu cá nhân đến DLP cụ thể, linh hoạt lựa chọn có cho phép bên thứ ba sử dụng hay không.
PublicAI: Người dùng có thể thu thập dữ liệu bằng cách sử dụng #AI或# thẻ Web3 trên X và @PublicAI.
Grass và OpenLayer đang xem xét việc thêm giai đoạn đánh dấu dữ liệu.
Synesis đã đề xuất khái niệm "Train2earn", nhấn mạnh chất lượng dữ liệu, người dùng cung cấp dữ liệu được chú thích, ghi chú, v.v. để nhận thưởng.
Dự án đánh dấu dữ liệu Sapien đã biến nhiệm vụ đánh dấu thành trò chơi, người dùng đặt cược điểm để kiếm thêm điểm.
Công nghệ bảo mật phổ biến hiện nay trong Web3:
Môi trường thực thi đáng tin cậy(TEE), như Super Protocol
Mã hóa đồng hình hoàn toàn ( FHE ), như BasedAI, Fhenix.io, Inco Network
Công nghệ zero-knowledge (zk), như Reclaim Protocol sử dụng công nghệ zkTLS để tạo ra chứng minh zero-knowledge cho lưu lượng HTTPS, cho phép người dùng an toàn nhập các hoạt động, danh tiếng và dữ liệu danh tính từ các trang web bên ngoài mà không cần tiết lộ thông tin nhạy cảm.
Lĩnh vực này vẫn ở giai đoạn đầu, hầu hết các dự án đang trong quá trình khám phá, hiện tại khó khăn là chi phí tính toán cao, chẳng hạn như:
Khung zkML EZKL cần khoảng 80 phút để tạo ra chứng minh mô hình 1M-nanoGPT.
Dữ liệu từ Modulus Labs cho thấy chi phí zkML cao hơn 1000 lần so với tính toán thuần túy.
Hai, Middleware: Đào tạo và suy diễn mô hình
Thị trường phi tập trung mô hình mã nguồn mở
Cuộc tranh luận về mô hình AI đóng nguồn vs mở nguồn vẫn tiếp diễn. Mở nguồn mang lại sự đổi mới tập thể là lợi thế mà đóng nguồn không thể so sánh được, nhưng làm thế nào để tăng cường động lực cho các nhà phát triển khi không có mô hình lợi nhuận? Người sáng lập Baidu, Lý Ngạn Hồng, đã khẳng định vào tháng 4 rằng "mô hình mở nguồn sẽ ngày càng lạc hậu".
Web3 đề xuất khả năng thị trường mô hình nguồn mở phi tập trung: mã hóa chính mô hình, giữ lại một tỷ lệ nhất định token cho đội ngũ, chuyển một phần dòng thu nhập tương lai cho người nắm giữ token.
Giao thức Bittensor xây dựng thị trường mô hình P2P mã nguồn mở, bao gồm hàng chục "mạng con", nơi các nhà cung cấp tài nguyên ( tính toán, thu thập/lưu trữ dữ liệu, và tài năng học máy ) cạnh tranh lẫn nhau để đáp ứng mục tiêu của các chủ sở hữu mạng con cụ thể, các mạng con có thể tương tác và học hỏi lẫn nhau để đạt được trí tuệ mạnh mẽ hơn. Phần thưởng được phân phối dựa trên bỏ phiếu của cộng đồng và được phân bổ thêm cho từng mạng con dựa trên hiệu suất cạnh tranh.
ORA giới thiệu khái niệm phát hành mô hình ban đầu (IMO), biến AI thành mã thông báo, có thể mua, bán và phát triển mô hình AI thông qua mạng phi tập trung.
Sentient, nền tảng AGI phi tập trung, khuyến khích mọi người hợp tác, xây dựng, sao chép và mở rộng các mô hình AI, và thưởng cho những người đóng góp.
Spectral Nova, tập trung vào việc tạo ra và ứng dụng các mô hình AI và ML.
Lập luận có thể xác minh
Để giải quyết vấn đề "hộp đen" trong suy luận AI, giải pháp Web3 tiêu chuẩn là so sánh kết quả của các thao tác lặp lại từ nhiều người xác thực, nhưng sự thiếu hụt "chip Nvidia" cao cấp đã làm cho chi phí suy luận AI trở nên cao, cách làm này đang đối mặt với thách thức.
Điều đáng hy vọng hơn là thực hiện chứng minh ZK cho việc tính toán suy diễn AI ngoại tuyến, không cần xác minh có giấy phép cho việc tính toán mô hình AI trên chuỗi. Cần mã hóa chứng minh trên chuỗi rằng việc tính toán ngoại tuyến đã hoàn thành đúng ( nếu tập dữ liệu không bị can thiệp ), đồng thời đảm bảo tất cả dữ liệu đều được bảo mật.
Lợi ích chính:
Khả năng mở rộng: Chứng minh không kiến thức có thể xác nhận nhanh chóng một lượng lớn tính toán ngoài chuỗi. Ngay cả khi số lượng giao dịch tăng, một chứng minh duy nhất cũng có thể xác minh tất cả giao dịch.
Bảo vệ quyền riêng tư: Thông tin dữ liệu và mô hình AI được giữ bí mật, các bên có thể xác minh dữ liệu và mô hình không bị phá hoại.
Không cần tin tưởng: Không cần dựa vào các bên tập trung để xác nhận tính toán.
Tích hợp Web2: Về định nghĩa, Web2 là tích hợp ngoại tuyến, việc suy diễn có thể xác minh có thể giúp đưa tập dữ liệu và tính toán AI lên chuỗi, giúp tăng cường tỷ lệ chấp nhận Web3.
Hiện tại Web3 đang tập trung vào công nghệ suy diễn có thể xác minh:
zkML: Kết hợp chứng minh không biết (zero-knowledge proof) với học máy (machine learning), đảm bảo tính bảo mật của dữ liệu và mô hình, cho phép tính toán có thể xác minh mà không cần tiết lộ các thuộc tính cơ bản, như bộ chứng ZK được xây dựng bởi AI của Modulus Labs dựa trên ZKML, kiểm tra hiệu quả xem nhà cung cấp AI có thực hiện thuật toán đúng trên chuỗi hay không, hiện tại khách hàng chủ yếu là DApp trên chuỗi.
opML: Sử dụng nguyên tắc tổng hợp lạc quan, thông qua việc xác minh thời gian xảy ra tranh chấp, cải thiện ML tính toán.