Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikte Eğitimdeki Sınırları Keşfetmek
AI'nın tam değer zincirinde, model eğitimi en fazla kaynak tüketen, en yüksek teknik eşiğe sahip aşamadır ve doğrudan modelin yetenek sınırını ve gerçek uygulama etkinliğini belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli olarak büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritmaları desteği gerektirir; bu, AI sistemlerinin inşasının gerçek "ağır sanayi"sidir. Mimari paradigma açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitim, tek bir kurumun yerel yüksek performanslı küme içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesindeki tüm bileşenler, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkararak, GPT, Gemini gibi büyük ölçekli modellerin eğitimine son derece uygundur. Verimlilik, kontrol edilebilir kaynaklar gibi avantajları olsa da, aynı zamanda veri tekelciliği, kaynak bariyerleri, enerji tüketimi ve tek nokta riski gibi sorunlar da bulunmaktadır.
Dağıtık eğitim, günümüzde büyük model eğitimi için ana akım bir yöntemdir, bunun temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve iş birliği içinde gerçekleştirilmesi yatar; bu sayede tek bir makinenin hesaplama ve depolama darboğazları aşılabilir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen, planlanan ve senkronize edilen bir yapıya sahiptir; genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm tarafından çeşitli alt görevlerin koordinasyonu sağlanır. Ana akım yöntemler şunlardır:
Veri paralelliği: Her bir düğüm farklı veri parametreleri eğitir, model ağırlıklarının eşleşmesi gerekir.
Model paralelliği: Modelin farklı bölümlerini farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak
Boru hattı paralel: Aşamalı olarak seri yürütme, throughput'u artırır
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölmek, paralel granulariteyi artırmak
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını işbirliği yaparak görev tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim almaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dayanıklı bir gelecek yolunu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, ev bilgisayarı, bulut GPU veya kenar cihazı ), merkez koordinatörü olmaksızın eğitim görevlerini iş birliği içinde tamamlayabilir. Genellikle görev dağıtımı ve iş birliği, protokollerle yönlendirilir ve katkının dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazlar arasında koordinasyon zorluğu, görev bölme verimliliği düşüktür.
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin
Güvenilir yürütme eksikliği: Güvenilir bir yürütme ortamının olmaması, düğümlerin gerçekten hesaplamaya katılıp katılmadığını doğrulamayı zorlaştırıyor.
Birlikte koordine eksikliği: Merkezi bir denetleyici yok, görev dağıtımı, istisna geri alma mekanizması karmaşık
Merkeziyetsizlik eğitimi, küresel bir grup gönüllünün, her birinin hesap gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur ve sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok alanı kapsamaktadır. Ancak, "etkili işbirliği + dürüstlük teşviki + doğru sonuçlar" sağlanıp sağlanamayacağı hala erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak saklanmasını, model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur (, örneğin sağlık, finans ). Federated learning, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağılma avantajlarını da taşır, ancak hala güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumunun söz konusu olduğu senaryolar için "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir, eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından oldukça ılımlıdır, daha çok sanayi geçişi için uygun bir dağıtım yapısı olarak değerlendirilir.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin çok yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvenilmeyen düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir; bu, açık bir ağda etkili bir şekilde bölmek ve senkronize etmekte zorluk yaratır; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasaların uyumu ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşvikleri olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturur.
Ancak bu, merkeziyetsizlik eğitimlerinin sahte bir önerme olduğu anlamına gelmez. Aslında, yapı olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türleri arasında merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumlu sonrası eğitim görevleri ( gibi RLHF, DPO ), veri toplama eğitimi ve etiketleme görevleri, kaynak kontrol edilebilir küçük temel model eğitimi ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağımlılık ve heterojen hesaplama gücüne tolerans gibi özellikler taşımakta olup, P2P ağlar, Swarm protokolleri, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik Antrenmanı Klasik Proje Analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncüsü alanda, temsil niteliğindeki blokchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında birçok özgün keşif sunarak mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise nispeten net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makalede bu beş projenin ardındaki temel teknolojiler ve mühendislik mimarisi sırayla analiz edilecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve karşılıklı tamamlayıcılık ilişkileri daha fazla tartışılacaktır.
Prime Intellect: doğrulanabilir eğitim izleri ile güçlendirilmiş öğrenme işbirliği ağlarının öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmayı hedefliyor, böylece herkes eğitime katılabilir ve hesaplama katkılarından güvenilir ödüller alabilir. Prime Intellect, doğrulanabilirlik, açıklık ve teşvik mekanizmasının tam olduğu bir AI merkeziyetsiz eğitim sistemi kurmak için PRIME-RL + TOPLOC + SHARDCAST üç ana modülünü kullanmayı umuyor.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
02, Prime Intellect eğitimi anahtar mekanizmasının detaylı açıklaması
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir. Heterojen ağlar ve asenkron katılım için tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapılandırılmış bir şekilde ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsünü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmasıyla iş birliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlama ortamında esnek eğitim gerçekleştirmek için daha uygundur, sistem karmaşıklığını azaltırken çoklu görev paralelliği ve strateji evrimi için bir temel sağlar.
#TOPLOC:Ağırlıksız Eğitim Davranış Doğrulama Mekanizması
TOPLOC, Prime Intellect tarafından önerilen ve bir düğümün gerçekten gözlem verilerine dayalı olarak geçerli bir strateji öğrenimi gerçekleştirdiğini belirlemek için kullanılan bir eğitim doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncellemesi" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir, güvene ihtiyaç duymadan eğitim ödül dağıtımını gerçekleştirmenin ana yeniliğidir ve denetlenebilir, teşvik edici bir merkeziyetsiz işbirliği eğitim ağı kurmak için uygulanabilir bir yol sağlar.
#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken gerçek ağ ortamı için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmamış durumlarda sürekli olarak kısmi güncellemeler yapmasına izin verir, ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemleriyle karşılaştırıldığında, SHARDCAST merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonu inşa etmenin temel temelidir.
#OpenDiLoCo:Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibi tarafından DeepMind'ın önerdiği DiLoCo fikrinin bağımsız bir şekilde uygulandığı ve açık kaynak olarak sunulan bir iletişim optimizasyon çerçevesidir. Özellikle merkeziyetsizlik eğitiminde sıkça karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için tasarlanmıştır. Mimari, veri paralelliğine dayanmakta ve Ring, Expander, Small-World gibi seyrek topoloji yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetlerini önlemekte ve yalnızca yerel komşu düğümlere dayanarak model işbirliği eğitimini tamamlamayı mümkün kılmaktadır. Asenkron güncellemeler ve kesinti dayanıklılık mekanizması ile bir araya geldiğinde, OpenDiLoCo, tüketici seviyesindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlayarak, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağı oluşturmanın temel iletişim altyapılarından biri olmaktadır.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect'in merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen alt bileşendir. Eğitimi ağın bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık, güven gerektirmeyen işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını sağlamaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herhangi birinin görevlere katılmasına ve gerçek katkılara dayalı olarak ödül almasına izin veren, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etmiştir. Protokol, üç ana rol türüne dayalı olarak çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar
Eğitim Düğümleri: Yerel eğitim gerçekleştirme, ağırlık güncellemeleri ve gözlem izlerini gönderme
Doğrulama düğümü: Eğitim davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanır ve ödül hesaplaması ile strateji birleştirmeye katılır.
Protokolün temel süreçleri görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme (SHARDCAST) ve ödül dağıtımını içerir, bu da "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü, bu, dünya çapında asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleri ile işbirliği içinde eğitilen ilk büyük ölçekli pekiştirmeli öğrenme modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtaya yayılmış 100'den fazla GPU heterojen düğümü tarafından işbirliği içinde eğitilmiştir, tamamen asenkron bir mimari kullanarak, eğitim süresi 400 saatten fazla sürmüş ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını göstermiştir. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in önerdiği "eğitim, konsensustur" paradigmasının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL( asenkron eğitim yapısı), TOPLOC( eğitim davranış doğrulaması) ve SHARDCAST( asenkron ağırlık birleştirme) gibi temel protokol modüllerini bir araya getirerek, Merkeziyetsizlik eğitim ağının eğitim gerçekleştirmesini sağlamıştır.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Merkeziyetsizlik AI eğitiminin öncü keşifleri: Prime Intellect'ten INTELLECT-2'ye
Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikte Eğitimdeki Sınırları Keşfetmek
AI'nın tam değer zincirinde, model eğitimi en fazla kaynak tüketen, en yüksek teknik eşiğe sahip aşamadır ve doğrudan modelin yetenek sınırını ve gerçek uygulama etkinliğini belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli olarak büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritmaları desteği gerektirir; bu, AI sistemlerinin inşasının gerçek "ağır sanayi"sidir. Mimari paradigma açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitim, tek bir kurumun yerel yüksek performanslı küme içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesindeki tüm bileşenler, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkararak, GPT, Gemini gibi büyük ölçekli modellerin eğitimine son derece uygundur. Verimlilik, kontrol edilebilir kaynaklar gibi avantajları olsa da, aynı zamanda veri tekelciliği, kaynak bariyerleri, enerji tüketimi ve tek nokta riski gibi sorunlar da bulunmaktadır.
Dağıtık eğitim, günümüzde büyük model eğitimi için ana akım bir yöntemdir, bunun temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve iş birliği içinde gerçekleştirilmesi yatar; bu sayede tek bir makinenin hesaplama ve depolama darboğazları aşılabilir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen, planlanan ve senkronize edilen bir yapıya sahiptir; genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm tarafından çeşitli alt görevlerin koordinasyonu sağlanır. Ana akım yöntemler şunlardır:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını işbirliği yaparak görev tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim almaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dayanıklı bir gelecek yolunu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, ev bilgisayarı, bulut GPU veya kenar cihazı ), merkez koordinatörü olmaksızın eğitim görevlerini iş birliği içinde tamamlayabilir. Genellikle görev dağıtımı ve iş birliği, protokollerle yönlendirilir ve katkının dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, küresel bir grup gönüllünün, her birinin hesap gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur ve sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok alanı kapsamaktadır. Ancak, "etkili işbirliği + dürüstlük teşviki + doğru sonuçlar" sağlanıp sağlanamayacağı hala erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak saklanmasını, model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur (, örneğin sağlık, finans ). Federated learning, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağılma avantajlarını da taşır, ancak hala güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumunun söz konusu olduğu senaryolar için "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir, eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından oldukça ılımlıdır, daha çok sanayi geçişi için uygun bir dağıtım yapısı olarak değerlendirilir.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin çok yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvenilmeyen düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir; bu, açık bir ağda etkili bir şekilde bölmek ve senkronize etmekte zorluk yaratır; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasaların uyumu ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşvikleri olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturur.
Ancak bu, merkeziyetsizlik eğitimlerinin sahte bir önerme olduğu anlamına gelmez. Aslında, yapı olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türleri arasında merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumlu sonrası eğitim görevleri ( gibi RLHF, DPO ), veri toplama eğitimi ve etiketleme görevleri, kaynak kontrol edilebilir küçük temel model eğitimi ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağımlılık ve heterojen hesaplama gücüne tolerans gibi özellikler taşımakta olup, P2P ağlar, Swarm protokolleri, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik Antrenmanı Klasik Proje Analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncüsü alanda, temsil niteliğindeki blokchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında birçok özgün keşif sunarak mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise nispeten net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makalede bu beş projenin ardındaki temel teknolojiler ve mühendislik mimarisi sırayla analiz edilecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve karşılıklı tamamlayıcılık ilişkileri daha fazla tartışılacaktır.
Prime Intellect: doğrulanabilir eğitim izleri ile güçlendirilmiş öğrenme işbirliği ağlarının öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmayı hedefliyor, böylece herkes eğitime katılabilir ve hesaplama katkılarından güvenilir ödüller alabilir. Prime Intellect, doğrulanabilirlik, açıklık ve teşvik mekanizmasının tam olduğu bir AI merkeziyetsiz eğitim sistemi kurmak için PRIME-RL + TOPLOC + SHARDCAST üç ana modülünü kullanmayı umuyor.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
02, Prime Intellect eğitimi anahtar mekanizmasının detaylı açıklaması
#PRIME-RL: Decoupled Asynchronous Reinforcement Learning Task Architecture
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir. Heterojen ağlar ve asenkron katılım için tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapılandırılmış bir şekilde ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsünü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmasıyla iş birliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlama ortamında esnek eğitim gerçekleştirmek için daha uygundur, sistem karmaşıklığını azaltırken çoklu görev paralelliği ve strateji evrimi için bir temel sağlar.
#TOPLOC:Ağırlıksız Eğitim Davranış Doğrulama Mekanizması
TOPLOC, Prime Intellect tarafından önerilen ve bir düğümün gerçekten gözlem verilerine dayalı olarak geçerli bir strateji öğrenimi gerçekleştirdiğini belirlemek için kullanılan bir eğitim doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncellemesi" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir, güvene ihtiyaç duymadan eğitim ödül dağıtımını gerçekleştirmenin ana yeniliğidir ve denetlenebilir, teşvik edici bir merkeziyetsiz işbirliği eğitim ağı kurmak için uygulanabilir bir yol sağlar.
#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken gerçek ağ ortamı için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmamış durumlarda sürekli olarak kısmi güncellemeler yapmasına izin verir, ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemleriyle karşılaştırıldığında, SHARDCAST merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonu inşa etmenin temel temelidir.
#OpenDiLoCo:Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibi tarafından DeepMind'ın önerdiği DiLoCo fikrinin bağımsız bir şekilde uygulandığı ve açık kaynak olarak sunulan bir iletişim optimizasyon çerçevesidir. Özellikle merkeziyetsizlik eğitiminde sıkça karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için tasarlanmıştır. Mimari, veri paralelliğine dayanmakta ve Ring, Expander, Small-World gibi seyrek topoloji yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetlerini önlemekte ve yalnızca yerel komşu düğümlere dayanarak model işbirliği eğitimini tamamlamayı mümkün kılmaktadır. Asenkron güncellemeler ve kesinti dayanıklılık mekanizması ile bir araya geldiğinde, OpenDiLoCo, tüketici seviyesindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlayarak, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağı oluşturmanın temel iletişim altyapılarından biri olmaktadır.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect'in merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen alt bileşendir. Eğitimi ağın bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık, güven gerektirmeyen işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını sağlamaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herhangi birinin görevlere katılmasına ve gerçek katkılara dayalı olarak ödül almasına izin veren, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etmiştir. Protokol, üç ana rol türüne dayalı olarak çalışmaktadır:
Protokolün temel süreçleri görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme (SHARDCAST) ve ödül dağıtımını içerir, bu da "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü, bu, dünya çapında asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleri ile işbirliği içinde eğitilen ilk büyük ölçekli pekiştirmeli öğrenme modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtaya yayılmış 100'den fazla GPU heterojen düğümü tarafından işbirliği içinde eğitilmiştir, tamamen asenkron bir mimari kullanarak, eğitim süresi 400 saatten fazla sürmüş ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını göstermiştir. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in önerdiği "eğitim, konsensustur" paradigmasının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL( asenkron eğitim yapısı), TOPLOC( eğitim davranış doğrulaması) ve SHARDCAST( asenkron ağırlık birleştirme) gibi temel protokol modüllerini bir araya getirerek, Merkeziyetsizlik eğitim ağının eğitim gerçekleştirmesini sağlamıştır.