Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları
AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketimi ve en yüksek teknik engel olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarma aşamasındaki hafif çağrılarla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir, bu da AI sistemlerinin inşasının gerçek "ağır sanayi" olduğunu gösterir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitim.
Merkeziyetsiz eğitim en yaygın geleneksel yöntemdir, tek bir kurum tarafından yerel yüksek performanslı küme içinde tüm eğitim süreçleri tamamlanır, donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri merkezi bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için çok uygundur ve yüksek verimlilik, kontrol edilebilir kaynaklar gibi avantajlara sahiptir, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da barındırır.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir; temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılıp işbirliği içinde gerçekleştirilmesi yatar ve bu, tek bir makinenin hesaplama ve depolama darboğazlarını aşmayı sağlar. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen zamanlama ve senkronizasyon ile çalışır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamında çalışır. NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, her alt görevi merkezi olarak koordine eder. Ana akım yöntemler şunları içerir:
Veri paralelliği: Her bir düğüm farklı veri parametreleri ile eğitim yapar, model ağırlıkları eşleştirilmelidir.
Model paralelliği: Modelin farklı bölümlerini farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak
Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırır
Tensör paralelliği: Matris hesaplamalarını ince ince ayırarak paralellik derecesini artırma
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını bir araya getirerek görevleri tamamlamasına benzer. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dirençli bir geleceği temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinator olmaksızın işbirliği içinde eğitim görevlerini tamamlar, genellikle görevi dağıtma ve işbirliği için protokoller tarafından yönlendirilir ve katkıların dürüstlüğünü sağlamak için kripto teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Aygıt heterojenliği ve bölme zorluğu: Heterojen aygıtların koordinasyonu zor, görev bölme verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi kararsız, gradyan senkronizasyonu darboğazı belirgin.
Birlikte koordinasyon eksikliği: Merkezi bir denetleyici yok, görev dağılımı, hata geri alma mekanizması karmaşık
Merkeziyetsizlik eğitimi, dünya genelindeki gönüllülerin, her birinin hesap gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olarak kalmaktadır; sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulaması gibi birçok yönü içermektedir, ancak "eşgüdümlü etkin + dürüstlüğü teşvik eden + doğru sonuçlar" sağlanabilir mi, henüz erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını, model parametrelerinin merkezi bir şekilde toplanmasını vurgular ve gizlilik uyumuna önem veren senaryolar için uygundur. Federated öğrenme, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahipken, aynı zamanda Merkeziyetsizlik eğitiminin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında 'kontrollü Merkeziyetsizlik' çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve endüstri geçiş dağıtım yapısı olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim her görev türü için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimleri genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine bağımlıdır, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açık paylaşım yapamaz; işbirliği teşvik temeli olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturur.
Ancak bu, merkeziyetsizlik eğitiminin sahte bir kavram olduğu anlamına gelmez. Aslında, yapısal olarak hafif, paralel çalışması kolay ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir, bu nedenle P2P ağları, Swarm protokolü, dağıtık optimizatörler gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.
Merkeziyetsizlik eğitimi klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncü alanında, temsil niteliğine sahip blokzincir projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda oldukça fazla orijinal keşif önermekte, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise nispeten net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makalede, bu beş projenin arkasındaki temel teknoloji ve mühendislik mimarisinin detayları sırayla analiz edilecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da derinlemesine tartışılacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kararlıdır; böylece herkes eğitime katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, doğrulanabilirlik, açıklık ve teşvik mekanizması ile tam donanımlı bir AI merkeziyetsizlik eğitim sistemi oluşturmak için PRIME-RL + TOPLOC + SHARDCAST üç ana modülünü kullanmayı hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modülün değeri
Prime Intellect'in protokol yığını, sırasıyla asenkron eğitim, güvenilir doğrulama ve ağırlık yayılımı sorunlarını çözen üç ana modül olan PRIME-RL, TOPLOC ve SHARDCAST'ı içerir.
02, Prime Intellect eğitim ana mekanizmalarının detaylı açıklaması
PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenimi Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile asenkron katılım için tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli adaptasyon nesnesi olarak benimser, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, her eğitim düğümünün yerel olarak bağımsız görev döngüsünü tamamlamasına olanak tanır ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile işbirliği yapar. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir zamanlamanın olmadığı bir ortamda esnek eğitimi gerçekleştirmek için daha uygundur, hem sistem karmaşıklığını azaltır hem de çoklu görevlerin paralel yürütülmesini ve strateji evrimini desteklemek için bir temel oluşturur.
TOPLOC:Ağırlıksız Eğitim Davranış Doğrulama Mekanizması
TOPLOC, Prime Intellect tarafından önerilen doğrulanabilirlik çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenip öğrenmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz; bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir ve güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir. Denetlenebilir ve teşvik edici merkeziyetsiz işbirliği eğitim ağları inşa etmek için uygulanabilir bir yol sunar.
SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan bir ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizmasını ve yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmadan sürekli olarak kısmi güncellemeler göndermesine olanak tanır, ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonlarının inşası için temel bir temeldir.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo konseptini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde sıkça karşılaşılan bant genişliği kısıtlılığı, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topluluk yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasına olanak tanımakta, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağı inşa etmenin kritik iletişim altyapılarından biri olmaktadır.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsiz AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir. OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güven gerektirmeyen işbirlikçi eğitim ağının "son bir kilometre" iletişim alt yapısını sağlamaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herhangi birinin görevlere katılmasını ve gerçek katkılara dayalı olarak ödüller kazanmasını sağlayan, izin gerektirmeyen, doğrulanabilir, ekonomik teşvik mekanizmalarına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol üzerine çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlamak
Eğitim düğümü: Yerel eğitim yürütme, ağırlık güncellemelerini gönderme ve gözlem izlerini takip etme
Doğrulama düğümü: TOPLOC mekanizmasını kullanarak eğitim davranışlarının gerçekliğini doğrulama ve ödül hesaplaması ile strateji birleştirmesine katılma.
Protokolün temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık toplama ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayınlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü; bu, asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri ile işbirliği yaparak eğitilen dünyanın ilk güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğümün işbirliği ile tamamlandı, tamamen asenkron bir mimari kullanıldı, eğitim süresi 400 saatten fazla sürdü ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını gösterdi. Bu model sadece bir performans atılımı değil, aynı zamanda Prime Intellect tarafından önerilen "eğitim, konsensüs demektir" paradigmalarının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, merkeziyetsiz eğitim ağının eğitim sürecini açık, doğrulayıcı ve ekonomik teşvik döngüsü ile ilk kez gerçekleştirdiğini göstermektedir.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
10 Likes
Reward
10
6
Share
Comment
0/400
GasFeeCrier
· 8h ago
Ah, bu AI'nin eğitilmesi için çok fazla Bilgi İşlem Gücü harcanmış olmalı.
View OriginalReply0
ChainMaskedRider
· 8h ago
Az konuş, bu tuzağı bozamazsın.
View OriginalReply0
GateUser-40edb63b
· 9h ago
Döngü delirdi mi?
View OriginalReply0
SillyWhale
· 9h ago
Buna merkeziyetsizlik denir mi? Bilgi İşlem Gücü demokratikleşmesi demekten daha iyi.
View OriginalReply0
TestnetScholar
· 9h ago
Tekel bilgi işlem gücü sorunun kaynağıdır.
View OriginalReply0
P2ENotWorking
· 9h ago
Ne işe yarar ki, yine büyük modeli bedavaya almak zorundayız.
Merkeziyetsizlik AI eğitimindeki atılım: Prime Intellect, iş birliği ağına yeni bir paradigmayı yönlendiriyor
Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları
AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketimi ve en yüksek teknik engel olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarma aşamasındaki hafif çağrılarla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir, bu da AI sistemlerinin inşasının gerçek "ağır sanayi" olduğunu gösterir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitim.
Merkeziyetsiz eğitim en yaygın geleneksel yöntemdir, tek bir kurum tarafından yerel yüksek performanslı küme içinde tüm eğitim süreçleri tamamlanır, donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri merkezi bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için çok uygundur ve yüksek verimlilik, kontrol edilebilir kaynaklar gibi avantajlara sahiptir, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da barındırır.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir; temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılıp işbirliği içinde gerçekleştirilmesi yatar ve bu, tek bir makinenin hesaplama ve depolama darboğazlarını aşmayı sağlar. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen zamanlama ve senkronizasyon ile çalışır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamında çalışır. NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, her alt görevi merkezi olarak koordine eder. Ana akım yöntemler şunları içerir:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını bir araya getirerek görevleri tamamlamasına benzer. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dirençli bir geleceği temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinator olmaksızın işbirliği içinde eğitim görevlerini tamamlar, genellikle görevi dağıtma ve işbirliği için protokoller tarafından yönlendirilir ve katkıların dürüstlüğünü sağlamak için kripto teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki gönüllülerin, her birinin hesap gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olarak kalmaktadır; sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulaması gibi birçok yönü içermektedir, ancak "eşgüdümlü etkin + dürüstlüğü teşvik eden + doğru sonuçlar" sağlanabilir mi, henüz erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını, model parametrelerinin merkezi bir şekilde toplanmasını vurgular ve gizlilik uyumuna önem veren senaryolar için uygundur. Federated öğrenme, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahipken, aynı zamanda Merkeziyetsizlik eğitiminin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında 'kontrollü Merkeziyetsizlik' çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve endüstri geçiş dağıtım yapısı olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim her görev türü için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimleri genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine bağımlıdır, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açık paylaşım yapamaz; işbirliği teşvik temeli olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturur.
Ancak bu, merkeziyetsizlik eğitiminin sahte bir kavram olduğu anlamına gelmez. Aslında, yapısal olarak hafif, paralel çalışması kolay ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir, bu nedenle P2P ağları, Swarm protokolü, dağıtık optimizatörler gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.
Merkeziyetsizlik eğitimi klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncü alanında, temsil niteliğine sahip blokzincir projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda oldukça fazla orijinal keşif önermekte, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise nispeten net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makalede, bu beş projenin arkasındaki temel teknoloji ve mühendislik mimarisinin detayları sırayla analiz edilecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da derinlemesine tartışılacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kararlıdır; böylece herkes eğitime katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, doğrulanabilirlik, açıklık ve teşvik mekanizması ile tam donanımlı bir AI merkeziyetsizlik eğitim sistemi oluşturmak için PRIME-RL + TOPLOC + SHARDCAST üç ana modülünü kullanmayı hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modülün değeri
Prime Intellect'in protokol yığını, sırasıyla asenkron eğitim, güvenilir doğrulama ve ağırlık yayılımı sorunlarını çözen üç ana modül olan PRIME-RL, TOPLOC ve SHARDCAST'ı içerir.
02, Prime Intellect eğitim ana mekanizmalarının detaylı açıklaması
PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenimi Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile asenkron katılım için tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli adaptasyon nesnesi olarak benimser, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, her eğitim düğümünün yerel olarak bağımsız görev döngüsünü tamamlamasına olanak tanır ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile işbirliği yapar. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir zamanlamanın olmadığı bir ortamda esnek eğitimi gerçekleştirmek için daha uygundur, hem sistem karmaşıklığını azaltır hem de çoklu görevlerin paralel yürütülmesini ve strateji evrimini desteklemek için bir temel oluşturur.
TOPLOC:Ağırlıksız Eğitim Davranış Doğrulama Mekanizması
TOPLOC, Prime Intellect tarafından önerilen doğrulanabilirlik çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenip öğrenmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz; bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir ve güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir. Denetlenebilir ve teşvik edici merkeziyetsiz işbirliği eğitim ağları inşa etmek için uygulanabilir bir yol sunar.
SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan bir ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizmasını ve yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmadan sürekli olarak kısmi güncellemeler göndermesine olanak tanır, ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonlarının inşası için temel bir temeldir.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo konseptini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde sıkça karşılaşılan bant genişliği kısıtlılığı, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topluluk yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasına olanak tanımakta, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağı inşa etmenin kritik iletişim altyapılarından biri olmaktadır.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsiz AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir. OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güven gerektirmeyen işbirlikçi eğitim ağının "son bir kilometre" iletişim alt yapısını sağlamaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herhangi birinin görevlere katılmasını ve gerçek katkılara dayalı olarak ödüller kazanmasını sağlayan, izin gerektirmeyen, doğrulanabilir, ekonomik teşvik mekanizmalarına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol üzerine çalışmaktadır:
Protokolün temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık toplama ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayınlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü; bu, asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri ile işbirliği yaparak eğitilen dünyanın ilk güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğümün işbirliği ile tamamlandı, tamamen asenkron bir mimari kullanıldı, eğitim süresi 400 saatten fazla sürdü ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını gösterdi. Bu model sadece bir performans atılımı değil, aynı zamanda Prime Intellect tarafından önerilen "eğitim, konsensüs demektir" paradigmalarının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, merkeziyetsiz eğitim ağının eğitim sürecini açık, doğrulayıcı ve ekonomik teşvik döngüsü ile ilk kez gerçekleştirdiğini göstermektedir.
Performans açısından