Çin AI, önde gelen teknolojik duruşu zorlayan DeepSeek R1 modelini piyasaya sürdü.

robot
Abstract generation in progress

Çin AI laboratuvarı DeepSeek yakın zamanda Açık Kaynak çıkarım modeli DeepSeek-R1'i piyasaya sürdü ve endüstride geniş çaplı takip etme yol açtı. Bu model "çıkarım modeli" olarak adlandırıldı ve bazı AI Benchmark testlerinde, performansının OpenAI'in o1'ine eşit olduğu iddia ediliyor. R1, AI geliştirme platformu Hugging Face aracılığıyla MIT lisansı ile yayınlandı ve kullanıcılar sınırsız koşullarda ticari olarak kullanabilirler.

DeepSeek, R1'in AIME, MATH-500 ve SWE-bench Verified dahil olmak üzere birkaç benchmark testinde o1'i geride bıraktığını iddia ediyor. AIME, başka modeller kullanarak çıkarım yeteneğini değerlendirmek için kullanılır, MATH-500 metin sorularına odaklanırken, SWE-bench Verified ise programlama görevlerini test eder.

R1 model avantajlara sahip, ancak siyasi sınırlamalara tabi.

İddia edildiğine göre, R1, bir çeşit zeka modeli olarak benzersiz bir öz-denetim yeteneğine sahiptir, bu da onu fizik, bilim ve matematik gibi alanlarda geleneksel modellere göre daha güvenilir kılar. Zeka modelleri genellikle daha uzun hesaplama süreleri gerektirse de (birkaç saniyeden birkaç dakikaya) kadar, karmaşık problemlerin çözümü için yüksek doğruluklarıyla büyük avantaj sağlar.

Teknik rapor, R1'in birçok mevcut modele kıyasla 671 milyar parametre içerdiğini belirtiyor. Parametre sayısı genellikle modelin çözme yeteneğiyle orantılıdır, bu da R1'i büyük ölçekli bir model haline getirir. Bununla birlikte,

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin