Çin AI, önde gelen teknolojik duruşu zorlayan DeepSeek R1 modelini piyasaya sürdü.

2025-01-26 08:25:35

Abstract generation in progress

Çin AI laboratuvarı DeepSeek yakın zamanda Açık Kaynak çıkarım modeli DeepSeek-R1'i piyasaya sürdü ve endüstride geniş çaplı takip etme yol açtı. Bu model "çıkarım modeli" olarak adlandırıldı ve bazı AI Benchmark testlerinde, performansının OpenAI'in o1'ine eşit olduğu iddia ediliyor. R1, AI geliştirme platformu Hugging Face aracılığıyla MIT lisansı ile yayınlandı ve kullanıcılar sınırsız koşullarda ticari olarak kullanabilirler.

DeepSeek, R1'in AIME, MATH-500 ve SWE-bench Verified dahil olmak üzere birkaç benchmark testinde o1'i geride bıraktığını iddia ediyor. AIME, başka modeller kullanarak çıkarım yeteneğini değerlendirmek için kullanılır, MATH-500 metin sorularına odaklanırken, SWE-bench Verified ise programlama görevlerini test eder.

R1 model avantajlara sahip, ancak siyasi sınırlamalara tabi.

İddia edildiğine göre, R1, bir çeşit zeka modeli olarak benzersiz bir öz-denetim yeteneğine sahiptir, bu da onu fizik, bilim ve matematik gibi alanlarda geleneksel modellere göre daha güvenilir kılar. Zeka modelleri genellikle daha uzun hesaplama süreleri gerektirse de (birkaç saniyeden birkaç dakikaya) kadar, karmaşık problemlerin çözümü için yüksek doğruluklarıyla büyük avantaj sağlar.

Teknik rapor, R1'in birçok mevcut modele kıyasla 671 milyar parametre içerdiğini belirtiyor. Parametre sayısı genellikle modelin çözme yeteneğiyle orantılıdır, bu da R1'i büyük ölçekli bir model haline getirir. Bununla birlikte,

MATH-4.05%

View Original

The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
#PI#
252k posts
#BTC#
242k posts
#ETH#
156k posts
4#GateioInto11#
81k posts
5#ContentStar#
67k posts
6#GT#
66k posts
7#BOME#
61k posts
8#DOGE#
60k posts
9#MAGA#
53k posts
10#SLERF#
51k posts

sitemap