2025-08-01 23:22:59

Kami sangat senang untuk membagikan hasil kolaborasi kami dengan SGLang. 🎉

Bersama-sama, kami mengoptimalkan inferensi DeepSeek R1 untuk penyebaran di GB200 NVL72—memberikan peningkatan 2x dan 3x per GPU dibandingkan dengan kluster H100 yang hampir dua kali lipat ukuran.

Inilah seperti apa inferensi MoE perbatasan.

DEEPSEEK-4.72%

LOOKS1.92%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

8 Suka

Hadiah
8
6
Bagikan

Komentar

0/400

WhaleWatcher

· 14jam yang lalu

Kinerja meningkat dua kali lipat, luar biasa!

Lihat AsliBalas0

Rugpull幸存者

· 14jam yang lalu

Jadi, kamu sedang membahas performa lagi, ya?

Lihat AsliBalas0

OnChainDetective

· 14jam yang lalu

hmm melacak metrik gpu itu... ada yang tidak sesuai di sini

Lihat AsliBalas0

MetaverseVagabond

· 14jam yang lalu

Wah, akhirnya bisa mengalahkan H100!

Lihat AsliBalas0

ClassicDumpster

· 14jam yang lalu

又跟着To da moon了吧

Lihat AsliBalas0

WhaleMinion

· 14jam yang lalu

Kinerja GPU meledak.

Lihat AsliBalas0

Topik
1/3
1CandyDrop Airdrop Event 6.0
41k Popularitas
2White House Crypto Report
45k Popularitas
3Join Alpha RION Airdrop to Earn $40
29k Popularitas
4Fed Holds Rates Decision
9k Popularitas
5July Spark Program TOP 10 Creators Announced
2k Popularitas

Sematkan

peta situs