2025-08-01 23:22:59

Estamos entusiasmados por compartilhar os resultados da nossa colaboração com a SGLang. 🎉

Juntos, otimizámos a inferência do DeepSeek R1 para implementação no GB200 NVL72—oferecendo um aumento de 2x e 3x por GPU em comparação com clusters H100 quase duas vezes maiores.

É assim que parece a inferência MoE de fronteira.

DEEPSEEK-3.11%

LOOKS-0.61%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

8 gostos

Recompensa
8
6
Partilhar

Comentar

0/400

WhaleWatcher

· 19h atrás

A performance dobrou, incrível!

Ver originalResponder0

Rugpull幸存者

· 19h atrás

Está a falar de desempenho novamente, certo?

Ver originalResponder0

OnChainDetective

· 19h atrás

hum, tracei essas métricas de gpu... algo não está batendo aqui

Ver originalResponder0

MetaverseVagabond

· 19h atrás

Caramba, finalmente consegui fazer o H100!

Ver originalResponder0

ClassicDumpster

· 19h atrás

又跟着Até à lua了吧

Ver originalResponder0

WhaleMinion

· 19h atrás

O desempenho da GPU explodiu.

Ver originalResponder0

Tópico
1/3
1CandyDrop Airdrop Event 6.0
53k Popularidade
2White House Crypto Report
51k Popularidade
3Join Alpha RION Airdrop to Earn $40
38k Popularidade
4Fed Holds Rates Decision
9k Popularidade
5July Spark Program TOP 10 Creators Announced
3k Popularidade

Pino