"QWEN"検索結果

Hugging Faceのオープンソースの最高級モデル

Jin10データ7月9日讯、今朝、世界的に有名な大規模モデルオープンプラットフォームHugging Faceがオープンソース化された、トップクラスの小型パラメータモデルSmolLM3。SmolLM3は30億のパラメータしか持たないが、その性能はLlama-3.2-3B、Qwen2.5-3Bなどの同類オープンソースモデルを大幅に上回っている。128kのコンテキストウィンドウを持ち、英語、フランス語、スペイン語、ドイツ語など6つの言語をサポートしている。デプス思考と非思考の二重推論モードをサポートし、ユーザーは柔軟に切り替えることができる。
もっと

MiniMaxオープンソース初の推論モデル:DeepSeekに対抗し、コンピューティングパワーコストは約53万ドル

Gate Newsのボット、MiniMaxは6月17日、重要なアップデートを5日連続でリリースすると発表しました。 本日の第一弾は、初のオープンソース推論モデルMiniMax-M1です。 公式レポートによると、MiniMax-M1は複数のベンチマークでDeepSeek-R1やQwen3などのオープンソースモデルに匹敵し、最も先進的な海外モデルに近いとのこと。 公式ブログでは、2つの主要な技術革新に基づいて、MiniMax-M1のトレーニングプロセスは「期待を超えていた」と述べており、強化学習のトレーニングステージを完了するのに3週間と512個のH800 GPUしかかからず、コンピューティングパワーのレンタルコストはわずか534,700米ドルでした。
もっと

Ali Tongyiは、新しい

QwQ-Maxは間もなく正式版がリリースされ、Apache 2.0ライセンスの下でオープンソースのQwQ-MaxおよびQwen2.5-Maxが提供され、QwQ-32Bなどのより小さなバージョンもローカルデバイスに展開できます。公式のQwQ-Maxと同時に、AndroidおよびiOSアプリもリリースされます。
もっと

阿里Qwen团队が新しい推論モデルQwQをリリースし、完全な思考チェーンを表示します

金十データ2月25日、アリQwenチームは、今日早朝、ソーシャルメディアで新しい推論モデル、デプス思考(QwQ)のリリースを発表しました。これは、QWQ-MAX-PREVIEWのサポートを受けて、Qwen2.5-Maxに基づく推論モデルです。BlueWhale Newsによると、DeepSeekに似た
もっと
  • 2
  • 1

Alibaba Tongyiのオープンソースオーディオ言語モデルであるQwen2-AudioがACL 2024に選ばれました

金十データ8月13日のニュースによると、アリババは通義大モデルを引き続きオープンソース化し、Qwen2シリーズオープンソースファミリーに音声言語モデルQwen2-Audioを追加しました。Qwen2-Audioはテキスト入力なしで直接音声での質問応答が可能で、ユーザーの音声信号(会話、自然音、音楽など)を理解し分析します。このモデルは複数の権威ある評価で以前の最高モデルを大幅に上回っています。通義チームはさらに新しいオーディオ理解モデルのベンチマークテストを同時に発表し、関連論文は今週開催されている国際会議ACL2024に採択されました。
もっと
  • 3

$FLOCKはqwenとの戦略的コラボレーションを発表した後、52%以上の増加を記録しました。

Gate.io ニュース
もっと
  • 1

龙芯中科:龙芯プロセッサーはDeepSeekの大規模モデルを正常に実行しました

龍芯科技は龍芯3号CPUを搭載したDeepSeek R1 7Bモデルのローカル展開に成功し、優れた性能と優れたコストパフォーマンスを実現し、ユーザーにより高速でより強力でより節約されたトレーニングおよび推論体験を提供します。龍芯は太初元碁、寒武紀、天数智芯、算能科技、openEulerなどのパートナーと連携し、DeepSeekシリーズモデルの多様な推論プラットフォームを全力で構築しています。
もっと
  • 1

Jingwei Hengrun:同社はDeepSeekとQwenを展開しました

Jingwei Hengrunは、DeepSeekやQwenなどの大規模モデルを使用して、インテリジェントアシスタンス、設計、テスト、製品最適化、ビジネスプロセスインテリジェンスなどの複数の分野をカバーするプロフェッショナルなAIアプリケーションを開発しています。 これらのアプリケーションは、作業効率と品質を向上させ、コストを削減します。
もっと
  • 3
  • 1
Golden Ten Dataは4月29日、Tongyi K ManがkningパラメータモデルQwen1.5-110Bを初めて発売し、MMLU、TheoremQA、GPQAなどの最長ベンチマーク評価で優れた性能を示したと報告した。 現在、Qwen 1.5シリーズは10のオープンソース大規模モデルを蓄積しており、Tongyi K オープンソースモデルのダウンロード数は700万を超えています。
金色财经によると、アリババのQwenチームは、最新の研究成果であるQwQ-32B言語モデルを正式に発表しました。QwQ-32Bは、DeepSeek-R1のわずか1/21のパラメータ量で、強化学習を使用して性能を飛躍的に向上させました。
  • 1
  • 1

4Paradigmは、大規模モデル推論のためのエンドツーエンドソリューションであるModelHub AIoTを発表しました

金十データ2月26日、第四パラダイムからの情報によると、同社はAIoT向けの大規模モデル推論エッジソリューションModelHubを発表しました。ユーザーはDeepSeek R1、Qwen 2.5、Llama 2/3シリーズなどの小型蒸留モデルを端末に簡単に展開し、オフラインで実行できます。ユーザーは複数のモデル間を柔軟に切り替えることができ、モデルの圧縮と推論パフォーマンスの両立を実現し、展開と最適化の複雑さを解消しました。同社によれば、このソリューションはユーザーのプライバシーとリアルタイム性の要求を満たすだけでなく、AI大規模モデルの推論コストを大幅にドロップしました。
もっと

第四范式は、大規模モデル推論一体機ソリューションSageOne IAを発売しました

第四范式は、SageOneIAという大規模モデル推論一体機を発売し、大規模モデル推論コストをドロップします。インテリジェントなコンピューティングパワープール技術が一体化されたソリューションで、複数の主要な大規模モデルをサポートし、企業はフルバージョンとディスティルモデルの間を切り替えることができます。GPU利用率が30%以上向上し、推論パフォーマンスが5〜10倍向上します。
もっと

アリエクスプレスはDeepSeekの大規模モデルを導入します

金十データ2月12日、アリババグループの国際サイトAIはDeepSeekなどの大規模モデルに接続され、輸出ビジネスのさまざまな核心部分に全面的に活用される予定です。接続後、AIは海外顧客を自動的に受け入れる際に、購入者の意図をより包括的に考慮し、アリババグループの国際サイト上の市場洞察、輸出の経験、商人の商品の状況などをデプス推論に結び付けます。また、アリババグループの国際サイトでは、通義千問Qwenのテストも行われていることが分かりました。
もっと

マイクロソフトオープンソースイノベーションフレームワーク:DeepSeekをAIエージェントに変換可能

マイクロソフトは、OmniParserの最新バージョンV2.0をリリースし、AI Agentのコンピュータ上での効率と精度が向上しました、特に小さなUI要素の検出と推論速度の向上が顕著です。このバージョンは、高解像度Agentベンチマークテストで大幅に向上し、驚異的な39.6%の精度を達成しました。さらに、マイクロソフトは大規模モデルをAgentに変換するための重要なツールであるomnitoolをオープンソース化しました。
もっと
  • 2
  • 4