Jin10 données le 10 avril, aujourd'hui, le modèle de langage visuel léger open source Kimi-VL et Kimi-VL-Thinking de Moon's Dark Side a été lancé. Le nouveau modèle utilise une architecture MoE, prenant en charge un contexte de 128K, avec seulement environ 3 milliards de paramètres activés ; la capacité de raisonnement multimodal a dépassé les grands modèles de plus de 10 fois la taille dans plusieurs Benchmark.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Kimi Open Source modèle multimodal Kimi-VL, Kimi-VL-Thinking
Jin10 données le 10 avril, aujourd'hui, le modèle de langage visuel léger open source Kimi-VL et Kimi-VL-Thinking de Moon's Dark Side a été lancé. Le nouveau modèle utilise une architecture MoE, prenant en charge un contexte de 128K, avec seulement environ 3 milliards de paramètres activés ; la capacité de raisonnement multimodal a dépassé les grands modèles de plus de 10 fois la taille dans plusieurs Benchmark.