Результаты поиска для "QWEN"
23:03

Hugging Face Открытый исходный код顶级模型

Данные Jin10 9 июля, сегодня ночью, всемирно известная платформа открытого исходного кода для больших моделей Hugging Face открыла новый топовый малопараметрический модель SmolLM3. SmolLM3 имеет всего 3 миллиарда параметров, но его производительность значительно превосходит такие аналогичные открытые модели, как Llama-3.2-3B и Qwen2.5-3B. Имеет окно контекста 128k и поддерживает 6 языков: английский, французский, испанский, немецкий и другие. Поддерживает режимы глубокого мышления и немышления, пользователи могут гибко переключаться.
Больше
B1.51%
10:01

Алибаба сказал k, что будет обновление

QwQ-Max скоро будет выпущен в официальной версии под лицензией Apache 2.0, включая открытый исходный код QwQ-Max и Qwen2.5-Max, а также предоставляя более компактные версии, такие как QwQ-32B, которые могут быть развернуты на локальных устройствах. Параллельно с выпуском официальной версии QwQ-Max также будут выпущены приложения для Android и iOS.
Больше
MAX0.17%
APP7.38%
04:11

Команда Qwen от Alibaba представляет новую модель QwQ, которая покажет полную цепочку мыслей

Данные Jinshi 25 февраля сообщают, что команда Qwen Alibaba сегодня утром объявила в социальных сетях о выпуске новой модели вывода - Глубокое мышление (QwQ). Это модель вывода, основанная на Qwen2.5-Max, поддерживаемая QWQ-MAX-PREVIEW. Blue Whale News обнаружила, что аналогично DeepSeek
Больше
MAX0.17%
  • 2
  • 1
09:02

Loongson Zhongke: Процессор Loongson успешно запустил большую модель DeepSeek

Компания Loongson Zhongke успешно запустила модель DeepSeek R1 7B, оснащенную процессором Loongson No. 3, который обеспечивает локализованное развертывание с отличной производительностью и стоимостью, а также предоставит пользователям более быстрый, мощный и экономичный опыт обучения. Loongson работает с такими партнерами, как Taichu Yuanqi, Cambrian, Tiantian Zhixin, Computing Energy Technology, openEuler и т.д., чтобы создать платформу многоформного логического вывода для моделей серии DeepSeek.
Больше
  • 1
13:10

Цзинвэй Хэнжун: Компания развернула DeepSeek и Qwen

Jingwei Hengrun использует большие модели, такие как DeepSeek и Qwen, для разработки профессиональных приложений искусственного интеллекта, охватывающих множество областей, таких как интеллектуальная помощь, проектирование, тестирование, оптимизация продуктов и аналитика бизнес-процессов. Эти приложения повышают эффективность и качество работы и снижают затраты.
Больше
  • 3
  • 1
04:19
29 апреля компания Golden Ten Data сообщила, что компания Tongyi K Man впервые запустила модель параметров книнга Qwen1.5-110B, показав отличные результаты в самых длительных тестовых оценках, таких как MMLU, TheoremCA и GPQA. В настоящее время серия Qwen 1.5 накопила 10 больших моделей с открытым исходным кодом, а количество загрузок моделей Tongyi K с открытым исходным кодом превысило 7 миллионов.
23:02
Информационное агентство Jinse сообщает, что команда Али Qwen официально представила свои последние исследовательские результаты - крупнейшую языковую модель QwQ-32B, которая с помощью обучения с подкреплением достигла прорыва в производительности при объеме параметров всего лишь 1/21 DeepSeek-R1.
  • 1
  • 1
12:16

Четвертый парадигмы запускает решение для краевого вывода крупных моделей ModelHub AIoT

26 февраля Golden Ten Data узнала от 4Paradigm, что 4Paradigm запустила ModelHub AIoT, конечное решение для вывода крупномасштабных моделей, которое позволяет пользователям легко развертывать малогабаритные модели дистилляции, включая DeepSeek R1, Qwen 2.5, серию Llama 2/3 и т. д., на стороне устройства и осуществлять автономную работу. Пользователи могут гибко переключаться между несколькими моделями, принимая во внимание производительность сжатия и вывода моделей, а также решая сложность развертывания и оптимизации. По словам компании, это решение может не только удовлетворить потребности пользователей в конфиденциальности и режиме реального времени, но и значительно снизить стоимость вывода больших моделей ИИ.
Больше
09:58

Четвертая парадигма представляет решение интегрированного оборудования для больших моделей SageOne IA

Четвертая парадигма представляет интегрированный инференсный образец больших моделей SageOneIA, снижение стоимости инференции больших моделей. Технология пулования интеллектуальной вычислительной мощности интегрирована в решение одной машины, поддерживает несколько основных больших моделей, предприятие может переключаться между полным и дистиллированным моделями, увеличивая использование GPU на 30% и улучшая инференсную производительность в 5-10 раз.
Больше
11:29

Подключение DeepSeek к международному сайту AliExpress

Данные Jin10 на 12 февраля сообщают, что искусственный интеллект AliExpress уже подключен к большим моделям, таким как DeepSeek, и будет полностью применяться во всех ключевых сферах внешней торговли. После подключения искусственный интеллект будет более всесторонне учитывать намерения иностранных покупателей при автоматическом обслуживании, затем проводить Глубина рассмотрение на основе анализа рынка, опыта внешней торговли и конкретной ситуации товаров продавцов на AliExpress. Также известно, что AliExpress также тестирует универсальные вопросы Qwen
Больше
23:46

Майкрософт Открытый исходный код инновационной платформы: можно превратить DeepSeek в AI Agent

Майкрософт выпустил новую версию OmniParser V2.0, улучшив эффективность и точность искусственного интеллекта на компьютере, особенно в обнаружении мелких элементов пользовательского интерфейса и улучшении скорости рассуждений. Эта версия также значительно улучшила показатели в тестах Бенчмарк высокого разрешения Agent, достигнув удивительной точности 39.6%. Кроме того, Майкрософт также открыл исходный код ключевого инструмента omnitool для преобразования крупных моделей в Agent.
Больше
AGENT12.32%
GPT5.4%
  • 2
  • 4

Популярные темы

Больше

Крипто-календарь

Больше
zkLink отложит время разблокировки токенов инвесторов и команды на 6 месяцев. Расписание разблокировки, изначально запланированное на 22 января 2024 года для основной команды и консультантов DAO zkLink, будет перенесено на 22 июля 2025 года.
2025-07-22
Обновления проекта
Публичная бета-версия платформы Sahara AI Data Services будет запущена 22 июля, и любой желающий сможет участвовать в создании ИИ и получать реальные токены награды. Кроме того, платформа предоставит новые способы заработка и дополнительные стимулы от эксклюзивных партнеров, открываясь для всего мира.
2025-07-22
Обновления проекта
Срок подачи заявок на первый этап аирдропа Spark Ignition истекает 22 июля.
2025-07-22
Основные события
Рабочая группа по цифровым активам при Белом доме ожидает публикации первого отчета о шифровании 22 июля, который будет охватывать рекомендации по регулированию и законодательству, а также может касаться создания национального резерва цифровых активов и обеспечения справедливого доступа шифровых компаний к банковским услугам. Председатель Федеральной резервной системы (ФРС) Пауэлл выступит с речью на встрече по капитальным регуляциям 22 июля в 20:30 по пекинскому времени.
2025-07-22
Запуск продукта NFT AI
Nuls запустит продукт NFT AI в третьем квартале.
2025-07-22