Загрузка...

Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Показать фильтр
Разработчики
Показать все (69)
Входные данные
Исходящие данные
Поддерживаемые параметры
Показать все (18)
Скопировано в буфер обмена!
Qwen
131K

Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, объединяющая мощную генерацию текста с визуальным пониманием изображений и видео. Модель Thinking оптимизирована для мультимодального рассуждения в STEM и математике. Серия делает акцент на надежном восприятии (распознавание разнообразных реальных и синтетических категорий), пространственном понимании (привязка к 2D/3D) и долгосрочном визуальном понимании, демонстрируя конкурентоспособные результаты на публичных мультимодальных тестах как для восприятия, так и для рассуждения.

Помимо анализа, Qwen3-VL поддерживает агентное взаимодействие и использование инструментов: она может следовать сложным инструкциям в диалогах с несколькими изображениями и несколькими этапами; синхронизировать текст с временными шкалами видео для точных временных запросов; и управлять элементами графического интерфейса для автоматизации задач. Модели также поддерживают рабочие процессы визуального кодирования, превращая эскизы или макеты в код и помогая с отладкой интерфейса, сохраняя при этом высокую производительность только на текстовом уровне, сравнимую с флагманскими языковыми моделями Qwen3. Это делает Qwen3-VL подходящей для производственных сценариев, охватывающих документальный ИИ, многоязычный OCR, помощь с программным обеспечением/интерфейсом, пространственные/воплощенные задачи и исследования агентов, работающих с видением и языком.

Входные данные:
24 ₽ / 1M
Текст
Изображения
Исходящие данные:
242 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
24 ₽
Исходящие токены за 1M:
242 ₽
Скопировано в буфер обмена!
Qwen
262K

Qwen3-VL-235B-A22B Instruct — это многомодальная модель с открытыми весами, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Instruct нацелена на общее использование в области зрения и языка (VQA, разбор документов, извлечение данных из диаграмм/таблиц, многоязычный OCR). Серия подчеркивает надежное восприятие (распознавание разнообразных реальных и синтетических категорий), пространственное понимание (2D/3D привязка) и долгосрочное визуальное понимание, демонстрируя конкурентоспособные результаты на публичных многомодальных тестах как в восприятии, так и в рассуждении.

Помимо анализа, Qwen3-VL поддерживает агентное взаимодействие и использование инструментов: она может следовать сложным инструкциям в диалогах с несколькими изображениями и несколькими этапами; выравнивать текст с временными шкалами видео для точных временных запросов; и управлять элементами графического интерфейса для автоматизации задач. Модели также позволяют выполнять визуальные рабочие процессы кодирования — превращать эскизы или макеты в код и помогать с отладкой пользовательского интерфейса — при этом сохраняя сильную производительность только на текстах, сопоставимую с флагманскими языковыми моделями Qwen3. Это делает Qwen3-VL подходящей для производственных сценариев, охватывающих документальный ИИ, многоязычный OCR, помощь в программном обеспечении/пользовательском интерфейсе, пространственные/воплощенные задачи и исследования агентов в области зрения и языка.

Входные данные:
18 ₽ / 1M
Текст
Изображения
Исходящие данные:
81 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
18 ₽
Исходящие токены за 1M:
81 ₽
Скопировано в буфер обмена!
Qwen
262K

Qwen3-Max — это обновленная версия, основанная на серии Qwen3, предлагающая значительные улучшения в области рассуждений, следования инструкциям, поддержки многоязычности и охвата знаний по редким темам по сравнению с версией января 2025 года. Она обеспечивает более высокую точность в задачах по математике, программированию, логике и наукам, более надежно следует сложным инструкциям на китайском и английском языках, снижает количество галлюцинаций и производит более качественные ответы для открытых вопросов, написания и общения. Модель поддерживает более 100 языков с улучшенным переводом и здравым смыслом в рассуждениях и оптимизирована для генерации с дополнением извлечением (RAG) и вызова инструментов, хотя не включает в себя специальный режим “мышления”.

Входные данные:
72 ₽ / 1M
Текст
Исходящие данные:
363 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
72 ₽
Исходящие токены за 1M:
363 ₽
Скопировано в буфер обмена!
Qwen
1M

Qwen3 Coder Plus — это собственная версия Alibaba на основе Open Source Qwen3 Coder 480B A35B. Это мощная модель программирования, специализирующаяся на автономном программировании с использованием вызова инструментов и взаимодействия с окружающей средой, сочетая в себе навыки программирования с универсальными возможностями общего назначения.

Входные данные:
60 ₽ / 1M
Текст
Исходящие данные:
302 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
60 ₽
Исходящие токены за 1M:
302 ₽
Скопировано в буфер обмена!
OpenAI
400K

GPT-5-Codex — это специализированная версия GPT-5, оптимизированная для программной инженерии и рабочих процессов кодирования. Она предназначена как для интерактивных сессий разработки, так и для длительного, независимого выполнения сложных инженерных задач. Модель поддерживает создание проектов с нуля, разработку функций, отладку, крупномасштабное рефакторинг и обзор кода. По сравнению с GPT-5, Codex более управляем, строго следует инструкциям разработчика и производит более чистый и качественный код. Усилия по рассуждению можно регулировать с помощью параметра reasoning.effort.

Codex интегрируется в среды разработчиков, включая CLI, расширения IDE, GitHub и облачные задачи. Он динамически адаптирует усилия по рассуждению — предоставляя быстрые ответы для небольших задач и поддерживая длительные многочасовые запуски для крупных проектов. Модель обучена выполнять структурированные обзоры кода, выявляя критические недостатки путем анализа зависимостей и проверки поведения на основе тестов. Она также поддерживает мультимодальные входные данные, такие как изображения или скриншоты для разработки пользовательского интерфейса, и интегрирует использование инструментов для поиска, установки зависимостей и настройки окружения. Codex предназначен специально для агентных приложений кодирования.

Входные данные:
116 ₽ / 1M
Текст
Изображения
Исходящие данные:
931 ₽ / 1M
Текст
Контекст:
400K
Входящие токены за 1M:
116 ₽
Исходящие токены за 1M:
931 ₽
Скопировано в буфер обмена!
DeepSeek
164K

DeepSeek-V3.1 Terminus — это обновление для DeepSeek V3.1, которое сохраняет исходные возможности модели, устраняя при этом проблемы, о которых сообщали пользователи, включая языковую согласованность и возможности агентов, и дополнительно оптимизирует производительность модели в кодировании и поисковых агентах. Это крупная гибридная модель рассуждений (671 миллиардов параметров, 37 миллиардов активных), поддерживающая как режимы мышления, так и немышления. Она расширяет базу DeepSeek-V3 с помощью двухфазного процесса обучения на длинных контекстах, достигая до 128 тысяч токенов, и использует микромасштабирование FP8 для эффективного вывода. Пользователи могут управлять поведением рассуждений с помощью булевой переменной reasoning enabled.

Модель улучшает использование инструментов, генерацию кода и эффективность рассуждений, достигая производительности, сопоставимой с DeepSeek-R1 на сложных контрольных тестах, при этом отвечая быстрее. Она поддерживает структурированные вызовы инструментов, кодовые агенты и поисковые агенты, что делает её подходящей для исследований, кодирования и агентных рабочих процессов.

Входные данные:
25 ₽ / 1M
Текст
Исходящие данные:
88 ₽ / 1M
Текст
Контекст:
164K
Входящие токены за 1M:
25 ₽
Исходящие токены за 1M:
88 ₽
Скопировано в буфер обмена!
DeepSeek
164K

DeepSeek-V3.1 Terminus — это обновление для DeepSeek V3.1, которое сохраняет изначальные возможности модели, устраняя при этом проблемы, о которых сообщали пользователи, включая языковую согласованность и возможности агентов, и дополнительно оптимизирует производительность модели в кодировании и поисковых агентах. Это крупная гибридная модель рассуждений (671 миллиард параметров, 37 миллиардов активных), поддерживающая как режимы мышления, так и немышления. Она расширяет базу DeepSeek-V3 с помощью двухфазного процесса обучения с длинным контекстом, достигая до 128 тысяч токенов, и использует FP8 микромасштабирование для эффективного вывода. Пользователи могут управлять поведением рассуждений с помощью булевой переменной reasoning enabled.

Модель улучшает использование инструментов, генерацию кода и эффективность рассуждений, достигая производительности, сопоставимой с DeepSeek-R1 на сложных тестах, при этом отвечая быстрее. Она поддерживает структурированные вызовы инструментов, кодовые агенты и поисковые агенты, что делает её подходящей для исследований, кодирования и агентных рабочих процессов.

Входные данные:
25 ₽ / 1M
Текст
Исходящие данные:
88 ₽ / 1M
Текст
Контекст:
164K
Входящие токены за 1M:
25 ₽
Исходящие токены за 1M:
88 ₽
Скопировано в буфер обмена!
Qwen
1M

Qwen3 Coder Flash — это быстрая и экономичная версия проприетарной модели Qwen3 Coder Plus от Alibaba. Это мощная модель кодирования, специализирующаяся на автономном программировании через вызов инструментов и взаимодействие с окружением, сочетая навыки кодирования с универсальными способностями общего назначения.

Входные данные:
18 ₽ / 1M
Текст
Исходящие данные:
90 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
18 ₽
Исходящие токены за 1M:
90 ₽
Скопировано в буфер обмена!
Qwen
262K

Qwen3-Next-80B-A3B-Thinking — это модель чата, ориентированная на рассуждения, в линейке Qwen3-Next, которая по умолчанию выводит структурированные следы “мышления”. Она разработана для сложных многошаговых задач: математических доказательств, синтеза/отладки кода, логики и агентного планирования, и демонстрирует высокие результаты в областях знаний, рассуждений, кодирования, согласования и многоязычных оценок. По сравнению с предыдущими вариантами Qwen3, она акцентирует внимание на стабильности при длинных цепочках размышлений и эффективном масштабировании во время вывода, а также настроена на выполнение сложных инструкций с уменьшением повторяющегося или нецелевого поведения.

Модель подходит для агентных фреймворков и использования инструментов (вызов функций), рабочих процессов с интенсивным извлечением данных и стандартизированных тестов, где требуются пошаговые решения. Она поддерживает длинные, детализированные завершения и использует ориентированные на пропускную способность техники (например, предсказание нескольких токенов) для более быстрого генерации. Обратите внимание, что она работает только в режиме мышления.

Входные данные:
9 ₽ / 1M
Текст
Исходящие данные:
72 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
9 ₽
Исходящие токены за 1M:
72 ₽
Скопировано в буфер обмена!
Qwen
262K

Qwen3-Next-80B-A3B-Instruct — это модель чата, настроенная на выполнение инструкций в серии Qwen3-Next, оптимизированная для быстрого и стабильного ответа без следов “размышлений”. Она нацелена на выполнение сложных задач в областях рассуждений, генерации кода, вопросов и ответов на основе знаний, а также многоязычного использования, оставаясь при этом надежной в отношении согласованности и форматирования. В сравнении с предыдущими вариантами инструкций Qwen3, она сосредоточена на более высокой пропускной способности и стабильности при обработке сверхдлинных вводов и многоходовых диалогов, что делает её хорошо подходящей для RAG, использования инструментов и агентных рабочих процессов, требующих последовательных окончательных ответов, а не видимой цепочки размышлений.

Модель использует масштабно-эффективное обучение и декодирование для улучшения эффективности параметров и скорости вывода, и была проверена на широком наборе публичных эталонов, где она достигает или приближается к более крупным системам Qwen3 в нескольких категориях, превосходя более ранние средние базовые показатели. Она лучше всего используется в качестве общего помощника, помощника по коду и решателя задач с длинным контекстом в производственных условиях, где предпочтительны детерминированные, следующие инструкциям выводы.

Входные данные:
9 ₽ / 1M
Текст
Исходящие данные:
72 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
9 ₽
Исходящие токены за 1M:
72 ₽
Скопировано в буфер обмена!
Qwen
1M

Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.

Входные данные:
24 ₽ / 1M
Текст
Исходящие данные:
72 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
24 ₽
Исходящие токены за 1M:
72 ₽
Скопировано в буфер обмена!
Qwen
1M

Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.

Входные данные:
24 ₽ / 1M
Текст
Исходящие данные:
72 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
24 ₽
Исходящие токены за 1M:
72 ₽
Скопировано в буфер обмена!
NVIDIA
131K

NVIDIA-Nemotron-Nano-9B-v2 — это крупная языковая модель (LLM), разработанная с нуля компанией NVIDIA и предназначенная как для задач, требующих рассуждений, так и для задач, не требующих их. Она отвечает на запросы и задачи пользователей, сначала генерируя цепочку рассуждений, а затем завершая окончательным ответом.

Способности модели к рассуждению могут быть управляемы с помощью системной подсказки. Если пользователь предпочитает, чтобы модель предоставляла окончательный ответ без промежуточных цепочек рассуждений, её можно настроить соответствующим образом.

Входные данные:
3,73 ₽ / 1M
Текст
Исходящие данные:
14 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
3,73 ₽
Исходящие токены за 1M:
14 ₽
Скопировано в буфер обмена!
Moonshot AI
262K

Kimi K2 0905 — это обновление за сентябрь Kimi K2 0711. Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим числом параметров в 1 триллион и 32 миллиардами активных параметров на каждый проход. Она поддерживает инференс с длинным контекстом до 256 тысяч токенов, что является расширением по сравнению с предыдущими 128 тысячами.

Это обновление улучшает агентное кодирование с более высокой точностью и лучшей обобщаемостью на различных структурах, а также улучшает фронтенд-кодирование с более эстетичными и функциональными результатами для веб, 3D и связанных задач. Kimi K2 оптимизирована для агентных возможностей, включая продвинутое использование инструментов, рассуждение и синтез кода. Она превосходит в кодировании (LiveCodeBench, SWE-bench), рассуждении (ZebraLogic, GPQA) и использовании инструментов (Tau2, AceBench). Модель обучена с использованием новой стекировки, включающей оптимизатор MuonClip для стабильного крупномасштабного обучения MoE.

Входные данные:
55 ₽ / 1M
Текст
Исходящие данные:
232 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
55 ₽
Исходящие токены за 1M:
232 ₽
Скопировано в буфер обмена!
Moonshot AI
262K

Kimi K2 0905 — это сентябрьское обновление Kimi K2 0711. Это крупномасштабная языковая модель типа Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим числом параметров в 1 триллион и 32 миллиардами активных параметров на каждый прямой проход. Она поддерживает вывод с длинным контекстом до 256 тысяч токенов, что больше по сравнению с предыдущими 128 тысячами.

Это обновление улучшает агентное кодирование с более высокой точностью и лучшей обобщаемостью по различным шаблонам, а также улучшает фронтенд-кодирование с более эстетичными и функциональными результатами для веб, 3D и связанных задач. Kimi K2 оптимизирована для агентных возможностей, включая продвинутое использование инструментов, рассуждение и синтез кода. Она превосходит в кодировании (LiveCodeBench, SWE-bench), рассуждении (ZebraLogic, GPQA) и использовании инструментов (Tau2, AceBench) по различным тестам. Модель обучена с использованием новой стеки, включающей оптимизатор MuonClip для стабильного крупномасштабного обучения MoE.

Входные данные:
55 ₽ / 1M
Текст
Исходящие данные:
232 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
55 ₽
Исходящие токены за 1M:
232 ₽