Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Qwen

262K

Qwen3-235B-A22B-Instruct-2507 — это многоязычная языковая модель с настройкой на выполнение инструкций, основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров на каждый проход вперед. Она оптимизирована для генерации текста общего назначения, включая следование инструкциям, логическое рассуждение, математику, код и использование инструментов. Модель поддерживает нативную длину контекста в 262 тысячи и не реализует “режим мышления” ( блоки).

По сравнению с базовым вариантом, эта версия обеспечивает значительные улучшения в охвате знаний, рассуждениях на длинных контекстах, оценках кодирования и согласованности с открытыми задачами. Она особенно сильна в многоязычном понимании, математических рассуждениях (например, AIME, HMMT) и оценках согласованности, таких как Arena-Hard и WritingBench.

Входные данные:

6 ₽ / 1M

Текст

Исходящие данные:

9 ₽ / 1M

Текст

Контекст:

262K

Входящие токены за 1M:

6 ₽

Исходящие токены за 1M:

9 ₽

Чат Детали

MoonshotAI Kimi K2 0711

Moonshot AI

131K

Kimi K2 Instruct — это крупномасштабная языковая модель с архитектурой Mixture-of-Experts (MoE), разработанная компанией Moonshot AI, с общим числом параметров в 1 триллион и 32 миллиарда активных параметров на каждый проход. Она оптимизирована для агентных возможностей, включая продвинутое использование инструментов, рассуждение и синтез кода. Kimi K2 превосходит по многим критериям, особенно в области кодирования (LiveCodeBench, SWE-bench), рассуждений (ZebraLogic, GPQA) и использования инструментов (Tau2, AceBench). Она поддерживает вывод в длинном контексте до 128 тысяч токенов и разработана с использованием новой обучающей архитектуры, включающей оптимизатор MuonClip для стабильного крупномасштабного обучения MoE.

Входные данные:

53 ₽ / 1M

Текст

Исходящие данные:

214 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

53 ₽

Исходящие токены за 1M:

214 ₽

Чат Детали

Mistral Devstral Medium

Mistral AI

131K

Devstral Medium — это высокопроизводительная модель генерации кода и агентного мышления, разработанная совместно Mistral AI и All Hands AI. Она позиционируется как шаг вперед по сравнению с Devstral Small и достигает 61,6% на SWE-Bench Verified, опережая Gemini 2.5 Pro и GPT-4.1 в задачах, связанных с кодом, при значительно меньших затратах. Модель предназначена для обобщения различных стилей запросов и использования инструментов в кодовых агентах и фреймворках.

Devstral Medium доступна только через API (без открытых весов) и поддерживает корпоративное развертывание на частной инфраструктуре с возможностью дополнительной настройки.

Входные данные:

37 ₽ / 1M

Текст

Файл

Исходящие данные:

186 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

37 ₽

Исходящие токены за 1M:

186 ₽

Чат Детали

Mistral Devstral Small 1.1

Mistral AI

131K

Devstral Small 1.1 — это языковая модель с открытыми весами для агентов в области программной инженерии, содержащая 24 миллиарда параметров, разработанная Mistral AI в сотрудничестве с All Hands AI. Модель доработана на основе Mistral Small 3.1 и выпущена под лицензией Apache 2.0. Она обладает контекстным окном в 128 тысяч токенов и поддерживает как вызовы функций в стиле Mistral, так и форматы вывода XML.

Разработанная для агентных рабочих процессов кодирования, Devstral Small 1.1 оптимизирована для таких задач, как исследование кодовой базы, редактирование нескольких файлов и интеграция в автономные агенты разработки, такие как OpenHands и Cline. Она достигает 53,6% на SWE-Bench Verified, превосходя все другие открытые модели на этом бенчмарке, оставаясь при этом достаточно легкой для работы на одном GPU 4090 или машине с чипом Apple. Модель использует токенизатор Tekken с вокабуляром в 131 тысячу и может быть развернута через vLLM, Transformers, Ollama, LM Studio и другие среды, совместимые с OpenAI.

Входные данные:

9 ₽ / 1M

Текст

Файл

Исходящие данные:

27 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

27 ₽

Чат Детали

Tencent Hunyuan A13B Instruct

Tencent

131K

Hunyuan-A13B — это языковая модель Mixture-of-Experts (MoE) с 13 миллиардами активных параметров, разработанная компанией Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует конкурентоспособные результаты в тестах по математике, науке, программированию и задачам многократного рассуждения, сохраняя при этом высокую эффективность вывода благодаря Grouped Query Attention (GQA) и поддержке квантования (FP8, GPTQ и др.).

Входные данные:

13 ₽ / 1M

Текст

Исходящие данные:

53 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

13 ₽

Исходящие токены за 1M:

53 ₽

Чат Детали

Morph Morph V3 Large

Morph

262K

Модель Morph с высокой точностью для сложных изменений кода. ~4,500 токенов/сек с точностью 98% для точных преобразований кода.

Модель требует, чтобы запрос был в следующем формате:

{инструкция}

{исходный_код}

{фрагмент_изменения}

Функция нулевого сохранения данных включена для Morph. Узнайте больше об этой модели в их документации

Входные данные:

83 ₽ / 1M

Текст

Исходящие данные:

177 ₽ / 1M

Текст

Контекст:

262K

Входящие токены за 1M:

83 ₽

Исходящие токены за 1M:

177 ₽

Чат Детали

Morph Morph V3 Fast

Morph

82K

Самая быстрая модель Morph для применения изменений в коде. ~10,500 токенов/сек с точностью 96% для быстрых преобразований кода.

Модель требует, чтобы запрос был в следующем формате:

{инструкция}

{исходный_код}

{фрагмент_изменений}

Функция нулевого сохранения данных включена для Morph. Узнайте больше об этой модели в их документации

Входные данные:

74 ₽ / 1M

Текст

Исходящие данные:

111 ₽ / 1M

Текст

Контекст:

82K

Входящие токены за 1M:

74 ₽

Исходящие токены за 1M:

111 ₽

Чат Детали

Baidu ERNIE 4.5 VL 424B A47B

Baidu

131K

ERNIE-4.5-VL-424B-A47B — это мультимодальная модель типа Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, имеющая 424 миллиарда общих параметров с 47 миллиардами активных на каждый токен. Она обучена совместно на текстовых и изображенческих данных с использованием гетерогенной архитектуры MoE и маршрутизации, изолированной по модальностям, что позволяет осуществлять высокоточное кросс-модальное рассуждение, понимание изображений и генерацию длинных контекстов (до 131 тысячи токенов). Модель дообучена с использованием таких техник, как SFT, DPO, UPO и RLVR, и поддерживает как режимы вывода с “мышлением”, так и без него. Разработанная для задач, связанных с взаимодействием зрения и языка на английском и китайском языках, она оптимизирована для эффективного масштабирования и может работать при квантовании в 4 бита/8 бит.

Входные данные:

39 ₽ / 1M

Изображения

Текст

Исходящие данные:

116 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

39 ₽

Исходящие токены за 1M:

116 ₽

Чат Детали

Baidu ERNIE 4.5 300B A47B

Baidu

131K

ERNIE-4.5-300B-A47B — это языковая модель с параметрами 300B типа Mixture-of-Experts (MoE), разработанная компанией Baidu в рамках серии ERNIE 4.5. Она активирует 47B параметров на каждый токен и поддерживает генерацию текста как на английском, так и на китайском языках. Оптимизированная для высокопроизводительного вывода и эффективного масштабирования, она использует гетерогенную структуру MoE с передовыми стратегиями маршрутизации и квантизации, включая форматы FP8 и 2-бит. Эта версия специально настроена для задач, связанных исключительно с языком, и поддерживает рассуждения, параметры инструментов и увеличенные длины контекста до 131k токенов. Подходит для универсальных приложений LLM с высокими требованиями к рассуждению и пропускной способности.

Входные данные:

26 ₽ / 1M

Текст

Исходящие данные:

102 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

26 ₽

Исходящие токены за 1M:

102 ₽

Чат Детали

Mistral Mistral Small 3.2 24B

Mistral AI

128K

Mistral-Small-3.2-24B-Instruct-2506 — это обновленная модель с 24 миллиардами параметров от Mistral, оптимизированная для выполнения инструкций, уменьшения повторений и улучшенного вызова функций. По сравнению с версией 3.1, версия 3.2 значительно улучшает точность на WildBench и Arena Hard, сокращает бесконечные генерации и обеспечивает улучшения в использовании инструментов и задачах с структурированным выводом.

Она поддерживает ввод изображений и текста с структурированным выводом, вызов функций/инструментов и демонстрирует высокую производительность в кодировании (HumanEval+, MBPP), STEM (MMLU, MATH, GPQA) и визуальных тестах (ChartQA, DocVQA).

Входные данные:

6 ₽ / 1M

Изображения

Текст

Исходящие данные:

18 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

6 ₽

Исходящие токены за 1M:

18 ₽

Чат Детали

MiniMax MiniMax M1

Minimax

MiniMax-M1 — это крупномасштабная модель рассуждений с открытым весом, разработанная для расширенного контекста и высокоэффективного вывода. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с пользовательским механизмом “молниеносного внимания”, что позволяет обрабатывать длинные последовательности — до 1 миллиона токенов — при сохранении конкурентоспособной эффективности FLOP. С общим количеством параметров 456 миллиардов и 45,9 миллиарда активных на токен, этот вариант оптимизирован для сложных, многошаговых задач рассуждения.

Обученная с помощью пользовательского конвейера обучения с подкреплением (CISPO), M1 превосходит в понимании длинного контекста, программной инженерии, использовании агентных инструментов и математическом рассуждении. Тесты показывают высокие результаты на FullStackBench, SWE-bench, MATH, GPQA и TAU-Bench, часто превосходя другие открытые модели, такие как DeepSeek R1 и Qwen3-235B.

Входные данные:

37 ₽ / 1M

Текст

Исходящие данные:

204 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

37 ₽

Исходящие токены за 1M:

204 ₽

Чат Детали

Google Gemini 2.5 Flash

Google

Gemini 2.5 Flash — это передовая рабочая модель от Google, специально разработанная для выполнения сложных задач в области рассуждений, программирования, математики и науки. Она включает встроенные возможности “мышления”, что позволяет ей давать ответы с большей точностью и учитывать нюансы контекста.

Входные данные:

27 ₽ / 1M

Файл

Изображения

Текст

Аудио

Видео

Исходящие данные:

232 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

27 ₽

Исходящие токены за 1M:

232 ₽

Чат Детали

Google Gemini 2.5 Pro

Google

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для выполнения сложных задач в области рассуждений, программирования, математики и науки. Она использует возможности «мышления», что позволяет ей рассуждать при формировании ответов с повышенной точностью и тонким учетом контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность по нескольким критериям, включая первое место в рейтинге LMArena, что отражает превосходное соответствие предпочтениям человека и способности решать сложные задачи.

Входные данные:

116 ₽ / 1M

Текст

Изображения

Файл

Аудио

Видео

Исходящие данные:

931 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

116 ₽

Исходящие токены за 1M:

931 ₽

Чат Детали

Google Gemini 2.5 Pro Preview 06-05

Google

Gemini 2.5 Pro — это передовая модель искусственного интеллекта от Google, разработанная для выполнения сложных задач в области рассуждений, программирования, математики и науки. Она использует возможности «мышления», что позволяет ей рассуждать над ответами с повышенной точностью и учитывать нюансы контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность на различных тестах, включая первое место в рейтинге LMArena, что отражает превосходное соответствие предпочтениям человека и способности решать сложные проблемы.

Входные данные:

116 ₽ / 1M

Файл

Изображения

Текст

Аудио

Исходящие данные:

931 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

116 ₽

Исходящие токены за 1M:

931 ₽

Чат Детали

DeepSeek R1 0528

DeepSeek

164K

Обновление от 28 мая для оригинального DeepSeek R1 Производительность на уровне OpenAI o1, но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели составляет 671 миллиард параметров, из которых 37 миллиардов активны в процессе вывода.

Полностью открытая модель с открытым исходным кодом.

Входные данные:

46 ₽ / 1M

Текст

Исходящие данные:

200 ₽ / 1M

Текст

Контекст:

164K

Входящие токены за 1M:

46 ₽

Исходящие токены за 1M:

200 ₽

Чат Детали