Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Perplexity

200K

Эксклюзивно доступный через API, новый режим Pro Search в Sonar Pro является самым продвинутым агентным поисковым системом Perplexity. Он разработан для более глубокого анализа и рассуждений. Цены основаны на количестве токенов плюс цена за тысячу запросов. Эта модель обеспечивает работу режима Pro Search на платформе Perplexity.

Sonar Pro Search добавляет автономное, многоэтапное рассуждение в Sonar Pro. Вместо одной лишь запроса и синтеза, он планирует и выполняет целые исследовательские процессы с использованием инструментов.

Входные данные:

279 ₽ / 1M

Текст

Изображения

Исходящие данные:

1397 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

279 ₽

Исходящие токены за 1M:

1397 ₽

Чат Детали

Mistral Voxtral Small 24B 2507

Mistral AI

32K

Voxtral Small — это усовершенствованная версия Mistral Small 3, которая включает в себя передовые возможности аудиоввода, сохраняя при этом первоклассную производительность текста. Она превосходно справляется с транскрипцией речи, переводом и пониманием аудио. Стоимость ввода аудио составляет 100 долларов за миллион секунд.

Входные данные:

9 ₽ / 1M

Текст

Аудио

Файл

Исходящие данные:

27 ₽ / 1M

Текст

Контекст:

32K

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

27 ₽

Чат Детали

OpenAI gpt-oss-safeguard-20b

OpenAI

131K

gpt-oss-safeguard-20b — это модель рассуждений по безопасности от OpenAI, построенная на основе gpt-oss-20b. Эта модель с открытыми весами и 21 миллиардом параметров, использующая архитектуру Mixture-of-Experts (MoE), обеспечивает более низкую задержку для задач безопасности, таких как классификация контента, фильтрация LLM и маркировка доверия и безопасности.

Входные данные:

6 ₽ / 1M

Текст

Исходящие данные:

27 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

6 ₽

Исходящие токены за 1M:

27 ₽

Чат Детали

Qwen Qwen3 Embedding 8B

Qwen

32K

Серия моделей Qwen3 Embedding — это последняя собственная модель семейства Qwen, специально разработанная для задач текстового встраивания и ранжирования. Эта серия наследует исключительные многоязычные возможности, понимание длинных текстов и навыки рассуждения своей базовой модели. Серия Qwen3 Embedding представляет собой значительные достижения в различных задачах текстового встраивания и ранжирования, включая поиск текста, поиск кода, классификацию текста, кластеризацию текста и двуязычный майнинг.

Входные данные:

0,93 ₽ / 1M

Текст

Исходящие данные:

0 ₽ / 1M

Embeddings

Контекст:

32K

Входящие токены за 1M:

0,93 ₽

Исходящие токены за 1M:

0 ₽

Чат Детали

Qwen Qwen3 Embedding 4B

Qwen

33K

Серия моделей Qwen3 Embedding является последней собственнической моделью семейства Qwen, специально разработанной для задач встраивания текста и ранжирования. Эта серия наследует исключительные многоязычные возможности, понимание длинных текстов и навыки рассуждения своей базовой модели. Серия Qwen3 Embedding представляет значительные достижения в различных задачах встраивания и ранжирования текста, включая поиск текста, поиск кода, классификацию текста, кластеризацию текста и двуязычный майнинг.

Входные данные:

1,86 ₽ / 1M

Текст

Исходящие данные:

0 ₽ / 1M

Embeddings

Контекст:

33K

Входящие токены за 1M:

1,86 ₽

Исходящие токены за 1M:

0 ₽

Чат Детали

Alice AI LLM

Yandex

33K

Alice AI LLM имеет архитектуру Mixture of Experts и обучена с подкреплением (Reinforcement Learning) с многокомпонентными наградами. Модель использует для ответа не все параметры, а только самые релевантные — как будто привлекая эксперта для решения каждой конкретной задачи.

Входные данные:

624 ₽ / 1M

Текст

Исходящие данные:

2487 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

624 ₽

Исходящие токены за 1M:

2487 ₽

Чат Детали

MiniMax MiniMax M2

Minimax

205K

MiniMax-M2 — это компактная, высокоэффективная большая языковая модель, оптимизированная для сквозного кодирования и агентных рабочих процессов. С 10 миллиардами активированных параметров (всего 230 миллиардов) она обеспечивает почти передовой уровень интеллекта в области общего рассуждения, использования инструментов и выполнения многошаговых задач, сохраняя при этом низкую задержку и эффективность развертывания.

Модель превосходно справляется с генерацией кода, редактированием нескольких файлов, циклами компиляции-запуска-исправления и тестово-валидированным ремонтом, демонстрируя высокие результаты на SWE-Bench Verified, Multi-SWE-Bench и Terminal-Bench. Она также показывает конкурентоспособность в агентных оценках, таких как BrowseComp и GAIA, эффективно справляясь с долгосрочным планированием, извлечением и восстановлением после ошибок выполнения.

По данным Artificial Analysis, MiniMax-M2 занимает одно из ведущих мест среди открытых моделей для комплексного интеллекта, охватывающего математику, науку и следование инструкциям. Ее небольшой активированный след позволяет обеспечить быструю инференцию, высокую конкурентоспособность и улучшенную экономику единицы, что делает ее подходящей для крупных агентов, помощников разработчиков и приложений, ориентированных на рассуждения, требующих отзывчивости и экономической эффективности.

Чтобы избежать ухудшения производительности этой модели, MiniMax настоятельно рекомендует сохранять рассуждения между ходами.

Входные данные:

23 ₽ / 1M

Текст

Исходящие данные:

93 ₽ / 1M

Текст

Контекст:

205K

Входящие токены за 1M:

23 ₽

Исходящие токены за 1M:

93 ₽

Чат Детали

Qwen Qwen3 VL 32B Instruct

Qwen

262K

Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная модель для работы с визуальной и текстовой информацией, разработанная для высокоточной интерпретации и анализа текста, изображений и видео. С 32 миллиардами параметров она сочетает глубокое визуальное восприятие с продвинутым пониманием текста, что позволяет выполнять детализированное пространственное рассуждение, анализ документов и сцен, а также понимание видео на длинных временных интервалах. Обладает надежным OCR на 32 языках и улучшенной мультимодальной интеграцией благодаря архитектурам Interleaved-MRoPE и DeepStack. Оптимизированная для агентного взаимодействия и использования визуальных инструментов, Qwen3-VL-32B обеспечивает передовую производительность для сложных мультимодальных задач в реальном мире.

Входные данные:

9 ₽ / 1M

Текст

Изображения

Исходящие данные:

38 ₽ / 1M

Текст

Контекст:

262K

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

38 ₽

Чат Детали

IBM Granite 4.0 Micro

Ibm-granite

131K

Granite-4.0-H-Micro — это параметр 3B из семейства моделей Granite 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они настроены для вызова инструментов в длинном контексте.

Входные данные:

1,58 ₽ / 1M

Текст

Исходящие данные:

10 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

1,58 ₽

Исходящие токены за 1M:

10 ₽

Чат Детали

Microsoft Phi 4 Mini Instruct

Microsoft

131K

Phi-4-mini-instruct is a lightweight open model built upon synthetic data and filtered publicly available websites - with a focus on high-quality, reasoning dense data. The model belongs to the Phi-4…

Входные данные:

7 ₽ / 1M

Текст

Исходящие данные:

32 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

7 ₽

Исходящие токены за 1M:

32 ₽

Чат Детали

OpenAI GPT-5 Image Mini

OpenAI

400K

GPT-5 Image Mini сочетает в себе продвинутые языковые возможности, основанные на GPT-5 Mini, с GPT Image 1 Mini для эффективной генерации изображений. Эта изначально мультимодальная модель обладает превосходным следованием инструкциям, рендерингом текста и детальным редактированием изображений с уменьшенной задержкой и стоимостью. Она превосходно справляется с созданием высококачественных визуальных материалов, сохраняя при этом сильное понимание текста, что делает её идеальной для приложений, требующих как эффективной генерации изображений, так и обработки текста в больших масштабах.

Входные данные:

232 ₽ / 1M

Файл

Изображения

Текст

Исходящие данные:

186 ₽ / 1M

Изображения

Текст

Контекст:

400K

Входящие токены за 1M:

232 ₽

Исходящие токены за 1M:

186 ₽

Чат Детали

Anthropic Claude Haiku 4.5

Anthropic

200K

Claude Haiku 4.5 — это самая быстрая и эффективная модель от Anthropic, обеспечивающая почти передовой уровень интеллекта за небольшую часть стоимости и задержки по сравнению с более крупными моделями Claude. Сопоставимая с производительностью Claude Sonnet 4 в задачах рассуждения, программирования и использования компьютера, Haiku 4.5 предоставляет возможности передового уровня для приложений в реальном времени и с высоким объемом данных.

Она вводит расширенное мышление в линейку Haiku, позволяя контролировать глубину рассуждений, выводить обобщенные или чередующиеся мысли и использовать рабочие процессы с поддержкой инструментов, включая полную поддержку программирования, bash, веб-поиска и инструментов для работы с компьютером. Набирая более 73% на SWE-bench Verified, Haiku 4.5 входит в число лучших моделей для программирования в мире, при этом сохраняя исключительную отзывчивость для суб-агентов, параллельного выполнения и масштабируемого развертывания.

Входные данные:

93 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

465 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

93 ₽

Исходящие токены за 1M:

465 ₽

Чат Детали

Qwen Qwen3 VL 8B Thinking

Qwen

256K

Qwen3-VL-8B-Thinking — это оптимизированный для рассуждений вариант мультимодальной модели Qwen3-VL-8B, разработанный для продвинутого визуального и текстового анализа в сложных сценах, документах и временных последовательностях. Он интегрирует улучшенное мультимодальное выравнивание и обработку длинного контекста (встроенные 256K, расширяемые до 1M токенов) для задач, таких как научный визуальный анализ, причинно-следственные выводы и математические рассуждения по изображениям или видео.

По сравнению с версией Instruct, версия Thinking вводит более глубокое слияние визуального и языкового аспектов и продуманные пути рассуждений, которые улучшают производительность в задачах с длинными логическими цепочками, решении задач STEM и многократном понимании видео. Она достигает более сильной временной привязки с помощью Interleaved-MRoPE и встраиваний с учетом временных меток, при этом поддерживая надежное OCR, многоязычное понимание и генерацию текста на уровне крупных текстовых LLM.

Входные данные:

10 ₽ / 1M

Изображения

Текст

Исходящие данные:

127 ₽ / 1M

Текст

Контекст:

256K

Входящие токены за 1M:

10 ₽

Исходящие токены за 1M:

127 ₽

Чат Детали

Qwen Qwen3 VL 8B Instruct

Qwen

256K

Qwen3-VL-8B-Instruct — это мультимодальная модель из серии Qwen3-VL, созданная для высокоточного понимания и рассуждений по тексту, изображениям и видео. Она обладает улучшенной мультимодальной фьюзией с использованием Interleaved-MRoPE для временного рассуждения на длинных отрезках, DeepStack для точного выравнивания визуального и текстового контента, а также выравнивания текста и временных меток для точной локализации событий.

Модель поддерживает контекстное окно на 256 тысяч токенов, которое можно расширить до 1 миллиона токенов, и обрабатывает как статические, так и динамические медиа-входы для задач, таких как парсинг документов, визуальные вопросы и ответы, пространственное рассуждение и управление графическим интерфейсом. Она достигает уровня понимания текста, сопоставимого с ведущими LLM, расширяя охват OCR до 32 языков и повышая устойчивость в различных визуальных условиях.

Входные данные:

10 ₽ / 1M

Изображения

Текст

Исходящие данные:

42 ₽ / 1M

Текст

Контекст:

256K

Входящие токены за 1M:

10 ₽

Исходящие токены за 1M:

42 ₽

Чат Детали

OpenAI GPT-5 Image

OpenAI

400K

Image сочетает в себе самую передовую языковую модель OpenAI с передовыми возможностями генерации изображений. Она предлагает значительные улучшения в области рассуждений, качества кода и пользовательского опыта, при этом включая превосходное следование инструкциям, рендеринг текста и детальное редактирование изображений, характерные для GPT Image 1.

Входные данные:

931 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

931 ₽ / 1M

Изображения

Текст

Контекст:

400K

Входящие токены за 1M:

931 ₽

Исходящие токены за 1M:

931 ₽

Чат Детали