Если вы следили за гонкой больших языковых моделей, то наверняка заметили два загадочных названия, появляющихся в логах матчей LMArena и на форумах по исследованиям ИИ: Orionmist и Lithiumflow.
Они появились без лишнего шума, превзошли несколько моделей среднего уровня и исчезли так же быстро. Тем не менее, для любого внимательного наблюдателя их поведение казалось знакомым — структурированные рассуждения, чистое форматирование Markdown, мультимодальная точность.
Это сходство привело сообщество к одному выводу:
Orionmist = Gemini 3 Pro
Lithiumflow = Gemini 3 Flash
1 · От анонимных дуэлянтов до следующего флагмана Google
LMArena — это самая используемая в мире платформа для «слепой» оценки LLM. Пользователи сталкивают две анонимные модели друг с другом и голосуют за лучший ответ.
Чтобы исключить предвзятость, платформа скрывает реальные названия за псевдонимами — практика, которую использовали и OpenAI, и Anthropic. GPT-4o однажды появилась как Omni-42; Claude 3 Opus сражалась под тегом CloudMuse.
Поэтому, когда в середине 2025 года два новичка — Orionmist и Lithiumflow — начали превосходить признанные модели, закономерность стала очевидной. Их лингвистические «отпечатки пальцев» соответствовали семейству Google Gemini: эффективная структура JSON, стабильные цепочки рассуждений и сбалансированный тон в человеческом стиле.
2 · Ландшафт 2025 года: GPT-5, Claude 4.5 и грядущая Gemini 3
Релиз GPT-5 в июне 2025 года переопределил представление о том, какой может быть модель общего назначения.
Ее архитектура персистентных агентов, память на 10 миллионов токенов и нативное понимание видео вывели отрасль в новую эру.
| Модель | Релиз | Контекстное окно | Ключевое преимущество | Примечания |
|---|---|---|---|---|
| GPT-5 | Июнь 2025 | ≈ 10 млн токенов | Долгосрочное планирование, персистентные агенты | Полное мультимодальное слияние |
| GPT-5 mini | Сент. 2025 | ≈ 1 млн токенов | Edge-устройства / низкая задержка | Ориентирована на мобильные и встраиваемые системы |
| Claude 4.5 Opus / Haiku | Авг. 2025 | 2 млн токенов | Выравнивание цепочки рассуждений, безопасность | Constitutional AI 2.0 |
| Gemini 2.5 Pro / Flash | Апр. 2025 | 512к–1 млн токенов | Ускоренная мультимодальность, снижение цены | Текущий публичный релиз |
| Gemini 3 (Pro / Flash) | Будет объявлено (ожидается 4 кв. 2025 → 1 кв. 2026) | > 2 млн токенов (оценка) | Унифицированный модальный трансформер | Вероятно, тестировались как Orionmist/Lithiumflow |
Google еще не анонсировала Gemini 3 официально, но ссылки во внутреннем коде и эти «призраки» в Arena намекают, что запуск близок.
3 · Внутри Gemini 3 Pro (Orionmist)
Ожидается, что Gemini 3 Pro станет прямым конкурентом Google для полной версии GPT-5 и Claude 4.5 Opus.
Архитектурные особенности (предположительные, но основанные на фактах):
- Unified Modal Transformer — общее эмбеддинг-пространство для текстовых, графических, аудио- и видеоданных.
- Agentic Loop Core — самовызывающиеся подмодели «планировщик + исполнитель» для автономных многошаговых рассуждений.
- Enhanced Memory Routing — гибридная система длинного контекста и эпизодической памяти, превышающая 2 млн токенов.
- RoPE 2.0 и внимание с многозапросным кэшированием (multi-query cache attention) для 3-кратного ускорения инференса по сравнению с Gemini 1.5 Pro.
- Integrated Self-Reflection Trace для более последовательных логических цепочек.
Цели производительности:
- Превзойти показатель логических рассуждений GPT-4o на 15–20%.
- Победить Claude 4.5 Haiku в задачах по созданию структурированного вывода и написанию длинного кода.
- Снижение задержки ≈ 40% по сравнению с Gemini 1.5 Pro.
4 · Gemini 3 Flash (Lithiumflow): Чемпион Edge-вычислений
Если Orionmist нацелена на чистую мощь, то Lithiumflow (Gemini 3 Flash) фокусируется на эффективности.
| Метрика | Целевое улучшение vs 2.5 Flash |
|---|---|
| Задержка (Latency) | -45 % |
| Стоимость / 1к токенов | -60 % |
| Контекстное окно | 512 к → 1 млн токенов |
| Развертывание | Vertex AI Edge / Android Co-Pilot / Docs Assist |
Архитектура использует квантованные проекционные головы и методы сжатия инструкций, что позволяет предприятиям развертывать решения, работающие почти в реальном времени — примерно в том же классе скорости, что и GPT-5 mini, но внутри стека Google.
5 · Почему LMArena имеет значение
Слепая оценка в LMArena дает ранние намеки на подлинные возможности.
Недавние анонимные поединки показывают, что по крайней мере одна неназванная модель превосходит GPT-4o в рассуждениях и кодинге, сохраняя при этом естественный поток общения — поведение, полностью соответствующее следам Orionmist.
Если это подтвердится, это будет означать, что Gemini 3 Pro (alpha) уже соответствует или превосходит GPT-5 в некоторых категориях еще до своего публичного дебюта.
6 · Больше, чем параметры: переход к когнитивной непрерывности
Новая гонка больше не касается хвастовства триллионами параметров.
Речь идет о когнитивной непрерывности — моделях, которые помнят, планируют и действуют на протяжении нескольких сессий.
Сообщается, что Gemini 3 от Google интегрирует «ячейки постоянной памяти», привязанные к личности пользователя, что перекликается с внедрением памяти в GPT-5 Chat от OpenAI.
В корпоративной среде это означает агентов Gemini, которые могут:
- Отслеживать текущие проекты в Документах и Таблицах.
- Предлагать следующие действия на основе прошлых намерений пользователя.
- Взаимодействовать с другими моделями через внутренний протокол «Gemini Mesh».
7 · Последствия для экосистемы
Gemini 3 — это не просто очередная модель; это краеугольный камень стратегии ИИ-экосистемы Google на 2026 год.
Точки интеграции
- Vertex AI 2.0: Унифицированные эндпоинты инференса для Pro и Flash.
- Gemini Apps Suite: Объединение Bard и Assistant под единым интерфейсом.
- Android 14.5+ Copilot: Всегда включенный контекстный агент на базе Flash.
- Workspace Autopilot: Слои понимания документов и рассуждений, напрямую поддерживаемые Gemini 3 Pro.
Если Orionmist и Lithiumflow действительно являются внутренними кодовыми именами, их присутствие в тестах сигнализирует о том, что Google близка к готовности полностекового развертывания.
8 · Сравнительный обзор (октябрь 2025)
| Категория | GPT-5 | Claude 4.5 Opus | Gemini 3 Pro (Orionmist*) | Gemini 3 Flash (Lithiumflow*) |
|---|---|---|---|---|
| Контекстное окно | 10 млн (адаптивное) | 2 млн | 2 млн (оценка) | 1 млн (оценка) |
| Задержка | Средняя | Средне-высокая | Средне-низкая | Сверхнизкая |
| Глубина мультимодальности | Полная (видео + аудио) | Текст + изображения | Полная унифицированная | Текст + изображения |
| Постоянная память | Да | Частично | Да (enterprise) | Опционально |
| Доступность API | Публично | Публично | Тестирование | Тестирование |
| Статус (октябрь 2025) | Пром. эксплуатация | Пром. эксплуатация | «Серое» тестирование LMArena | «Серое» тестирование LMArena |
* Названия моделей не подтверждены; атрибуция сообщества.
9 · Общая картина: ИИ как коллаборативная сеть
Конвергенция персистентных агентов GPT-5, прозрачных рассуждений Claude 4.5 и унифицированного мультимодального цикла Gemini 3 знаменует рассвет автономных ИИ-экосистем.
Каждая модель становится в меньшей степени «чат-ботом» и в большей — цифровым коллегой, способным к долгосрочному сотрудничеству.
Orionmist и Lithiumflow воплощают этот сдвиг — не как изолированные системы, а как узлы когнитивной сети.
10 · Заключительная мысль
Когда эти модели выйдут из тени анонимности, мы, вероятно, будем вспоминать короткие появления Orionmist и Lithiumflow на LMArena как момент, когда Gemini 3 от Google тихо вступила в гонку.
В эру GPT-5 следующим рубежом станут не «мозги» большего размера, а более умные экосистемы — и Gemini 3 может стать самым смелым шагом Google на этом пути.