allai

Grok

Ассистент на базе крупной языковой модели от компании xAI (Илона Маска). Он умеет вести диалог, писать и объяснять код, работать с документами и делать быстрый поиск по Сети и X (бывш. Twitter) прямо во время ответа.

Основной функционал

  1. Grok — универсальный ассистент с упором на диалоги, код, рассуждение, «живой» поиск и голос. Его можно использовать в браузере, в приложениях iOS/Android, на X (бывш. Twitter) и через API. Маркетинговая страница подчёркивает четыре опоры: разговоры, код, reasoning и voice, плюс генерацию изображений; доступ есть из Grok Web, Grok на X, а также из мобильных приложений. Для продвинутых задач предусмотрены планы SuperGrok и «тяжёлая» версия Grok Heavy.
  2. Ключевая «фишка» — реальное время. В потребительских продуктах Grok может подмешивать свежие данные (включая посты X) и веб-результаты прямо в ответы; в справке X отдельным пунктом описан механизм и приватность: ассистент при необходимости ищет по публичным постам X и вебу, а пользователь может управлять персонализацией и обучением на своих данных (опт-аут/удаление истории).
  3. В API это оформлено как Live Search: ты явно включаешь поиск для запроса и настраиваешь источники (web, news, x, rss), лимиты по датам, числу источников и возвращаемые цитации. Это «из коробки» решает задачу актуализации без собственной оркестрации тулов.
  4. Мультимодальность. Grok понимает изображения (разметка URL/base64, контроль уровня «detail») и умеет генерировать картинки через отдельную точку /images/generations (модель grok-2-image-*, можно запрашивать несколько вариантов и получать url либо b64_json); перед генерацией подсказка автоматически «переписывается» чат-моделью — в ответе приходит revised_prompt.
  5. Голос и камера. Режим Grok Voice — живой разговор с моделью; в анонсе Grok 4 показан сценарий «укажи камерой → получи объяснения в реальном времени прямо в голосовом чате». На X отдельно поясняется, что голосовые входы транскрибируются и могут использоваться для персонализации/улучшения модели в рамках настроек приватности.
  6. Код и структуры. Для разработки есть «обычные» чат-модели и недорогой «рабочий» вариант Grok Code Fast 1 (заточен под агентное кодирование/низкую латентность). Во всех современных языковых моделях поддерживаются Function Calling (интеграция с внешними инструментами/АПИ) и Structured Outputs (строго по JSON-схеме) — удобно для агентов, парсеров и UI-форм.
  7. Важно про доступ и планы. По публичным материалам xAI: Grok 4 доступен подписчикам SuperGrok и X Premium+, а также через API; есть «Heavy»-вариант с повышенными лимитами. Конкретные квоты/цены зависят от тарифа и региона.
  8. Grok закрывает: 1) поисково-аналитические диалоги с цитатами; 2) мультимодальные сценарии (видение/генерация изображений, голос); 3) инженерные задачи (код, инструменты, структурированный вывод) — от «быстрого ответа» до многошаговых пайплайнов.

Технические особенности

  1. Линейка моделей и окна контекста. В доках xAI перечислены актуальные модели и цены. Для Grok 4 указано окно 256k токенов; для Grok Code Fast 1 — тоже 256k, с низкой стоимостью (пример в таблице: $0.20 вход / $1.50 выход за млн токенов). Есть grok-3/grok-3-mini и модель для генерации изображений grok-2-image-1212. Для Grok 3/4 указан knowledge cutoff — ноябрь 2024 (для «онлайна» нужен Live Search).
  2. Live Search: устройство и биллинг. Вызов делается через обычный chat-endpoint с полем search_parameters. Режимы: "off", "auto" (по умолчанию, модель решает сама) и "on". Источники можно ограничивать (веб/новости/X/RSS), задавать окно дат, квоты на результаты и всегда получать список источников в ответе. Стоимость — $25 за 1000 источников (≈$0.025 за источник).
  3. Мультимодальность: понимание изображений. Вход — image_url (web) или b64, порядок с текстом произвольный; есть параметр "detail" (low/auto/high), лимиты: до 20 MiB на изображение, форматы jpg/png. Токенизация изображений описана прозрачно (плитки 448×448 по 256 токенов, до 6 плиток на картинку).
  4. Генерация изображений: поток и ревизия промпта. Генерация идёт через /v1/images/generations с параметрами n (1–10), response_format (url/b64_json). Прежде чем попасть в модель генерации, твой запрос может быть «уточнён» чат-моделью; этот revised_prompt возвращается в ответе — удобно для аудита и воспроизводимости.
  5. Функции и параллелизм. Function Calling поддерживает автоматический выбор инструмента, режим required, принудительный вызов конкретной функции и параллельные вызовы (модель может вернуть несколько tool-calls в одном ответе). Это позволяет строить «агентов» с внешними API, БД, действием в реальном мире.
  6. Строгие структуры на выходе. Structured Outputs гарантирует соответствие заданной схеме (JSON/enum) — пригодно для извлечения сущностей, парсинга форм, отчётов. В доках явно указана поддержка типовых JSON-конструкций и моделей начиная с веток grok-2-*.
  7. Голос/видение в приложениях. В релизной заметке Grok 4 показан «voice-loop» с анализом сцены с камеры и ответом в реальном времени — технически это мультимодальный стриминг (в потребительских приложениях), который в API дополняется guide’ами про потоковую выдачу/Live Search. На стороне X описаны нюансы обработки голосовых данных и настройки приватности/опт-аута.
  8. Практические нюансы. В моделях указаны rate-limits и кэш повторяющихся префиксов промпта (cached prompt tokens); доступ к «новостям/реал-тайм» без Live Search отключён (используй search-параметры или сам подмешивай контекст). Для образов — лимит типов/размеров. Все эти детали вынесены в публичные доки с таблицами.

Тарифы

tariffs

Кому подойдет

  1. Основателям и продукт-менеджерам. Нужны проверяемые ответы «сейчас»: Live Search с цитатами для ресёрча/бенчмарков, структурированный JSON для прототипов, быстрый экспорт в API.
  2. Инженерам/агент-билдерам. Function Calling с параллельными tool-calls, длинный контекст, дешёвый Grok Code Fast 1 для «агентного» кодинга и интеграций.
  3. Медиа/маркетингу. Генерация изображений, цитируемые обзоры трендов и настроений X в реальном времени, голосовые демо в приложении.
  4. Аналитикам и операционным командам. Длинные документы → краткие выжимки, строгие структуры на выходе, контролируемая безопасностью интеграция с «живыми» источниками.
  5. Пользователям X. Хочешь быстрые, «осведомлённые» ответы внутри X и контроль персонализации/обучения на своих данных — включай Grok и настрой приватность.

Бесплатные кредиты

Нет