Vertex AI

Платформа от Google для построения и деплоя ML/LLM моделей. Чат-боты. Генеративные приложения. DS/ML-разработка в ноутбуках с подключением BigQuery и сервисов GCP.

В сервис

Дата обновления:20.05.2026

Основной функционал

Единая платформа для классического ML и генеративного ИИ. Vertex AI объединяет весь цикл: от данных и обучения до деплоя, мониторинга и оценки. В одном месте доступны AutoML и кастом-тренинг, регистрация моделей, пайплайны, векторный поиск, фичестор, эксперименты и средства прототипирования ген-ИИ.
Model Garden + Vertex AI Studio. Через Model Garden ты получаешь доступ к 200+ базовым моделям Google и open-source (Gemini, Gemma, Imagen, Veo и др.), а Vertex AI Studio даёт удобную песочницу для быстрого теста промптов, настройки и дообучения без кода.
Gemini 2.0 Flash и семейство Gemini/Gemma. Для приложений с низкой задержкой и большим контекстом есть Gemini 2.0 Flash (встроенный tool-use, мультимодальность, контекст до ~1M токенов); в каталоге также Pro/1.5-линейка и «лёгкие»/открытые Gemma-модели.
Медиа-модели и видео. В Media Studio доступен Veo — генерация видео по тексту или картинке (Text-to-Video, Image-to-Video) через консоль и API; официальный гайд по промптингу покрывает сценарии и ограничения.
Агенты и RAG. Vertex AI Agent Builder + Agent Engine помогают собирать и масштабировать многоагентные приложения (сессии, память, инструменты, деплой на управляемом рантайме). Для «заземления» ответов есть Grounding с Google Search и Vertex AI Search (RAG к своим данным).
MLOps-контур. Pipelines (Kubeflow/TFX), Model Registry, Experiments, Workbench/Notebooks, Feature Store и Vector Search закрывают промышленный цикл — от экспериментов и отслеживания версий до онлайн-фичей и ANN-поиска в проде.
Безопасность, приватность и ответственность. Конфигурируемые safety-фильтры, watermark-технология SynthID (для Imagen и др.), CMEK-шифрование и приватные подключения (Private Services Access / Private Service Connect) помогают соблюсти требования безопасности/комплаенса.
Интеграция с данными Google Cloud. Плотная связка с BigQuery (в том числе генеративные сценарии «прямо у данных») упрощает доставку данных и эксплуатацию МЛ-продуктов.

Технические особенности

Каталог моделей и доступ. Model Garden — единое окно для проприетарных и OSS-моделей: тестирование, настройка, деплой на эндпоинты или вызов через SDK/API. Набор включает мультимодальные Gemini, открытые Gemma, изображение (Imagen) и видео (Veo).
Gen-ИИ в проде: Studio, Grounding, Evaluation. В Vertex AI Studio прототипируешь промпты/чейн, затем переносишь в код. Для снижения «галлюцинаций» есть Grounding с Google Search (возврат ссылок) и Grounding с Vertex AI Search к своим источникам/индексам. Качество меряешь Gen AI Evaluation Service (pointwise/pairwise на базовой модели-авторайтере) и классическими метриками.
Агенты и оркестрация. Agent Builder включает Agent Garden (примеры/шаблоны), ADK (open-source фреймворк) и Agent Engine (управляемый рантайм: сессии, память, деплой, масштабирование). Поддерживаются встроенные инструменты: Google Search Grounding, Vertex AI Search, исполнение кода и др.
Векторная инфраструктура. Vertex AI Vector Search (бывш. Matching Engine) — высокомасштабная ANN-БД с низкой задержкой; используется в чатботах, рекомендациях, классификации и RAG. Быстрый старт и интеграции с LangChain/LlamaIndex.
Feature Store (новое поколение). Современный Vertex AI Feature Store работает поверх BigQuery: онлайн-сервинг фичей без отдельного офлайн-хранилища, туториалы по Online/Optimized serving и сценарии для векторного извлечения.
Пайплайны, реестр, эксперименты. Pipelines поддерживают Kubeflow v2 и TFX; Model Registry централизует версии/алиасы/деплой на эндпоинты; Experiments фиксируют параметры/метрики/артефакты для сравнения запусков и отбора лучших моделей.
Медиа-модели и видео. Veo генерирует видео из текста/изображений через консоль и API; есть отдельные гайды по промптам. Это дополняет Imagen (генерация/редактирование, аспект-ratio, SynthID-водяные знаки по умолчанию).
Сеть и безопасность. Для приватного доступа к сервисам и онлайновому инференсу поддерживаются Private Services Access и Private Service Connect; для чувствительных данных — CMEK и строгий IAM.
Модели Gemini 2.0 Flash. Под «агентные» сценарии — скорость/стриминг, tool-use, 1M-контекст (удобно для чат-UI и функций с длинным контекстом).

Тарифы

Кому подойдет

Enterprise-командам и ИТ-безопасности. Приватные соединения (PSC/PSA), CMEK, IAM, ответственные практики (safety-фильтры, SynthID) — для комплаенса в финтехе, телко, госсекторе.
DS/ML-платформенным командам. Pipelines + Registry + Experiments + Workbench, Feature Store и Vector Search — промышленный MLOps и RAG на масштаб.
Продуктовым/контент-командам. Быстрый прототипинг в Studio, мультимодальные Gemini, генерация видео Veo, оценка качества через Gen AI Evaluation Service.
Разработчикам агентов. Agent Builder/Engine, Grounding с Google Search/Vertex AI Search, поддержка ADK и фреймворков — для multi-agent и агентного RAG.

Бесплатные кредиты

Нет

В сервис

Vertex AI

Основной функционал

Технические особенности

Тарифы

Кому подойдет

Бесплатные кредиты

Обучающее видео