План реализации решения On-Premise ИИ‑агента для поиска по корпоративным документам
Справочно: рекомендуется также для ознакомления Сценарий: развёртывание собственными силами без внешних компетенций
Презентация из 9 слайдов (включая финальный с временными оценками).
Слайд 1. Титульный
On‑Premise ИИ‑агент для поиска по корпоративным документам
Закрытая изолированная сеть (Air Gap)
Стек: РЕД ОС 8, zVirt, Deckhouse Kubernetes Platform
Слайд 2. Технологический стек и требования
-
ОС и контейнеризация: РЕД ОС 8, Podman (штатная замена Docker)
-
Виртуализация: zVirt (кластер из двух серверов 2×Xeon Silver 4314, 384 ГБ RAM)
-
Оркестрация: Deckhouse Kubernetes Platform (реестр Минцифры, ФСТЭК-сертификация)
-
Среда: полная физическая изоляция (Air Gap), без доступа в интернет
-
Источники данных: 1С:Документооборот 2.0, Битрикс24 Энтерпрайз
-
Модели ИИ: Saiga/Mistral 7B (CPU-оптимизированная), multilingual‑e5‑large (эмбеддинги)
Слайд 3. Фаза 0: Подготовка Jump Station и артефактов
Задача: безопасно загрузить и проверить все компоненты вне закрытого контура.
-
Развёртывание временной Jump Station с РЕД ОС 8 и интернетом
-
Загрузка RPM‑пакетов Podman и утилит
-
Скачивание моделей LLM и эмбеддингов (Hugging Face)
-
Формирование офлайн‑репозитория Python‑пакетов
-
Экспорт контейнерных образов (Qdrant, Ollama) через Podman
-
Антивирусная проверка и перенос на отчуждaемый носитель
-
Оформление ввода носителя по регламенту ИБ
Результат: все артефакты готовы к развёртыванию в изолированной сети.
Слайд 4. Фазы 1–2: Инфраструктура и платформа ИИ
Фаза 1 – Отказоустойчивый фундамент
-
Установка zVirt на оба физических сервера, объединение в кластер высокой доступности (Hosted Engine)
-
Создание управляющей ВМ Deckhouse (РЕД ОС 8, развёртывание в offline‑режиме)
-
Добавление рабочих узлов (worker‑ai, worker‑data) с распределением CPU/RAM
Фаза 2 – Inference Server (Ollama)
-
Загрузка образа Ollama в локальный реестр Deckhouse
-
Создание Persistent Volume для моделей, импорт Saiga‑модели
-
Развёртывание Deployment с Ollama, настройка автомасштабирования (HPA)
-
Тестирование API: стабильный ответ, скорость 5–20 токенов/с
Слайд 5. Фазы 3–4: Векторное хранилище и загрузка документов
Фаза 3 – Qdrant и RAG‑сервис
-
Установка Qdrant через Kubernetes Operator, настройка шардирования
-
Микросервис FastAPI для эмбеддингов и поиска
-
Постоянное хранилище для модели эмбеддингов, HPA для RAG‑сервиса
Фаза 4 – ETL‑пайплайн (1С + Битрикс24)
-
CronJob/Deployment для регулярного извлечения документов
-
Интеграция с REST API 1С (договоры, приказы) и Битрикс24 (письма)
-
Парсинг: PDF (текстовый и OCR), DOCX, почтовые сообщения
-
Интеллектуальное чанкование с метаданными и ролевыми метками (access_roles)
-
Индексация в Qdrant с эмбеддингами
Результат: все документы доступны для семантического поиска.
Слайд 6. Фаза 5: Безопасность и логика RAG
-
Системный промпт: жёсткая инструкция – отвечать только на основе контекста, не выдумывать факты
-
Аутентификация: интеграция с LDAP/Active Directory для определения ролей пользователя
-
RBAC‑фильтрация в Qdrant: при поиске документы фильтруются по назначенным ролям доступа (access_roles)
-
Полный RAG‑пайплайн:
вопрос → эмбеддинг запроса → поиск с роль-фильтром (топ-5) → сбор контекста → отправка в Ollama → ответ с источниками -
Защита от Prompt Injection: фильтрация вредоносных команд
Гарантия: конфиденциальная информация не раскрывается, ответы строго верифицированы.
Слайд 7. Фазы 6–7: Интерфейс, метрики и масштабирование
Фаза 6 – Пользовательский интерфейс
-
Streamlit‑приложение в Deployment с Ingress (внутренний URL)
-
Интеграция в портал Битрикс24 через iFrame, проброс имени пользователя
-
Кнопки обратной связи ????/????, сохранение фидбека
Фаза 7 – Мониторинг, качество и масштабирование
-
Метрики:
-
Hallucination Rate ≤ 5%
-
Context Precision ≥ 90%
-
Latency P95 ≤ 15 сек
-
Пользовательская оценка ≥ 4/5
-
-
Мониторинг через Prometheus/Grafana (в составе Deckhouse)
-
Итеративное улучшение на основе отзывов
-
Горизонтальное масштабирование: автоскейлинг подов, шардирование Qdrant, увеличение реплик Ollama
-
Опционально: дообучение модели (LoRA) при накоплении качественных пар «вопрос‑ответ»
Слайд 8. Оптимальное время развёртывания и итоги
| Фаза | Содержание | Оценка длительности |
|---|---|---|
| 0 | Сбор и проверка артефактов | 1 неделя |
| 1–2 | Кластер zVirt + Deckhouse + Ollama | 2–3 недели |
| 3–4 | Qdrant, RAG‑сервис, ETL‑интеграция | 3–4 недели |
| 5 | Безопасность и логика агента | 1–2 недели |
| 6 | Пользовательский интерфейс, фидбек | 1–2 недели |
| 7 | Метрики, тестирование, документирование | 2–3 недели |
| Итого | Полный цикл «под ключ» | 8–12 недель |
Ключевые факторы успеха:
✔ Полностью импортозамещённый стек (РЕД ОС, zVirt, Deckhouse)
✔ Отказоустойчивость и горизонтальная масштабируемость
✔ Соответствие требованиям ИБ и регуляторам
✔ Быстрый возврат инвестиций за счёт автоматизации поиска по документам
Слайд 9. Бюджет проекта (совокупная стоимость владения)
Итоговая стоимость проекта «под ключ»: от 24,5 млн ₽
*Примечание: Все цены указаны в рублях с НДС и являются оценочными на основе рыночных данных и открытых источников (тендеры, прайс-листы) за 2025–2026 гг.*
1. Серверное оборудование
| Позиция | Кол-во | Цена за ед., ₽ | Сумма, ₽ | Источник цены |
|---|---|---|---|---|
| Серверная платформа (шасси, мат. плата, блоки питания, СО, корпус) | 2 | 1 100 000 | 2 200 000 | Оценка на основе конфигураций НИКС S9600/pro4U |
| Процессор Intel Xeon Silver 4314 OEM (16c/32t, 2.4 GHz) | 4 | 106 200 | 424 800 | Прайс-лист ServerFlow |
| Модуль памяти 32 ГБ Registered DDR4-3200 ECC | 24 | 38 000 | 912 000 | Оценка рынка |
| SSD Enterprise NVMe 3.84 ТБ (для данных) | 4 | 280 000 | 1 120 000 | Оценка рынка |
| SSD 960 ГБ SATA (для ОС) | 4 | 45 000 | 180 000 | Оценка рынка |
| Сетевой коммутатор 10/25GbE + кабели | 1 | 350 000 | 350 000 | Оценка рынка |
| Итого, оборудование | 5 186 800 |
2. Общесистемное и прикладное ПО
| Позиция | Кол-во | Цена за ед., ₽ | Сумма, ₽ | Источник цены |
|---|---|---|---|---|
| РЕД ОС 8, конфигурация Сервер, бессрочная лицензия, сертифицированная ФСТЭК | 4 | 190 000 | 760 000 | Данные госзакупок, лот 900 000 ₽ за 5 лицензий |
| Подсистема виртуализации (zVirt Advanced) | ||||
| zVirt Advanced 2CPU (ZV-ADV-2CPU-LIC), бессрочная | 2 | 3 500 000 | 7 000 000 | Оценка на основе тендеров |
| Техподдержка zVirt Базовый уровень на 1 год (ZV-2CPU-BSUP-1Y) | 2 | 1 150 000 | 2 300 000 | Тендер: 11 302 800 ₽ за 5 лицензий |
| Подсистема контейнеризации (Deckhouse DKP) | ||||
| Deckhouse Kubernetes Platform Enterprise Edition на 32 vCPU в год | 32 | 95 000 | 3 040 000 | Оценка на основе тендеров |
| Итого, инфраструктурное ПО | 13 100 000 |
3. Прикладное ПО и интеграционная шина
| Позиция | Кол-во | Цена за ед., ₽ | Сумма, ₽ | Источник цены |
|---|---|---|---|---|
| 1С:Предприятие 8.3 КОРП. Лицензия на сервер (x86-64) | 2 | 190 000 | 380 000 | Оценка: пропорционально ПРОФ-версии |
| Итого, прикладное ПО | 1 | 380 000 | 1С:ДО 8 КОРП и Битрикс24 Энтерпрайз уже приобретены |
4. Услуги по интеграции и внедрению
| Позиция | Ставка / Сложность | Срок | Сумма, ₽ | Способ оценки |
|---|---|---|---|---|
| Системная архитектура и аудит безопасности | Фиксированная стоимость этапа | 1 месяц | 1 100 000 | Экспертная оценка на основе почасовых ставок |
| Развертывание и настройка кластера zVirt + Deckhouse (offline) | Фиксированная стоимость этапа | 1.5 месяца | 1 850 000 | Экспертная оценка |
| Интеграция RAG-пайплайна, настройка Qdrant, ETL-воркеров (1С + Битрикс24) | Фиксированная стоимость этапа | 2 месяца | 2 900 000 | Экспертная оценка; рыночные данные Chatlabs |
| Разработка UI (Streamlit), настройка RBAC/LDAP, внедрение фидбек-лупа | Фиксированная стоимость этапа | 1.5 месяца | 1 850 000 | Экспертная оценка |
| Итого, услуги по внедрению | 7 700 000 |
5. Ежегодные операционные расходы (год 2 и далее)
| Статья расходов | Сумма в год, ₽ |
|---|---|
| Техническая поддержка и обновления: zVirt (2×Standard) + Deckhouse (32 vCPU Enterprise) | 2 900 000 |
| Продление лицензий (опционально): Битрикс24 Энтерпрайз (льготное 30%) | 399 000 |
| Администрирование и мониторинг: 1 ставка DevOps-инженера (частичная занятость, ~0.5 FTE) | 1 800 000 |
| Затраты на электропитание и охлаждение (ЦОД) | 480 000 |
| Непредвиденные расходы (10% резерв) | 558 000 |
| Итого, годовые операционные расходы | 6 137 000 |
Совокупная стоимость владения (3 года)
| Компонент | Сумма, ₽ |
|---|---|
| Капитальные затраты (оборудование + ПО + интеграция) | 26 366 800 |
| Операционные расходы за 2 последующих года (2 × 6 137 000) | 12 274 000 |
| Общая стоимость владения за 3 года | ≈ 38,6 млн ₽ |
| Эквивалент ежемесячных затрат | ≈ 1,07 млн ₽/мес |
Важно: Все цены являются индикативными и основаны на данных открытых тендеров и прайс-листов. Финальная стоимость будет определена по результатам тендера и уточнения требований. В расчете не учтены возможные скидки при комплексной закупке у одного интегратора.
Сценарий: развёртывание собственными силами без внешних компетенций
Если вы решите развернуть ИИ-агента полностью силами своей команды, не привлекая внешнего подрядчика, сценарий радикально меняется. Главный ресурс здесь — время на обучение сотрудников, поскольку без профильных компетенций в стеке РЕД ОС / zVirt / Deckhouse / RAG вы неизбежно столкнётесь с длительными простоями и дорогостоящими ошибками.
Вместо линейного выполнения семи фаз за 8–12 недель силами подрядчика, ваш проект трансформируется в трёхэтапную программу: «Обучение → Пилот → Продуктив», которая займёт у команды из двух инженеров не менее 8–10 месяцев.
Плюсы и минусы подхода
Аспект Подрядчик Своя команда Время до продуктивного запуска 8–12 недель 8–10 месяцев Денежные затраты (разовые) 26,4 млн ₽ ~26,9 млн ₽ Риск архитектурных ошибок На подрядчике На вас Зависимость от внешней экспертизы Высокая Отсутствует Сохранение компетенций внутри Нет Да Качество финального решения Гарантировано договором Зависит от квалификации команды Вывод: Самостоятельный путь дороже и дольше, но компетенции остаются внутри компании навсегда.
Перечень необходимых курсов для команды из 2-х инженеров
Для успешной реализации проекта вам потребуется закрыть три ключевых блока компетенций:
Блок 1: Базовая инфраструктура
Курс Длительность Цена (на 1 чел.) ₽ Источник цены Расширенное администрирование РЕД ОС 40 ак. часов (~5 дней) 48 000 Стоимость со скидкой — 48 000 рублей (с учетом НДС 20%) за 40 академических часов Установка и основы администрирования zVirt 4.5 32 ак. часа (~4 дня) 70 000 Программа повышения квалификации — 70 000,00 руб. за человека Администрирование Deckhouse Kubernetes Platform ~24 ак. часа (~3 дня) 70 000 Стоимость курса — 70 000 рублей (без учёта НДС) Блок 2: Контейнеризация и микросервисы
Курс Длительность Цена (на 1 чел.) ₽ Источник цены Podman: контейнеризация в РЕД ОС 24 ак. часа (~3 дня) 55 000 Экспертная оценка на основе данных зарубежных курсов, скорректированная до российского рынка (~€590 ≈ 55 000 ₽) FastAPI: промышленная разработка микросервисов 24 ак. часа (~3 дня) 36 000 Средняя стоимость коротких курсов на российском рынке, без учёта дорогих комплексных программ Блок 3: ИИ и RAG-пайплайн
Курс Длительность Цена (на 1 чел.) ₽ Источник цены Ollama: запуск и эксплуатация локальных LLM 16 ак. часов (~2 дня) 40 000 Стоимость варьируется от 20 000 до 155 875 ₽; 40 000 принято за усреднённое значение для технического курса LangChain и RAG: построение поисковых агентов 24 ак. часа (~3 дня) 80 000 Средневзвешенная цена по рынку, исключая максимальные значения Qdrant Essentials (бесплатный) ~6 ак. часов (сам.) 0 Бесплатный курс от вендора Блок 4: Прикладные системы
Курс Длительность Цена (на 1 чел.) ₽ Источник цены Настройка и администрирование 1С:Документооборот 16 ак. часов (~2 дня) 16 500 Онлайн — 16 500 руб. Базовое администрирование Битрикс24 16 ак. часов (~2 дня) 15 000 Курс «Базовое администрирование» — 15 000 ₽ Укрупнённый бюджет самостоятельного развёртывания (3 года)
Статья Подрядчик (ранее) Своя команда Комментарий Оборудование + ПО (капитальные) 18 666 800 ₽ 18 666 800 ₽ Без изменений Услуги по внедрению 7 700 000 ₽ 0 Заменяется собственными трудозатратами Обучение команды (2 чел.) 0 861 000 ₽ 2 × 430 500 ₽ ФОТ двух инженеров на 10 мес. (~0,7 FTE) 0 ~3 500 000 ₽ 2 × 250k × 10 мес. × 0,7 Годовые операционные расходы (×2 года) 12 274 000 ₽ 12 274 000 ₽ Без изменений ИТОГО за 3 года ~38,6 млн ₽ ~35,3 млн ₽ Важно: Сумма в ~35,3 млн ₽ рассчитана при допущении, что два инженера после обучения успешно справятся с проектом за 10 месяцев. На практике, при возникновении критических ошибок, срок может увеличиться до 12–14 месяцев, что приведёт к дополнительным расходам на ФОТ и лицензии.
Оптимальное время развёртывания (своими силами)
Этап 1: Обучение команды (месяцы 1–3)
Параллельное прохождение 10 курсов двумя инженерами.
Создание лабораторного стенда на базе zVirt для практической отработки навыков.
Этап 2: Пилотный проект (месяцы 4–6)
Развёртывание кластера zVirt и управляющей ВМ Deckhouse силами команды.
Запуск Ollama с выбранной моделью, развёртывание Qdrant.
Подключение одного источника (например, тестового контура 1С:Документооборот).
Тестирование базового RAG-пайплайна без RBAC и UI.
Этап 3: Продуктивное внедрение (месяцы 7–10)
Подключение второго источника (Битрикс24).
Внедрение RBAC-фильтрации, системного промпта и защиты от prompt injection.
Разработка UI, интеграция с порталом, настройка сбора фидбека.
Нагрузочное тестирование, итеративное улучшение метрик (Hallucination Rate, Context Precision, Latency), документирование.
Итоговый срок: 8–10 месяцев.
Резюме: Какой бы путь вы ни выбрали — быстрый запуск с подрядчиком или самостоятельное развертывание — оба сценария опираются на полностью импортозамещённый стек (РЕД ОС, zVirt, Deckhouse) и гарантируют полную автономность решения в изолированной среде. Выбор лишь в том, что для вас приоритетнее: сэкономить время или инвестировать в собственные компетенции.