Ваш браузер устарел. Рекомендуем обновить его до последней версии.

План реализации решения On-Premise ИИ‑агента для поиска по корпоративным документам

 Справочно:  рекомендуется также для ознакомления Сценарий: развёртывание собственными силами без внешних компетенций

 


 

Презентация из 9 слайдов (включая финальный с временными оценками). 


Слайд 1. Титульный

On‑Premise ИИ‑агент для поиска по корпоративным документам
Закрытая изолированная сеть (Air Gap)
Стек: РЕД ОС 8, zVirt, Deckhouse Kubernetes Platform


Слайд 2. Технологический стек и требования

  • ОС и контейнеризация: РЕД ОС 8, Podman (штатная замена Docker)

  • Виртуализация: zVirt (кластер из двух серверов 2×Xeon Silver 4314, 384 ГБ RAM)

  • Оркестрация: Deckhouse Kubernetes Platform (реестр Минцифры, ФСТЭК-сертификация)

  • Среда: полная физическая изоляция (Air Gap), без доступа в интернет

  • Источники данных: 1С:Документооборот 2.0, Битрикс24 Энтерпрайз

  • Модели ИИ: Saiga/Mistral 7B (CPU-оптимизированная), multilingual‑e5‑large (эмбеддинги)


Слайд 3. Фаза 0: Подготовка Jump Station и артефактов

Задача: безопасно загрузить и проверить все компоненты вне закрытого контура.

  • Развёртывание временной Jump Station с РЕД ОС 8 и интернетом

  • Загрузка RPM‑пакетов Podman и утилит

  • Скачивание моделей LLM и эмбеддингов (Hugging Face)

  • Формирование офлайн‑репозитория Python‑пакетов

  • Экспорт контейнерных образов (Qdrant, Ollama) через Podman

  • Антивирусная проверка и перенос на отчуждaемый носитель

  • Оформление ввода носителя по регламенту ИБ

Результат: все артефакты готовы к развёртыванию в изолированной сети.


Слайд 4. Фазы 1–2: Инфраструктура и платформа ИИ

Фаза 1 – Отказоустойчивый фундамент

  • Установка zVirt на оба физических сервера, объединение в кластер высокой доступности (Hosted Engine)

  • Создание управляющей ВМ Deckhouse (РЕД ОС 8, развёртывание в offline‑режиме)

  • Добавление рабочих узлов (worker‑ai, worker‑data) с распределением CPU/RAM

Фаза 2 – Inference Server (Ollama)

  • Загрузка образа Ollama в локальный реестр Deckhouse

  • Создание Persistent Volume для моделей, импорт Saiga‑модели

  • Развёртывание Deployment с Ollama, настройка автомасштабирования (HPA)

  • Тестирование API: стабильный ответ, скорость 5–20 токенов/с


Слайд 5. Фазы 3–4: Векторное хранилище и загрузка документов

Фаза 3 – Qdrant и RAG‑сервис

  • Установка Qdrant через Kubernetes Operator, настройка шардирования

  • Микросервис FastAPI для эмбеддингов и поиска

  • Постоянное хранилище для модели эмбеддингов, HPA для RAG‑сервиса

Фаза 4 – ETL‑пайплайн (1С + Битрикс24)

  • CronJob/Deployment для регулярного извлечения документов

  • Интеграция с REST API 1С (договоры, приказы) и Битрикс24 (письма)

  • Парсинг: PDF (текстовый и OCR), DOCX, почтовые сообщения

  • Интеллектуальное чанкование с метаданными и ролевыми метками (access_roles)

  • Индексация в Qdrant с эмбеддингами

Результат: все документы доступны для семантического поиска.


Слайд 6. Фаза 5: Безопасность и логика RAG

  • Системный промпт: жёсткая инструкция – отвечать только на основе контекста, не выдумывать факты

  • Аутентификация: интеграция с LDAP/Active Directory для определения ролей пользователя

  • RBAC‑фильтрация в Qdrant: при поиске документы фильтруются по назначенным ролям доступа (access_roles)

  • Полный RAG‑пайплайн:
    вопрос → эмбеддинг запроса → поиск с роль-фильтром (топ-5) → сбор контекста → отправка в Ollama → ответ с источниками

  • Защита от Prompt Injection: фильтрация вредоносных команд

Гарантия: конфиденциальная информация не раскрывается, ответы строго верифицированы.


Слайд 7. Фазы 6–7: Интерфейс, метрики и масштабирование

Фаза 6 – Пользовательский интерфейс

  • Streamlit‑приложение в Deployment с Ingress (внутренний URL)

  • Интеграция в портал Битрикс24 через iFrame, проброс имени пользователя

  • Кнопки обратной связи ????/????, сохранение фидбека

Фаза 7 – Мониторинг, качество и масштабирование

  • Метрики:

    • Hallucination Rate ≤ 5%

    • Context Precision ≥ 90%

    • Latency P95 ≤ 15 сек

    • Пользовательская оценка ≥ 4/5

  • Мониторинг через Prometheus/Grafana (в составе Deckhouse)

  • Итеративное улучшение на основе отзывов

  • Горизонтальное масштабирование: автоскейлинг подов, шардирование Qdrant, увеличение реплик Ollama

  • Опционально: дообучение модели (LoRA) при накоплении качественных пар «вопрос‑ответ»


Слайд 8. Оптимальное время развёртывания и итоги

 
ФазаСодержаниеОценка длительности
0 Сбор и проверка артефактов 1 неделя
1–2 Кластер zVirt + Deckhouse + Ollama 2–3 недели
3–4 Qdrant, RAG‑сервис, ETL‑интеграция 3–4 недели
5 Безопасность и логика агента 1–2 недели
6 Пользовательский интерфейс, фидбек 1–2 недели
7 Метрики, тестирование, документирование 2–3 недели
Итого Полный цикл «под ключ» 8–12 недель

Ключевые факторы успеха:
✔ Полностью импортозамещённый стек (РЕД ОС, zVirt, Deckhouse)
✔ Отказоустойчивость и горизонтальная масштабируемость
✔ Соответствие требованиям ИБ и регуляторам
✔ Быстрый возврат инвестиций за счёт автоматизации поиска по документам

 

Слайд 9. Бюджет проекта (совокупная стоимость владения)

Итоговая стоимость проекта «под ключ»: от 24,5 млн ₽
*Примечание: Все цены указаны в рублях с НДС и являются оценочными на основе рыночных данных и открытых источников (тендеры, прайс-листы) за 2025–2026 гг.*

1. Серверное оборудование

 
ПозицияКол-воЦена за ед., ₽Сумма, ₽Источник цены
Серверная платформа (шасси, мат. плата, блоки питания, СО, корпус) 2 1 100 000 2 200 000 Оценка на основе конфигураций НИКС S9600/pro4U
Процессор Intel Xeon Silver 4314 OEM (16c/32t, 2.4 GHz) 4 106 200 424 800 Прайс-лист ServerFlow
Модуль памяти 32 ГБ Registered DDR4-3200 ECC 24 38 000 912 000 Оценка рынка
SSD Enterprise NVMe 3.84 ТБ (для данных) 4 280 000 1 120 000 Оценка рынка
SSD 960 ГБ SATA (для ОС) 4 45 000 180 000 Оценка рынка
Сетевой коммутатор 10/25GbE + кабели 1 350 000 350 000 Оценка рынка
Итого, оборудование     5 186 800  

2. Общесистемное и прикладное ПО

 
ПозицияКол-воЦена за ед., ₽Сумма, ₽Источник цены
РЕД ОС 8, конфигурация Сервер, бессрочная лицензия, сертифицированная ФСТЭК 4 190 000 760 000 Данные госзакупок, лот 900 000 ₽ за 5 лицензий
Подсистема виртуализации (zVirt Advanced)        
zVirt Advanced 2CPU (ZV-ADV-2CPU-LIC), бессрочная 2 3 500 000 7 000 000 Оценка на основе тендеров
Техподдержка zVirt Базовый уровень на 1 год (ZV-2CPU-BSUP-1Y) 2 1 150 000 2 300 000 Тендер: 11 302 800 ₽ за 5 лицензий
Подсистема контейнеризации (Deckhouse DKP)        
Deckhouse Kubernetes Platform Enterprise Edition на 32 vCPU в год 32 95 000 3 040 000 Оценка на основе тендеров
Итого, инфраструктурное ПО     13 100 000  

3. Прикладное ПО и интеграционная шина

 
ПозицияКол-воЦена за ед., ₽Сумма, ₽Источник цены
1С:Предприятие 8.3 КОРП. Лицензия на сервер (x86-64) 2 190 000 380 000 Оценка: пропорционально ПРОФ-версии
Итого, прикладное ПО 1   380 000 1С:ДО 8 КОРП и Битрикс24 Энтерпрайз уже приобретены

4. Услуги по интеграции и внедрению

 
ПозицияСтавка / СложностьСрокСумма, ₽Способ оценки
Системная архитектура и аудит безопасности Фиксированная стоимость этапа 1 месяц 1 100 000 Экспертная оценка на основе почасовых ставок
Развертывание и настройка кластера zVirt + Deckhouse (offline) Фиксированная стоимость этапа 1.5 месяца 1 850 000 Экспертная оценка
Интеграция RAG-пайплайна, настройка Qdrant, ETL-воркеров (1С + Битрикс24) Фиксированная стоимость этапа 2 месяца 2 900 000 Экспертная оценка; рыночные данные Chatlabs
Разработка UI (Streamlit), настройка RBAC/LDAP, внедрение фидбек-лупа Фиксированная стоимость этапа 1.5 месяца 1 850 000 Экспертная оценка
Итого, услуги по внедрению     7 700 000  

5. Ежегодные операционные расходы (год 2 и далее)

 
Статья расходовСумма в год, ₽
Техническая поддержка и обновления: zVirt (2×Standard) + Deckhouse (32 vCPU Enterprise) 2 900 000
Продление лицензий (опционально): Битрикс24 Энтерпрайз (льготное 30%) 399 000
Администрирование и мониторинг: 1 ставка DevOps-инженера (частичная занятость, ~0.5 FTE) 1 800 000
Затраты на электропитание и охлаждение (ЦОД) 480 000
Непредвиденные расходы (10% резерв) 558 000
Итого, годовые операционные расходы 6 137 000

Совокупная стоимость владения (3 года)

 
КомпонентСумма, ₽
Капитальные затраты (оборудование + ПО + интеграция) 26 366 800
Операционные расходы за 2 последующих года (2 × 6 137 000) 12 274 000
Общая стоимость владения за 3 года ≈ 38,6 млн ₽
Эквивалент ежемесячных затрат ≈ 1,07 млн ₽/мес

Важно: Все цены являются индикативными и основаны на данных открытых тендеров и прайс-листов. Финальная стоимость будет определена по результатам тендера и уточнения требований. В расчете не учтены возможные скидки при комплексной закупке у одного интегратора.

 

 

Сценарий: развёртывание собственными силами без внешних компетенций

Если вы решите развернуть ИИ-агента полностью силами своей команды, не привлекая внешнего подрядчика, сценарий радикально меняется. Главный ресурс здесь — время на обучение сотрудников, поскольку без профильных компетенций в стеке РЕД ОС / zVirt / Deckhouse / RAG вы неизбежно столкнётесь с длительными простоями и дорогостоящими ошибками.

Вместо линейного выполнения семи фаз за 8–12 недель силами подрядчика, ваш проект трансформируется в трёхэтапную программу: «Обучение → Пилот → Продуктив», которая займёт у команды из двух инженеров не менее 8–10 месяцев.

Плюсы и минусы подхода

 
АспектПодрядчикСвоя команда
Время до продуктивного запуска 8–12 недель 8–10 месяцев
Денежные затраты (разовые) 26,4 млн ₽ ~26,9 млн ₽
Риск архитектурных ошибок На подрядчике На вас
Зависимость от внешней экспертизы Высокая Отсутствует
Сохранение компетенций внутри Нет Да
Качество финального решения Гарантировано договором Зависит от квалификации команды

Вывод: Самостоятельный путь дороже и дольше, но компетенции остаются внутри компании навсегда.

Перечень необходимых курсов для команды из 2-х инженеров

Для успешной реализации проекта вам потребуется закрыть три ключевых блока компетенций:

Блок 1: Базовая инфраструктура

 
КурсДлительностьЦена (на 1 чел.) ₽Источник цены
Расширенное администрирование РЕД ОС 40 ак. часов (~5 дней) 48 000 Стоимость со скидкой — 48 000 рублей (с учетом НДС 20%) за 40 академических часов
Установка и основы администрирования zVirt 4.5 32 ак. часа (~4 дня) 70 000 Программа повышения квалификации — 70 000,00 руб. за человека
Администрирование Deckhouse Kubernetes Platform ~24 ак. часа (~3 дня) 70 000 Стоимость курса — 70 000 рублей (без учёта НДС)

Блок 2: Контейнеризация и микросервисы

 
КурсДлительностьЦена (на 1 чел.) ₽Источник цены
Podman: контейнеризация в РЕД ОС 24 ак. часа (~3 дня) 55 000 Экспертная оценка на основе данных зарубежных курсов, скорректированная до российского рынка (~€590 ≈ 55 000 ₽)
FastAPI: промышленная разработка микросервисов 24 ак. часа (~3 дня) 36 000 Средняя стоимость коротких курсов на российском рынке, без учёта дорогих комплексных программ

Блок 3: ИИ и RAG-пайплайн

 
КурсДлительностьЦена (на 1 чел.) ₽Источник цены
Ollama: запуск и эксплуатация локальных LLM 16 ак. часов (~2 дня) 40 000 Стоимость варьируется от 20 000 до 155 875 ₽; 40 000 принято за усреднённое значение для технического курса
LangChain и RAG: построение поисковых агентов 24 ак. часа (~3 дня) 80 000 Средневзвешенная цена по рынку, исключая максимальные значения
Qdrant Essentials (бесплатный) ~6 ак. часов (сам.) 0 Бесплатный курс от вендора

Блок 4: Прикладные системы

 
КурсДлительностьЦена (на 1 чел.) ₽Источник цены
Настройка и администрирование 1С:Документооборот 16 ак. часов (~2 дня) 16 500 Онлайн — 16 500 руб.
Базовое администрирование Битрикс24 16 ак. часов (~2 дня) 15 000 Курс «Базовое администрирование» — 15 000 ₽

Укрупнённый бюджет самостоятельного развёртывания (3 года)

 
СтатьяПодрядчик (ранее)Своя командаКомментарий
Оборудование + ПО (капитальные) 18 666 800 ₽ 18 666 800 ₽ Без изменений
Услуги по внедрению 7 700 000 ₽ 0 Заменяется собственными трудозатратами
Обучение команды (2 чел.) 0 861 000 ₽ 2 × 430 500 ₽
ФОТ двух инженеров на 10 мес. (~0,7 FTE) 0 ~3 500 000 ₽ 2 × 250k × 10 мес. × 0,7
Годовые операционные расходы (×2 года) 12 274 000 ₽ 12 274 000 ₽ Без изменений
ИТОГО за 3 года ~38,6 млн ₽ ~35,3 млн ₽  

Важно: Сумма в ~35,3 млн ₽ рассчитана при допущении, что два инженера после обучения успешно справятся с проектом за 10 месяцев. На практике, при возникновении критических ошибок, срок может увеличиться до 12–14 месяцев, что приведёт к дополнительным расходам на ФОТ и лицензии.

Оптимальное время развёртывания (своими силами)

Этап 1: Обучение команды (месяцы 1–3)

  • Параллельное прохождение 10 курсов двумя инженерами.

  • Создание лабораторного стенда на базе zVirt для практической отработки навыков.

Этап 2: Пилотный проект (месяцы 4–6)

  • Развёртывание кластера zVirt и управляющей ВМ Deckhouse силами команды.

  • Запуск Ollama с выбранной моделью, развёртывание Qdrant.

  • Подключение одного источника (например, тестового контура 1С:Документооборот).

  • Тестирование базового RAG-пайплайна без RBAC и UI.

Этап 3: Продуктивное внедрение (месяцы 7–10)

  • Подключение второго источника (Битрикс24).

  • Внедрение RBAC-фильтрации, системного промпта и защиты от prompt injection.

  • Разработка UI, интеграция с порталом, настройка сбора фидбека.

  • Нагрузочное тестирование, итеративное улучшение метрик (Hallucination Rate, Context Precision, Latency), документирование.

Итоговый срок: 8–10 месяцев.


Резюме: Какой бы путь вы ни выбрали — быстрый запуск с подрядчиком или самостоятельное развертывание — оба сценария опираются на полностью импортозамещённый стек (РЕД ОС, zVirt, Deckhouse) и гарантируют полную автономность решения в изолированной среде. Выбор лишь в том, что для вас приоритетнее: сэкономить время или инвестировать в собственные компетенции.