Билол Саидумаров
Все статьи

Документный AI в гос-секторе: 4 кейса и где мы отстаём

22 июля 2025 · 6 минут · гос-IT, документы, AI
Если коротко
  • Четыре сценария, в которых документный AI уже работает у других — и не требует фантастики.
  • Где у Узбекистана уже стоит фундамент, на котором это собирается за месяцы, а не годы.
  • Один кейс, который реалистично запустить пилотом на следующей неделе.
Изображение · hero · 1600×900
Бумажная стопка проходит через мягкий луч света и появляется с другой стороны уже как аккуратные карточки с полями на экране.
Minimalist editorial illustration: a stack of official-looking paper documents on the left, a soft beam of light passing through them transforms them into clean structured data cards floating on a digital screen on the right. Calm violet-to-indigo gradient, no logos, no readable text, professional editorial style, 16:9, 1600x900.

Маленькая Эстония автоматизировала большую часть бумажного документооборота к 2018 году. С населением в десять раз меньше нашего.

То есть проблема не в масштабе. Проблема в том, что мы продолжаем считать «AI в гос-секторе» темой про будущее. А он уже стоит в продакшене — просто не у нас.

Кейс 1. Налоговые декларации заполняются сами

В России ФНС за десять лет довела дело до того, что большинство физлиц декларацию вообще не подают. Она собирается автоматически из данных работодателей, банков, нотариусов.

AI-часть — классификация поступающих документов (договор / справка / решение), извлечение полей, сверка с реестрами.

Где Узбекистан: налоговая давно интегрирована с банками, «Soliq» — рабочее приложение. Следующий шаг — автоклассификация сканов и предзаполнение форм для ИП и самозанятых.

Кейс 2. Закупки под прицелом алгоритма

Сингапур и Эстония запускают модели по тендерной документации в поиске «закладок»: подозрительно специфические требования, аффилированные участники, типовые формулировки под одного победителя.

Технически — embeddings + ранжирование документов по похожести с «известными плохими» паттернами. Никакой магии.

Где Узбекистан: платформа закупок есть (xarid.uzex.uz). Поверх неё можно построить мониторинг — нужны эмбеддинги и 500 размеченных примеров «нормально» / «подозрительно». Месячный проект, не годовой.

Кейс 3. Обращения граждан, которые не теряются в регистратуре

my.gov.uz, портал президента, отраслевые страницы — сотни тысяч обращений в год. Сейчас многие сортируются вручную операторами, которым физически не угнаться.

AI-кейс простой: классификация по теме (ЖКХ / землеотвод / здравоохранение / ...) и маршрутизация в нужное ведомство. Время первого ответа падает в разы.

Где Узбекистан: данные уже собираются. Многоязычность (узбекская кириллица + латиница + русский) — место, где локальная экспертиза критична. Универсальные модели здесь промахиваются.

Кейс 4. Архивы перестают быть кладбищем

Миллионы PDF-сканов договоров, постановлений, кадастровых записей лежат в архивах. Сегодня — это бумажная масса. OCR + LLM-валидация превращает её в структурированную базу, по которой можно искать одним SELECT.

Где Узбекистан: часть архивов ещё не оцифрована — это первый этап. Второй — OCR с тремя алфавитами (узбекская кириллица, узбекская латиница, русский). PaddleOCR и Surya — открытые решения, которые с этим справляются. Бесплатно.

Что у нас уже стоит в фундаменте

  • E-imzo давно интегрирована — половина compliance-проблем закрывается сразу.
  • my.gov.uz централизованно обрабатывает многие услуги — есть платформа для AI-слоя.
  • Сильное мобильное проникновение. Граждане готовы взаимодействовать с телефоном — не нужно строить кабинетные окошки.
  • Меньший масштаб. Пилот в одном ведомстве покроет значимую долю реальных кейсов быстрее, чем у соседей.

С чего начать на следующей неделе

Самый дешёвый и заметный кейс — сортировка обращений граждан.

Нужно: 5 000 размеченных обращений с тегами темы, эмбеддер bge-m3, простой классификатор. Через месяц — пилот в одном ведомстве. Через три — рабочая система с измеримой метрикой времени первого ответа.

Это не «цифровая трансформация на десятилетие». Это один квартал и один тимлид.

Что сделать дальше
  • Внутри ведомства — выберите один документный поток с большим объёмом и измеримой метрикой обработки.
  • Сделайте недельный аудит: сколько ручных операций можно убрать с минимальным риском.
  • Архитектуру можно подсмотреть в демо ARA — это рабочий каркас, не финальный продукт.