Документный AI в гос-секторе: 4 кейса и где мы отстаём

Маленькая Эстония автоматизировала большую часть бумажного документооборота к 2018 году. С населением в десять раз меньше нашего.

То есть проблема не в масштабе. Проблема в том, что мы продолжаем считать «AI в гос-секторе» темой про будущее. А он уже стоит в продакшене — просто не у нас.

Кейс 1. Налоговые декларации заполняются сами

В России ФНС за десять лет довела дело до того, что большинство физлиц декларацию вообще не подают. Она собирается автоматически из данных работодателей, банков, нотариусов.

AI-часть — классификация поступающих документов (договор / справка / решение), извлечение полей, сверка с реестрами.

Где Узбекистан: налоговая давно интегрирована с банками, «Soliq» — рабочее приложение. Следующий шаг — автоклассификация сканов и предзаполнение форм для ИП и самозанятых.

Кейс 2. Закупки под прицелом алгоритма

Сингапур и Эстония запускают модели по тендерной документации в поиске «закладок»: подозрительно специфические требования, аффилированные участники, типовые формулировки под одного победителя.

Технически — embeddings + ранжирование документов по похожести с «известными плохими» паттернами. Никакой магии.

Где Узбекистан: платформа закупок есть (xarid.uzex.uz). Поверх неё можно построить мониторинг — нужны эмбеддинги и 500 размеченных примеров «нормально» / «подозрительно». Месячный проект, не годовой.

Кейс 3. Обращения граждан, которые не теряются в регистратуре

my.gov.uz, портал президента, отраслевые страницы — сотни тысяч обращений в год. Сейчас многие сортируются вручную операторами, которым физически не угнаться.

AI-кейс простой: классификация по теме (ЖКХ / землеотвод / здравоохранение / ...) и маршрутизация в нужное ведомство. Время первого ответа падает в разы.

Где Узбекистан: данные уже собираются. Многоязычность (узбекская кириллица + латиница + русский) — место, где локальная экспертиза критична. Универсальные модели здесь промахиваются.

Кейс 4. Архивы перестают быть кладбищем

Миллионы PDF-сканов договоров, постановлений, кадастровых записей лежат в архивах. Сегодня — это бумажная масса. OCR + LLM-валидация превращает её в структурированную базу, по которой можно искать одним SELECT.

Где Узбекистан: часть архивов ещё не оцифрована — это первый этап. Второй — OCR с тремя алфавитами (узбекская кириллица, узбекская латиница, русский). PaddleOCR и Surya — открытые решения, которые с этим справляются. Бесплатно.

Что у нас уже стоит в фундаменте

E-imzo давно интегрирована — половина compliance-проблем закрывается сразу.
my.gov.uz централизованно обрабатывает многие услуги — есть платформа для AI-слоя.
Сильное мобильное проникновение. Граждане готовы взаимодействовать с телефоном — не нужно строить кабинетные окошки.
Меньший масштаб. Пилот в одном ведомстве покроет значимую долю реальных кейсов быстрее, чем у соседей.

С чего начать на следующей неделе

Самый дешёвый и заметный кейс — сортировка обращений граждан.

Нужно: 5 000 размеченных обращений с тегами темы, эмбеддер bge-m3, простой классификатор. Через месяц — пилот в одном ведомстве. Через три — рабочая система с измеримой метрикой времени первого ответа.

Это не «цифровая трансформация на десятилетие». Это один квартал и один тимлид.