Документный AI в гос-секторе: 4 кейса и где мы отстаём
Если коротко
- Четыре сценария, в которых документный AI уже работает у других — и не требует фантастики.
- Где у Узбекистана уже стоит фундамент, на котором это собирается за месяцы, а не годы.
- Один кейс, который реалистично запустить пилотом на следующей неделе.
Minimalist editorial illustration: a stack of official-looking paper documents on the left, a soft beam of light passing through them transforms them into clean structured data cards floating on a digital screen on the right. Calm violet-to-indigo gradient, no logos, no readable text, professional editorial style, 16:9, 1600x900.
Маленькая Эстония автоматизировала большую часть бумажного документооборота к 2018 году. С населением в десять раз меньше нашего.
То есть проблема не в масштабе. Проблема в том, что мы продолжаем считать «AI в гос-секторе» темой про будущее. А он уже стоит в продакшене — просто не у нас.
Кейс 1. Налоговые декларации заполняются сами
В России ФНС за десять лет довела дело до того, что большинство физлиц декларацию вообще не подают. Она собирается автоматически из данных работодателей, банков, нотариусов.
AI-часть — классификация поступающих документов (договор / справка / решение), извлечение полей, сверка с реестрами.
Где Узбекистан: налоговая давно интегрирована с банками, «Soliq» — рабочее приложение. Следующий шаг — автоклассификация сканов и предзаполнение форм для ИП и самозанятых.
Кейс 2. Закупки под прицелом алгоритма
Сингапур и Эстония запускают модели по тендерной документации в поиске «закладок»: подозрительно специфические требования, аффилированные участники, типовые формулировки под одного победителя.
Технически — embeddings + ранжирование документов по похожести с «известными плохими» паттернами. Никакой магии.
Где Узбекистан: платформа закупок есть (xarid.uzex.uz). Поверх неё можно построить мониторинг — нужны эмбеддинги и 500 размеченных примеров «нормально» / «подозрительно». Месячный проект, не годовой.
Кейс 3. Обращения граждан, которые не теряются в регистратуре
my.gov.uz, портал президента, отраслевые страницы — сотни тысяч обращений в год. Сейчас многие сортируются вручную операторами, которым физически не угнаться.
AI-кейс простой: классификация по теме (ЖКХ / землеотвод / здравоохранение / ...) и маршрутизация в нужное ведомство. Время первого ответа падает в разы.
Где Узбекистан: данные уже собираются. Многоязычность (узбекская кириллица + латиница + русский) — место, где локальная экспертиза критична. Универсальные модели здесь промахиваются.
Кейс 4. Архивы перестают быть кладбищем
Миллионы PDF-сканов договоров, постановлений, кадастровых записей лежат в архивах. Сегодня — это бумажная масса. OCR + LLM-валидация превращает её в структурированную базу, по которой можно искать одним SELECT.
Где Узбекистан: часть архивов ещё не оцифрована — это первый этап. Второй — OCR с тремя алфавитами (узбекская кириллица, узбекская латиница, русский). PaddleOCR и Surya — открытые решения, которые с этим справляются. Бесплатно.
Что у нас уже стоит в фундаменте
- E-imzo давно интегрирована — половина compliance-проблем закрывается сразу.
- my.gov.uz централизованно обрабатывает многие услуги — есть платформа для AI-слоя.
- Сильное мобильное проникновение. Граждане готовы взаимодействовать с телефоном — не нужно строить кабинетные окошки.
- Меньший масштаб. Пилот в одном ведомстве покроет значимую долю реальных кейсов быстрее, чем у соседей.
С чего начать на следующей неделе
Самый дешёвый и заметный кейс — сортировка обращений граждан.
Нужно: 5 000 размеченных обращений с тегами темы, эмбеддер bge-m3, простой классификатор. Через месяц — пилот в одном ведомстве. Через три — рабочая система с измеримой метрикой времени первого ответа.
Это не «цифровая трансформация на десятилетие». Это один квартал и один тимлид.
- Внутри ведомства — выберите один документный поток с большим объёмом и измеримой метрикой обработки.
- Сделайте недельный аудит: сколько ручных операций можно убрать с минимальным риском.
- Архитектуру можно подсмотреть в демо ARA — это рабочий каркас, не финальный продукт.