Суверенитет ИИ: как страны создают собственные нейросети
12 июня 2026 года Anthropic по директиве Министерства торговли США отключила доступ к Fable 5 и Mythos 5 для всех пользователей за пределами страны. Уведомления не было — только сообщение об ошибке в привычном интерфейсе.

Язык как граница модели
Глобальные модели обучены на англоязычных текстах. Для 22 официальных языков Индии — хинди, бенгали, тамили — это означает системное отставание: токенизация, словарный запас, контекстные веса заточены под латинский шаблон. Sarvam Vision, запущенный в феврале 2026 года, обучался на правительственных архивах, смешанных шрифтах и рукописных штампах. На бенчмарке olmOCR-Bench точность составила 84,3% — против 80,2% у Gemini 3 Pro и 69,8% у GPT-5.2. Разрыв не маркетинговый: для задач гражданских сервисов, медицинских карт и налоговой отчётности локальная модель с правильным датасетом выигрывает у западных аналогов.
Для инженеров это переводится в конкретные метрики: precision на доменных данных, размер словаря, поддержка смешанной письменности. Гигантская модель общего назначения не нужна — нужна узкая, обученная на локальных корпусах, с данными, хранящимися в юрисдикции.
Регуляторика и физика данных
С августа 2026 года в полную силу вступает AI Act — классификация систем по уровням риска, жёсткие требования к документации и тестированию, запрет социального скоринга. Параллельно работает американский Cloud Act: данные у провайдеров из США доступны властям США по запросу, независимо от физического расположения сервера. Французская DGSI уже заменяет Palantir на ChapsVision — без скандала, сухим расчётом на юридическую несовместимость.
AWS ответил инфраструктурно: 15 января 2026 года запущен European Sovereign Cloud в Бранденбурге, изолированный физически и логически от остальных регионов, под управлением граждан ЕС. Бюджет — 7,8 млрд евро. Техническая изоляция реализуема; юридическая защита от запросов по Cloud Act остаётся открытым вопросом — ни одна архитектура не гарантирует иммунитет, если провайдер обязан подчиняться экстерриториальной юрисдикции.
Что осталось нерешённым
Блокировка Fable 5 и Mythos 5 показала: отключение происходит за часы, без переходного периода, без возможности каскадного переключения. Для CTO, чей продукт зависит от такого API, это уже не гипотетический сценарий.
Незакрытые проблемы:
- Обучение локальной модели требует локальных датасетов, а они зачастую закрыты или не размечены.
- Суверенные облака решают вопрос хранения, но не устраняют зависимость от upstream-компонент — компиляторов, библиотек, весов базовых моделей.
- Точность на бенчмарке не равна точности в проде: olmOCR-Bench покрывает документы, а не устную речь, не диалекты, не смешанные коды.
- Переключение между провайдерами требует абстракции на уровне интеграции — её пока нет в виде стандарта.
Мультиполярность ИИ — не идеология, а инженерное следствие из трёх одновременных процессов: лингвистической локализации, регуляторного давления и физики хранения данных. Каждый из них порождает отдельный стек, отдельный дата-центр и отдельную работу по интеграции.