Казахстан объявил о готовности участвовать в создании большой тюркской языковой модели –– нейросети, которая понимает и генерирует тексты на тюркских языках с учетом их культурного контекста. Об этом в Астане сообщил министр искусственного интеллекта и цифрового развития Жаслан Мадиев на встрече с азербайджанским коллегой Рашадом Набиевым.
Идея проста: создать алгоритм, который будет работать не только с английским, но и с казахским, турецким, кыргызским, узбекским, азербайджанским и другими тюркскими языками. Сегодня большинство глобальных ИИ-моделей – от GPT‑4 до LLaMA – обучены в первую очередь на английской базе. Из-за этого региональные языки остаются на периферии: переводчики выдают случайные конструкции, голосовые помощники путают интонации, а образовательные платформы не всегда понимают контекст.
Тюркская модель должна решить эту проблему. Она позволит создавать цифровые сервисы, которые действительно работают для местных пользователей: от голосовых ассистентов и автоматических переводчиков до школьных платформ, где уроки будут объясняться не через английские термины, а привычными примерами. Для государства это – шанс ускорить цифровизацию: чат-боты, госуслуги и справочные системы на казахском смогут разговаривать с пользователями без характерной «машинной» ломкости.
Есть и экономический эффект. Локальные ИИ-модели открывают рынок для стартапов, которые могут разрабатывать продукты сразу для десятков миллионов носителей тюркских языков. Это должно повысить конкурентоспособность регионального ИТ-сектора и уменьшить зависимость от зарубежных технологий.
Казахстан входит в проект не с нуля: у страны уже есть собственные модели – KazLLM и AlemLLM – и инфраструктура для масштабной работы с ИИ. Национальный суперкомпьютерный центр Alem.Cloud, крупнейший в Центральной Азии, в идеале позволит обучать модели на массивных корпусах текстов.
Вдохновляет и международный опыт: проекты по созданию локальных моделей для африканских, индийских и арабских языков показывают, что настраивать ИИ под конкретные регионы не тренд, а необходимость. Тюркские языки, на которых говорят более 200 млн человек, до сих пор практически отсутствуют в глобальных ИИ-системах. Новый проект призван изменить это и одновременно укрепить цифровой суверенитет стран региона.
Казахстан и Азербайджан уже сотрудничают в ИТ-сфере через Astana Hub и Silkroad Innovation Hub в США, поддерживают стартапы и реализуют совместные ИИ-проекты. Во время визита президента Азербайджана стороны подписали новые меморандумы, в том числе о сотрудничестве в сфере искусственного интеллекта и цифровых госуслуг.
Али Саматұлы, «D»