Четверг , 6 ноября 2025

Нейросеть по-тюркски

Казах­стан объ­явил о готов­но­сти участ­во­вать в созда­нии боль­шой тюрк­ской язы­ко­вой моде­ли –– ней­ро­се­ти, кото­рая пони­ма­ет и гене­ри­ру­ет тек­сты на тюрк­ских язы­ках с уче­том их куль­тур­но­го кон­тек­ста. Об этом в Астане сооб­щил министр искус­ствен­но­го интел­лек­та и циф­ро­во­го раз­ви­тия Жаслан Мади­ев на встре­че с азер­бай­джан­ским кол­ле­гой Раша­дом Набиевым.

Идея про­ста: создать алго­ритм, кото­рый будет рабо­тать не толь­ко с англий­ским, но и с казах­ским, турец­ким, кыр­гыз­ским, узбек­ским, азер­бай­джан­ским и дру­ги­ми тюрк­ски­ми язы­ка­ми. Сего­дня боль­шин­ство гло­баль­ных ИИ-моде­лей – от GPT‑4 до LLaMA – обу­че­ны в первую оче­редь на англий­ской базе. Из-за это­го реги­о­наль­ные язы­ки оста­ют­ся на пери­фе­рии: пере­вод­чи­ки выда­ют слу­чай­ные кон­струк­ции, голо­со­вые помощ­ни­ки пута­ют инто­на­ции, а обра­зо­ва­тель­ные плат­фор­мы не все­гда пони­ма­ют контекст.

Тюрк­ская модель долж­на решить эту про­бле­му. Она поз­во­лит созда­вать циф­ро­вые сер­ви­сы, кото­рые дей­стви­тель­но рабо­та­ют для мест­ных поль­зо­ва­те­лей: от голо­со­вых асси­стен­тов и авто­ма­ти­че­ских пере­вод­чи­ков до школь­ных плат­форм, где уро­ки будут объ­яс­нять­ся не через англий­ские тер­ми­ны, а при­выч­ны­ми при­ме­ра­ми. Для госу­дар­ства это – шанс уско­рить циф­ро­ви­за­цию: чат-боты, госус­лу­ги и спра­воч­ные систе­мы на казах­ском смо­гут раз­го­ва­ри­вать с поль­зо­ва­те­ля­ми без харак­тер­ной «машин­ной» ломкости.

Есть и эко­но­ми­че­ский эффект. Локаль­ные ИИ-моде­ли откры­ва­ют рынок для стар­та­пов, кото­рые могут раз­ра­ба­ты­вать про­дук­ты сра­зу для десят­ков мил­ли­о­нов носи­те­лей тюрк­ских язы­ков. Это долж­но повы­сить кон­ку­рен­то­спо­соб­ность реги­о­наль­но­го ИТ-сек­то­ра и умень­шить зави­си­мость от зару­беж­ных технологий.

Казах­стан вхо­дит в про­ект не с нуля: у стра­ны уже есть соб­ствен­ные моде­ли – KazLLM и AlemLLM – и инфра­струк­ту­ра для мас­штаб­ной рабо­ты с ИИ. Наци­о­наль­ный супер­ком­пью­тер­ный центр Alem.Cloud, круп­ней­ший в Цен­траль­ной Азии, в иде­а­ле поз­во­лит обу­чать моде­ли на мас­сив­ных кор­пу­сах текстов.

Вдох­нов­ля­ет и меж­ду­на­род­ный опыт: про­ек­ты по созда­нию локаль­ных моде­лей для афри­кан­ских, индий­ских и араб­ских язы­ков пока­зы­ва­ют, что настра­и­вать ИИ под кон­крет­ные реги­о­ны не тренд, а необ­хо­ди­мость. Тюрк­ские язы­ки, на кото­рых гово­рят более 200 млн чело­век, до сих пор прак­ти­че­ски отсут­ству­ют в гло­баль­ных ИИ-систе­мах. Новый про­ект при­зван изме­нить это и одно­вре­мен­но укре­пить циф­ро­вой суве­ре­ни­тет стран региона.

Казах­стан и Азер­бай­джан уже сотруд­ни­ча­ют в ИТ-сфе­ре через Astana Hub и Silkroad Innovation Hub в США, под­дер­жи­ва­ют стар­та­пы и реа­ли­зу­ют сов­мест­ные ИИ-про­ек­ты. Во вре­мя визи­та пре­зи­ден­та Азер­бай­джа­на сто­ро­ны под­пи­са­ли новые мемо­ран­ду­мы, в том чис­ле о сотруд­ни­че­стве в сфе­ре искус­ствен­но­го интел­лек­та и циф­ро­вых госуслуг.

Али Саматұ­лы, «D»

Республиканский еженедельник онлайн