Кыргызстан создаст Корпус национального языка — генеральный директор IT-компании
Кыргызстан создаст корпус национального языка и оцифрует архив КТРК для развития искусственного интеллекта, заявил генеральный директор Ulut Soft Мирбек Окенов во время панельной сессии «Инфраструктура искусственного интеллекта: от центров обработки данных до глобальных сетей» на форуме KIT-2025, сообщает Centr.Asia со ссылкой на AKIpress.
По его словам, государство планирует создать корпус кыргызского языка, который станет основой для дальнейшего развития искусственного интеллекта.
«В следующем году планируется оцифровать золотой фонд КТРК, включая архивные радиозаписи с советского периода до наших дней. Мы сохранили огромное количество уникального контента, который станет важной частью этого корпуса», — отметил Окенов.
Он также сказал, что проблема нехватки данных для обучения ИИ постепенно теряет актуальность из-за развития синтетических наборов данных.
«Искусственный интеллект уже может сам создавать обучающие данные. Важно только правильно направить этот процесс. Поэтому разработчикам не нужно ограничиваться только реальными текстами — синтетические наборы данных также играют важную роль», — добавил он.