- 5 июня 2022
- 10:27
Разработчик эвенкийского голосового приложения «Ayana» Николай Апросимов рассуждает о том, можно ли нейросеть обучить языкам коренных народов, и рассказывает, почему машина пока не может говорить как человек.
В Республике Саха (Якутия) молодой изобретатель Николай Апросимов создал эвенкийского голосового помощника. Приложение получило имя «Ayana». Недавно Николай представил офлайн-версию программы, которая позволяет общаться с виртуальным персонажем без стабильного доступа в Интернет. Это особенно актуально для отдаленных районов, где проживают носители эвенкийского языка. Николай продолжает дорабатывать свое детище. «Ayana» уже может считать и отвечать на простые вопросы, а также рассылать push-уведомления на русском и эвенкийском языках. Планы Николая амбициозны. Он уверен: в будущем «Ayana» может стать столь же мощной, как «Алиса» или «Siri». О том, как искусственный интеллект удалось обучить эвенкийским словам, Николай рассказал «КМНСОЮЗ-NEWS».
– Николай, были ли вы в детстве погружены в эвенкийскую среду?
– Я родился в селе Кюпцы Усть-Майского улуса Якутии. Мои родители – эвенки, я – внук звенкийского поэта и художника Дмитрия Апросимова. В нашем селе проживает много этнических эвенков. Но, несмотря на все это, к большому сожалению, родной язык я в детстве почти не слышал и с культурой эвенкийского народа практически не пересекался.
В восьмом классе меня отправили в школу-интернат «Арткика» в городе Нерюнгри. Именно там я впервые начал изучать родной язык. Эвенкийский нам преподавала легендарный педагог Клавдия Иннокентьевна Макарова.
Сразу признаюсь, язык у меня шел очень тяжело, я не запоминал правила, путал слова. Но Клавдия Иннокентьевна учила не сдаваться, говорила, что язык необходим, что его нужно сохранить. Сейчас я часто эти ее слова вспоминаю. Ну а тогда, после школы, я приехал в Якутск, поступил на эколога в Северо-Восточный федеральный университет имени М.К. Аммосова. Среди моих знакомых и друзей были этнические эвенки, но мало кто на родном языке говорил. И язык я на какое-то время забыл.
– Как вы ушли в IT?
– Я окончил вуз, между прочим, с отличием. Но работу по специальности найти не смог. Устраивался в Якутске в магазины, подрабатывал грузчиком. У меня на тот момент уже была семья, родился ребенок, нужно было думать не только о себе. В Усть-Майском улусе мне предложили работу лесника. Зарплата была смешной, но от муниципалитета давали квартиру. Поэтому мы согласились на переезд. Я искал возможности для дополнительного заработка, в какой-то момент стал снимать ролики для промышленных компаний. В 2016 году один из моих заказчиков предложил создать сайт для их предприятия.
Я тогда понятия не имел, как это делать. Понимал, что в принципе можно всему научиться по Интернету. Но и здесь были свои сложности, дело не только в технической части. Интернет в родном улусе был очень медленный и дорогой. Один мегабайт, как сейчас помню, стоил два рубля. Но ночью по тарифу можно было пользоваться безлимитно. Я учился созданию сайтов по ночам, пользовался уроками на видеохостингах, изучал скрипты. В итоге за месяц я сделал сайт. Заказчику все понравилось.
Мне и самому стало интересно. Со временем мы с семьей переехали из Усть-Майского улуса в Амгинский район, я устроился в тамошний культурный центр и спустя какое-то время сделал им сайт. Тогда я начал понимать, что хочу заниматься именно технологиями.
Я подумал, что было бы здорово создать приложение, работающее по принципу агрегатора, которое соединяло бы желающих учить язык и их педагогов.
– Как появилось приложение «Ayana»?
– Работая в Амгинском центре культуры, я погрузился в этническую тематику, стал ездить на какие-то форумы, участвовать в мероприятиях. В 2019 году я побывал на форуме молодежи «Синергия Севера», там все участники предлагали какие-то проекты. Я тогда выступил с инициативой создать приложение-агрегатор для записи на курсы эвенкийского языка. В том же Якутске есть школы, где бесплатно обучают родным языкам. Но проблема в том, что люди, которые этим интересуются, не знают, как найти эти курсы. И я подумал, что было бы здорово создать приложение, работающее по принципу агрегатора, которое соединяло бы желающих учить язык и их педагогов.
Но когда я представил этот проект, мою идею раскритиковали. В частности, мне сказали, что создавать такой агрегатор нецелесообразно, ведь занятия проводятся по мере комплектования групп. То есть если такое приложение появится, то человеку, желающему выучить язык, нужно будет подавать заявку, ждать, когда соберется достаточное количество участников, потом куда-то ехать, подстраиваться под график занятий. Я посмотрел правде в глаза, действительно, все так и было.
Мне предложили тогда двигаться в сторону создания приложения, с помощью которого можно было бы выучить язык. Я подумал, что, да, это хорошая идея и стал работать над созданием переводчика. Параллельно начал искать гранты и НКО, которые могли бы помочь мне в реализации этой идеи. Самостоятельно, что называется, в свободное от работы время, такую вещь не создать.
Я понимал, что использование искусственного интеллекта, нейросетей, может быть гораздо более эффективным, чем просто загруженный в приложение словарь.
Поначалу меня преследовали неудачи. Я подавал заявку за заявкой, но победить не получалось. Но я продолжал искать союзников. Однажды мне позвонили из НКО «Алагун» и предложили помочь в составлении грантовой заявки в Министерство по развитию Арктики. Представитель «Алагун» Диана Сергеева хорошо помогла в создании заявки, упаковке документации и в итоге мы выиграли. В гарантиях, которые нужно было на себя взять по условиям гранта, указывалось, что мы обязуемся создать мощный переводчик, который бы работал на основе искусственного интеллекта.
К тому моменту я понимал, что использование искусственного интеллекта, нейросетей, может быть гораздо более эффективным, чем просто загруженный в приложение словарь. Но, признаюсь, я тогда понятия не имел, как пишутся нейросети и как происходит их обучение. Я пробовал разные способы, учился сам, обучал свою нейросеть, и вот в декабре 2020 года она смогла перевести первую пару слов. У меня тогда, признаюсь, уже была сильная усталость, я не знал, получится ли все это. Но когда «Aяна» заговорила, у меня как будто выросли крылья.
– Кто вам помогал в техническом плане?
– По программной части я сотрудничал с ребятами из Москвы. Они очень меня поддерживали, часто говорили, что задача очень интересная и необычная. В какой-то момент эти ребята перестали выходить на связь, я уже отчаялся, и вдруг мне неожиданно пришла помощь из Лондона. Совершенно незнакомый человек отправил мне видеобращение на английском с ключами, которые помогли запустить «Аяну». С адаптацией мобильного приложения после десктопной версии мне помогали ребята из Томска, а внедрение скриптов в «Марусю» и «Алису» я сам сделал.
В эвенкийском языке есть слово «Ая», оно означает «хороший». И наша «Аяна» в переводе на эвенкийский звучит как «Хорошенькая».
– «Аяна», «Маруся», «Алиса»… Почему голосовым помощникам дают женские имена?
– Изначально приложение называлось «Ayavrik» – это такой персонаж из эвенкийского фольклора. Не знаю, в какой момент так получилось, что «Аяврик» стал «Аяной». Просто однажды я стал использовать другое название, и все. Я не думал изначально, что нужно придумать женское имя, такого требования в IT вообще нет. Но само название, мне кажется, в итоге оказалось очень удачным. Вообще, Аяна – это арабское имя. Но в эвенкийском языке есть слово «Ая», оно означает «хороший». И наша «Аяна» в переводе на эвенкийский звучит как «Хорошенькая». В принципе, это правда. Название отвечает мировым стандартам нейминга. Обратите внимание на названия самых знаковых приложений: «WhatsApp», «Viber», «Алиса»… Имя приложения должно быть емким, звучным, отражающим его суть, оно должно запоминаться.
– Если включить одновременно «Аяну» и «Алису», они смогут беседовать?
– «Аяна» пока не может поддерживать диалог, но если ей «Алиса» что-то скажет, то она переведет это на эвенкийский, также она сможет ответить на какой-то вопрос по истории или посчитать что-то в уме. Но мы хотим довести «Аяну» до состояния «Алисы». Это реально.
Мы проводили серию экспериментов. В частности, научили «Аяну» находить и воспроизводить эвенкийскую музыку, показывать фото эвенкийских костюмов и блюд национальной кухни. Также она может рассказать о музыкальной традиции эвенков или поделиться рецептом понравившегося блюда.
Но главное, конечно, переводы и ответы. Когда мы просим «Аяну» перевести что-то сложновыговариваемое, например, «Синхрофазатрон несинхронный автоматизатор», она может ответить по-разному. В частности, может признаться, что не знает, как это сказать или что пока еще учит язык. Наша задача сейчас научить «Аяну» отвечать креативно, чтобы с ней было интересно общаться.
Наша задача сейчас научить «Аяну» отвечать креативно, чтобы с ней было интересно общаться.
– В голосовых переводчиках огромное значение имеет дикция пользователя. Как нужно говорить с созданным вами голосовым помощником, чтобы перевод был корректным?
– Дикция, конечно, тоже имеет значение. Но у нас есть много дополнительных нюансов, касающихся именно эвенкийского языка. Например, если мы говорим слово «дуб», то «Aяна» не может его просто так перевести. В районах проживания эвенков дубы не растут, соответственно, такого слова в языке просто нет. Но мы научили «Аяну» в таких ситуациях искать максимально приближенное по значению слово, в данном случае – «дерево». «Аяна» произнесет это слово на эвенкийском.
– У «Аяны» есть акцент?
– Это не совсем акцент, но у нее особенности из-за машинного произношения. Существует два основных способа воспроизведения слов автоматикой. В словарях часто используются аудиофайлы, их записывают на носитель, и, соответственно, когда пользователь задает вопрос, машина включает запись со словом, которое произнес диктор. А у нас принцип другой, мы научили «Аяну» говорить на эвенкийском языке. То, что слышит пользователь, говорит не диктор, а робот синтезатора речи Google Speech Text, то есть машина.
Признаюсь, с момента презентации первой версии приложения я получал много критических замечаний, касающихся произношения «Аяны».
Мы научили «Аяну» говорить на эвенкийском языке. То, что слышит пользователь, говорит не диктор, а робот синтезатора речи
В эвенкийском языке имеются не только ударения, но и долготы, это когда в слове определенные гласные как бы тянутся. То есть если эвенкийское слово произнести, используя исключительно ударения, звучание будет неправильным. Использовать долготы сложно. В корректном произношении слова в прямом смысле все решают десятые доли секунды, чуть замешкаешься или заспешишь, звучание будет неправильным. Мы поняли, что нужно записывать голоса носителей и продолжать обучать «Аяну».
– Где вы находили аутентов?
– В первую очередь мне помогали мои друзья, молодые носители языка. Огромную работу провела Констанция Петрова, это известная у нас в Якутии учитель эвенкийского языка и литературы народов Севера. Мы пользовались лингвистической системой, созданной американским ученым Стивеном Пинкером. Он является сторонником идеи, что в основе всех языков лежат одни и те же принципы. В общем, по созданной им системе мы обучали «Аяну» парам слов. Одно слово звучит на русском, и тут же идет перевод на эвенкийском.
По каким-то сложным словам и терминам мы консультировались с региональной ассоциацией эвенков.
Также сейчас мы стали ездить по местам компактного проживания и записывать носителей языка. Предложений и замечаний много. Я сравниваю это с головами гидры. Вроде бы исправляешь какой-то один нюанс, и тут же появляется что-то новое. Но я убежден, что технологии – это драйвер сохранения языков.
Я убежден, что технологии – это драйвер сохранения языков.
– В эвенкийском языке несколько диалектов и говоров. На каких из них говорит «Аяна»?
– Мы использовали восточный диалект, олекминский говор. Но сейчас работаем над тем, чтобы «Аяна» выучила и другие диалекты. В офлайн-версии приложения есть функция внесения правки на основе скрипта. Ожидается, что когда в эту офлайн-версию будет загружено много данных, то эта информация сможет быть применена для машинного обучения. Также мы разрабатываем в приложении кластеры по разным диалектам. Рассматриваем возможность привлечения экспертов, чтобы они жестко зафиксировали, что вот так говорят на востоке, вот так – на севере.
Но главная проблема с носителями языка – это консерватизм. Лучше всего эвенкийский знают люди пожилые, они часто с недоверием относятся к новым технологиям. Сейчас мы работаем над тем, чтобы наладить сотрудничество именно с этой категорией людей.
– Сколько слов знает «Аяна»?
– Сейчас в приложение загружено около трех тысяч слов по принципу лингвистической конструкции Пинкера. Что это такое? Еженедельно среднестатистический человек использует не более двух тысяч индивидуальных слов. По такому принципу мы загружали пары слов в наше приложение. Но если мы хотим, чтобы «Аяна» развивалась, то нужно добиться такого уровня перевода, как в «Яндексе» и «Google». Для этого необходимо использовать большие данные, в частности, загрузить уже 300 тысяч пар слов. Это можно сделать, подключив «Аяну» к различным медиаисточникам. В частности, «Аяна» уже успешно подключена к смарт-тв, «Алисе», «Марусе», социальным сетям, Telegram.
Еженедельно среднестатистический человек использует не более двух тысяч индивидуальных слов. По такому принципу мы загружали пары слов в наше приложение.
– Кто основные пользователи вашего приложения?
– У нас нет точной статистики, люди какого возраста или рода занятий скачивают приложение на «AppStore» или «GooglePlay», приходится ориентироваться на отзывы и критику. По моим оценкам, среди пользователей много педагогов, преподающих эвенкийский в школах. Я очень рад, что они скачивают «Аяну», думаю, она может стать им хорошим союзником в деле обучения родному языку. Активно загружают приложение и дети.
Некоторые пользователи – это люди, которые интересуются вопросами сохранения родного языка, посещают различные форумы, конференции.
– А можно ли «Аяну» научить другим языкам?
– Мы проводили эксперименты по внедрению алтайского, эвенского и ненецкого языков. Использовали тот же алгоритм, что и в эвенкийском. Для алтайского мы даже успели сделать полноценное приложение. Алтайский выбрали из-за того, что этот язык относится к другой группе. Результаты получили более или менее сносные. «Аяна» заговорила на алтайском, причем сразу с хорошим произношением. Но перевод получался не всегда корректным. Для ненецкого и эвенского мы провели теоретические эксперименты. В итоге стало ясно, что это целый океан работы, что для каждого языка нужна своя адаптация. Сейчас эти проекты поставлены на паузу, и мы переключились только на эвенкийский язык. Когда все работы по «Аяне» будут окончены, мы займемся и другими языками.
– В связи с появлением в вашей жизни «Аяны», как часто вы используете эвенкийский язык?
– «Аяна» меня фактически языку заново и выучила. После школы я не говорил по-эвенкийски, так что язык забылся. А когда начал работу над «Аяной», то общался с ней четыре-пять раз в день. И в какой-то момент я сам заговорил. Получился такой ленивый метод обучения.
Сейчас я общаюсь со своими друзьями-эвенками на родном языке. Это бывает достаточно весело, хотя, признаюсь, мое произношение несовершенно, так что когда нас слышат люди пожилые и принципиальные, то они обязательно указывают на ошибки.
Я продолжаю работать над «Аяной» и одновременно оттачиваю свои языковые навыки. Для меня это в большей степени научный проект. Мы смогли обучить искусственный интеллект родному языку, добиться того, что нейросеть постоянно совершенствует свои познания в этом направлении.
Мы смогли обучить искусственный интеллект родному языку, добиться того, что нейросеть постоянно совершенствует свои познания в этом направлении.
«Аяна» научилась погружать человека в языковую среду, она не только переводит слова по запросам, приложение рассылает push-уведомления на двух языках, напоминает, например, что надо поздравить друга с днем рождения или желает хорошего дня. Я убежден, что все это позволяет выучить язык, моя история – тому подтверждение. Я учил «Аяну», а она учила меня. В итоге мы теперь говорим на эвенкийском.
Хочу отметить, «Аяна» – это проект цепи случайностей, она бы не вышла такой, какой сейчас есть, не будь помощи множества разных людей. Сомневаюсь, что сделал бы ее сам. Мы делаем не только переводчик с использованием технологий, мы создаем реальную надежду на сохранение древнего эвенкийского языка. Многие люди в течение жизни проекта случайно или намеренно всегда помогали и помогают до сих пор. Возможно, мы действительно рождаем надежду – так можно объяснить этот феномен случайностей и помощи множества людей!
Я не верю в особенных людей, я верю в особенные мысли, которые приходят простым людям, в их смелость для реализации этих мыслей.
Я не верю в особенных людей, я верю в особенные мысли, которые приходят простым людям, в их смелость для реализации этих мыслей. Измените мышление – измените жизнь, мысли человека воздействуют на мир, а мир воздействует на человека. То есть каждому из вас под силу изменить мир! Изменить мир к лучшему!
Справка «КМНСОЮЗ-NEWS»
ФИО: Апросимов Николай Андреевич
Регион: Амгинский улус, Республика Саха (Якутия)
Деятельность: разработчик приложения «Ayana», участник Якутского IT-кластера
Читайте также:
Подпишитесь на дайджест новостей
Не пропустите важные события!