Все новости
КОЛУМНИСТЫ
24 Мая 2020, 20:10

Электронный Вавилон, или проблемы перевода

Старшее поколение, владеющее в лучшем случае двумя языками, незнание европейских языков объясняет существовавшим во времена их молодости железным занавесом. Система эта давно рухнула. Людей, владеющих языками, прибавилось, тем не менее, ненамного. Возможно, что экономических и военных конфликтов было бы меньше, если бы люди могли общаться напрямую. Огромную роль в стирании межнациональных границ и создании единого языкового пространства играют системы машинного перевода.

Первые попытки использования ЭВМ при обучении языкам в начале 60-х гг. были предприняты в США. Позднее, на рубеже 70-х гг., этой проблемой заинтересовались в странах Западной Европы и Латинской Америки. В нашей стране исследования по применению вычислительной техники при обучении родному и иностранному языкам начались с середины 70-х гг. Долгое время эти работы наталкивались на технические, финансовые и психологические барьеры. С середины 80-х гг. в связи с интенсивным насыщением учебных заведений персональной техникой вопросы компьютеризации преподавания языков приобрели особую актуальность у учителей-словесников и программистов. В середине 80-х годов сложилось научное направление, занимающееся вопросами компьютерной поддержки обучения языкам, – Computer Assisted Language Learning (далее CALL).
Лидером в развитии технологий автоматизированного перевода является компания ПРОМТ. На сегодняшний день услугами онлайн-переводчика PROMT ежедневно пользуются около 120000 пользователей Интернет. Это неудивительно, ведь сегодня потребность в переводе информации ежедневно испытывает практически каждый пользователь ПК, а технологические возможности переводчика PROMT позволяют осуществить связный перевод текста всего за несколько секунд.
Но, к сожалению, продукты ПРОМТ реализуются лишь на рынке европейских стран. Меня как жительницу Башкортостана – республики, находящейся на границе Европы и Азии, – интересуют продукты, позволяющие облегчить общение между жителями азиатского региона.
За ответами на вопросы о перспективах развития машинного перевода я обращаюсь к Михаилу Каничеву – директору по глобальным рынкам компании ПРОМТ. Сделать это тем более приятно, что Михаил Рафаилович имеет башкирские корни.
– В последние годы очень выражены протестные настроения в связи с тотальной американизацией европейских стран. Да и не только европейских. Не случайно такое внимание уделяется развитию евразийского сообщества, как глобальной альтернативе – атлантизму. В то же время, довольно странно выглядит общение между азиатскими странами на английском языке. Не считаете ли Вы, что в пределах Евразийского союза логичнее было бы общение на тюркских языках, на которых говорят многочисленные народы и народности бывшего СССР, Турции, часть населения Ирана, Афганистана, Монголии, Китая, Румынии, Болгарии, Югославии и Албании?.. Достаточно сказать, что только в Китае проживает более семи миллионов уйгуров, говорящих на уйгурском (тюркском), казахском и киргизском языках. Верующие уйгуры – мусульмане, подобно верующим татарам и башкирам. Насколько эффективнее протекал бы процесс налаживания торгово-экономических связей с Китаем и другими азиатскими странами, если бы общение шло напрямую на тюркских языках. Неформальное общение с единоверцами без переводчика всегда эффективнее.
В этой связи – первый вопрос. В дореволюционной России интеллигентные люди владели несколькими иностранными языками, так же, как для жителей современных европейских стран норма – общение на нескольких языках. В настоящее время железный занавес рухнул, а число россиян-полиглотов не увеличилось. Не согласны ли Вы с тем, что это связано с ликвидацией в школах мертвого и ненужного с точки зрения большевиков языка – латыни? Латынь – основа многих европейских языков. В европейских странах изучение древних языков было и остается непременным компонентом общего гуманитарного образования. Например, латынь преподается практически во всех университетах Финляндии. Основной курс базируется на текстах Цезаря и Цицерона. Большим тиражом издаются сборники крылатых латинских выражений с переводом на финский язык, большое количество соответствующих учебных пособий. Есть даже специальная телевизионная программа на латинском языке.
– Да, мне кажется, Вы правы, если бы в общеобразовательной школе изучение латыни стало обязательным предметом, то, возможно, школьники, окончив школу, могли бы свободно общаться на нескольких западноевропейских языках. Латынь – это тот фундамент, на котором построено большинство западноевропейских языков, и ее изучение помогло бы школьникам понять не только внутреннюю «суть» языка, но и взаимосвязь между разными европейскими культурами, что, в свою очередь, облегчило бы им изучение европейских языков.
– Возможна ли разработка единого машинного языка, позволяющего общаться всем тюркоязычным народам? Возможно ли создание своего рода тюркского эсперанто или тюркского «Basic»? Ведь зачастую различия в тюркских языках – всего лишь фонетические. Житель башкирского Зауралья прекрасно понимает казаха, татарин поймет кумыка... Насколько реально возрождение тюркского эсперанто – чагатайского языка? На чагатайском языке в средневековье общались азиатские народы. Это был тюркский письменно-литературный язык, достигший расцвета во 2-й пол. XV-XVI вв. Принято считать, что на нем писали в Средней Азии, начиная с XIII-XIV и практически до начала XX века.
– Идея тюркского «Basic» интересна, но наша компания ПРОМТ не занимается разработкой машинного языка, мы занимаемся разработкой систем машинного перевода «живых» языков, которые базируются на алгоритмах анализа морфологии, синтаксических конструкций, семантики входного языка и построения связных предложений для выходного языка, используя данные анализа и с помощью алгоритмов, описывающих взаимосвязь входного и выходного языков.
Меня нельзя назвать специалистом в тюркских языках, и мне сложно говорить предметно об этой области. Да, безусловно, тюркские языки в определенной степени близки, но не более чем славянские или, например, романские, и если говорить о разработке системы машинного перевода, то придется разрабатывать таковые отдельно для каждого из языков. То, что языки в той или иной степени близки, просто позволяет ускорить процесс разработки и снизить ее стоимость.
– Как вы относитесь к идее создания машинного русско-тюркского и англо-тюркского словаря? Тюркского – не конкретно азербайджанского, татарского, башкирского и других, а тюркского, содержащего общие языковые корни. Скажем, во всех тюркских языках слово «звезда» звучит как «йолдоз», «жолдоз», «юлдуз»…
– Опять же, для начала хочу сказать, что разработка словаря и системы машинного перевода – это две разные задачи. Если первая задача достаточно проста, то вторая, несмотря на то что при ее решении тоже разрабатывается словарь, потребует существенно больших ресурсов. По-видимому, идея создания переводчика не для конкретного тюркского языка, а просто для некого усредненного тюркского представляется интересной для филологов. Так, приведенный Вами пример о близости перевода слова «звезда» в разных тюркских языках имеет скорее фонетическую близость, а не близость символьного представления, с чем в реальности имеет дело компьютер.
– Много ли в настоящее время машинных переводчиков с конкретных тюркских языков? Сложность их создания связана с тем, что в них не существует достаточно строгого порядка следования слов, что затрудняет процесс формального синтаксического анализа предложения. С вашей точки зрения – насколько успешным оказалось создание системы машинного перевода с азербайджанского языка на английский? Будет ли ПРОМТ заниматься созданием такого рода переводчиков?
– Действительно, переводчиков для тюркских языков практически нет. Я знаю только один переводчик для турецкого языка у компании Apptek. Не думаю, что свободный порядок слов в предложении является какой-то особой проблемой. Как Вы знаете, в русском языке тоже произвольный порядок слов в предложении, однако системы перевода для русского языка разработали как мы, так и наши американские конкуренты. Я думаю, здесь вопрос упирается в возврат инвестиций, необходимых для реализации разработки.
К сожалению, я ничего не знаю о проекте разработки системы перевода для азербайджанского языка. Вызывает, конечно, удивление тот факт, что никто из ведущих мировых разработчиков, к числу которых мы причисляем и себя, не участвовал в данном проекте.
Да, мы с удовольствием приняли бы участие в проекте разработки системы перевода для любого из тюркских языков. Для нас это было бы интересно не только с практической, но и с научной точки зрения. Ведь в процессе подобного проекта не только потребуется изучение базовых грамматических принципов нового языка, но и встанет задача по расширению нашей методологии создания систем перевода на новую для нас группу языков.
Сейчас мы, например, участвуем в проекте по созданию системы перевода для литовского языка, который тоже исключительно интересен с лингвистической точки зрения. Очевидно, что, не будь внешнего финансирования, подобная система была бы разработана не скоро. Однако Европейский союз, заинтересованный в свободном обмене информацией без языковых барьеров, не скупится на финансирование подобных проектов.
В России еще не хватает понимания необходимости реализации подобных проектов. Мы готовы заняться разработкой системы машинного перевода для башкирского языка, актуальность которой очевидна, учитывая возрастающий объем торгового оборота Башкортостана со странами азиатского региона. Башкирская природа очень привлекательна в плане развития туристического бизнеса. Развитие туризма предполагает и расширение языкового пространства.
Рада ЛОБОВА
Читайте нас в