Первый машинный перевод

2017-01-07 17:14

О том, чтобы представители разных национальностей, говорящие на разных языках, лучше понимали друг друга, люди мечтали с древности и мечтают до наших дней. Сейчас нейронауки подходят к этому с двух сторон: изучением нейробиологии языка и использование нейронных сетей для перевода. Изобретение аналога вавилонской рыбки — придуманного фантастом Дугласом Адамсом существа, позволяющего понимать все языки во Вселенной — было бы величайшим достижением человеческой цивилизации. Проведённый седьмого января 1954 года Джорджтаунский эксперимент мог быть первым шагом к такому изобретению. Ключевой фигурой, без которой эксперимент не был бы возможен, был американец французского происхождения Леон Достер. Дружественный портал Indicator.Ru подготовил рассказ об этом эксперименте, состоявшемся ровно 63 года назад.

Леон родился во французской коммуне Лонви, располагавшейся в то время недалеко от бельгийской границы. Отец Леона исчез почти сразу после его рождения, вскоре умерла и мать, оставив мальчика на попечение тети и бабушки. Леону было десять лет, когда началась Первая мировая война, во время которой территорию его родной коммуны почти сразу оккупировали немцы. Мальчик выучил немецкий и некоторое время подрабатывал у военных переводчиком на французский. Когда же земли коммуны освободили американские солдаты, Леон быстро выучил и английский, начав работать на другую сторону конфликта. Американцы были так впечатлены юным сиротой, что помогли ему перебраться в США и выучиться в колледже. В 1931 году Достер стал магистром Джорджтаунского университета, позже начал писать диссертацию в Университете Джонса Хопкинса, но так её и не закончил.

Первые два года Второй мировой войны Леон служил атташе при французском посольстве в Вашингтоне. Позже, уже получив американское гражданство и став майором Управления стратегических служб (предшественника ЦРУ), наш герой отвечал за связь у французского генерала Анри Жиро, был личным переводчиком Эйзенхауэра в переговорах с Шарлем де Голлем и координировал переводчиков, работавших во время Нюрнбергского процесса.

Переводчики на Нюрнбергском процессе. Крайний справа — Леон Достер.

Ray D’Addario

Именно тогда Достер, уже будучи полковником, придумал систему, которая позволяла бы одновременно переводить с самых разных языков при помощи оборудования IBM: многоканального коммутатора, наушников и микрофонов. С оборудованием помог его давний друг Томас Уотсон, возглавлявший в то время знаменитую компанию. Благодаря этой первой в мире системе синхронного перевода любой человек, знающий английский, французский или русский, мог при помощи наушников понимать все, что говорят обвиняемые и обвинители.

«Эта система очень эффективна, но она укоротит мою жизнь!»

Герман Геринг

Военный преступник, рейхсмаршал Германии, рейхсминистр Имперского министерства авиации

После начала следствия один из главных обвиняемых, рейхсмаршал Герман Геринг, сказал: «Эта система очень эффективна, но она укоротит мою жизнь!» (Геринг покончил с собой, приняв ампулу с цианидом, 15 октября 1946 года, за день до назначенной казни через повешение)

После процесса Достер предложил разработанную им систему синхронного перевода создававшейся тогда Организации Объединенных Наций. Она была использована уже на первой Генеральной Ассамблее ООН.

После войны Леон вернулся в Джорджтаун, где вместе с Эдмундом Уолшем основал Институт языков и лингвистики с уникальной на тот момент лингвистической лабораторией, оснащенной магнитофонами и другим современным оборудованием. В нем придавалось особое значение языковой практике, а студентам гарантировался год стажировки за рубежом. Леон Достер возглавлял Институт в течение последующих десяти лет, пока после развода не перешёл в Западный колледж (Occidental College), Игл Рок, Калифорния.

В июне 1952 года Достера пригласили в Массачусетский технологический институт на конференцию по машинному переводу, организованную известным лингвистом Йегошуа Бар-Хиллелом. Первоначально наш герой отнесся к идее с изрядной долей скепсиса, однако все же поехал. Несмотря на то, что на конференции в основном обсуждались теоретические термины, Достер вернулся с нее окрыленный энтузиазмом. Связи в Джорджтаунском университете и в IBM (его старый друг Томас Уотсон до сих пор возглавлял компанию) позволили ему претворить идеи машинного перевода в реальность.

22b3aec7c30c858c3711ba88121a7e8685e8ec97

Томас Джон Уотсон ст., основатель IBM.

Wikimedia Commons

Проект возглавили глава отдела прикладных разработок IBM Катберт Херд и лично Достер. За лингвистическую составляющую эксперимента отвечал адъюнкт-профессор Джорджтаунского университета, чешский ученый Пол Гарвин, за компьютерную часть — сотрудник IBM, математик Питер Шеридан (позже он войдёт в группу Джона Бэкуса, которая разработает первый высокоуровневый язык программирования — Фортран). И вот, 7 января 1954 года в Нью-Йорке состоялась первая демонстрация возможностей машинного перевода.

Все было продумано до мельчайших деталей. Языком перевода Достер выбрал русский: в самом начале холодной войны для правящих кругов США было очень важно знать, что происходит в Советском Союзе. Для проведения эксперимента был выбран разработанный для военных нужд компьютер IBM-701. Он занимал площадь, сравнимую с теннисным кортом, и мог совершать 2000 операций в секунду (для сравнения: средний современный настольный компьютер может совершать около 100 миллиардов операций в секунду). В распоряжении компьютера было 250 русских слов с их переводом и шесть синтаксических операций. Предложения для перевода взяли из учебника по органической химии, также к ним добавили несколько общих предложений.

11493ebb8ee668a2051ca1793c1986e0f7e9daa5

Консоль оператора IBM-701

Dan/Flickr

Чтобы не загружать компьютер излишними задачами, русские предложения были напечатаны на латинице: «Vladyimir yavlyayetsya na rabotu pozdno utrom» или «Kraxmal virabativayetsya myexanyichyeskyim putyem yiz kartofyelya». Как утверждал пресс-релиз компании IBM от 8 января 1954 года, компьютер переводил предложения за считанные секунды: «Vladimir appears for work late in the morning» или «Starch is produced by mechanical methods from potatoes». Получалось у него переводить и предложения посложнее: «Dyinamyit pryigotovlyayetsya xyimyicheskyim protsyessom yiz nyitroglyitsyeryina s pryimyesjyu yinyertnix soyedyinyenyiy» превратилось в «Dynamite is prepared by chemical process from nitroglycerine with admixture of inert compounds».

На следующий день газеты запестрели заголовками: «Электронный мозг переводит с русского», «Машина-билингва», «Мозг робота переводит с русского на королевский английский». Леон Достер утверждал, что «помехи для межкультурного общения будут устранены». «Электронный перевод — это большой шаг, который позволит людям дотянуться до своих соседей», — говорил ученый. Вместе с тем лингвист отмечал, что еще не настал тот день, когда можно будет загрузить в компьютер русскую книгу и получить на выходе английскую. Три, может быть, пять лет, и машинный перевод, не требующий редактирования человеком, будет свершившимся фактом — таков был прогноз Достера.

«Помехи для межкультурного общения будут устранены… Электронный перевод — это большой шаг, который позволит людям дотянуться до своих соседей»

Леон Достер

Глава Института языков и лингвистики Джорджтаунского университета

Дальнейшие исследования в области машинного перевода финансировались из средств гранта Национального научного фонда, однако фактически средства поступали из Центрального разведывательного управления, ведь Достер, некогда работавший на УСС, был дружен и с шефом ЦРУ Алленом Даллесом. Около 20 ученых первоначально разделились на две группы, одна из которых составляла для компьютера словарь, а другая работала над механизмом лингвистического анализа. Позже из-за внутренних разногласий разделились уже на четыре параллельных группы, работавшие над разными направлениями исследований.

Работой американцев вдохновились и советские ученые: сообщение о Джорджтаунском эксперименте появилось в десятом номере реферируемого журнала «Математика» за 1954 год. Написавший статью Дмитрий Панов инициировал работу по машинному переводу в Институте точной механики и вычислительной техники (ИТМиВТ). В начале 1954 года он побывал в Нью-Йорке и сам посмотрел на очередную демонстрацию работы IBM-701, позже привлек к исследованиям лингвиста Изабеллу Бельскую, которая возглавила это направление в ИТМиВТ. Первый опыт советского машинного перевода был проведен в конце 1955 года на компьютере БЭСМ. Другая группа советских ученых под руководством Алексея Ляпунова и Ольги Кулагиной работала над той же проблемой в Отделении прикладной математики Математического института АН СССР имени В.А. Стеклова.

В ходе работы советские ученые узнали, что ещёв 1933 году некий Петр Троянский обратился в Академию наук с собственным проектом автоматизированного перевода. Его «машина для подбора и печатания слов при переводе с одного языка на другой или на несколько других одновременно» была запатентована в 1935 году.

6516c728a1372be5b571344a921585039e23ce5a

Чертеж «машины для подбора и печатания слов» Троянского.

http://www.findpatent.ru

Однако мы немного отошли от темы. К концу 1950-х годов эйфория от результатов Джорджтаунского эксперимента начала проходить. Во многом этому поспособствовал Йегошуа Бар-Хиллел — тот самый человек, который заинтересовал Достера своей конференцией по машинному переводу. Бар-Хиллел называл исследования в области машинного перевода «аферой на миллионы долларов». Надо отметить, что с результатами исследований лингвист знаком не был, и все его аргументы были теоретического свойства. Что, впрочем, не отменяет их ценности.

Доводы Бар-Хиллела строились вокруг предложения «The box was in the pen» в контексте «Little John was looking for his toy box. Finally he found it. The box was in the pen». Слово «pen» имеет как минимум два значения: «ручка» и «манеж» (место, где играют маленькие дети). Компьютерный переводчик не в состоянии оценить контекст и верно перевести это предложение даже сейчас. Что уж говорить о тех временах…

Шесть лет спустя исследования в области машинного перевода ждал еще один удар: в июне 1966 года Консультативный комитет по автоматической языковой обработке (Automatic Language Processing Advisory Committee, ALPAC) опубликовал доклад, согласно которому машинный перевод невозможен. Также доклад советовал прекратить исследования в этой области. Ученых послушали, и финансирование прекратили почти на двадцать лет.

В конце 1970-х годов на волне развития вычислительной техники интерес к машинному переводу вновь возродился. Впрочем, Леон Достер до этого не дожил: он умер в сентябре 1971 году, в Бухаресте, вскоре после доклада на международной лингвистической конференции.

Как пишет американский журналист Пол Уокер, очень соблазнительно преувеличить важность одного человека, однако то, как сейчас взаимодействуют между собой культуры, даже то, как мы используем компьютеры, возможно, все это было бы совсем иным, если бы юный французский сирота не повстречал во время войны американских солдат.

Автор: Наиль Фарукшин

Источник: neuronovosti.ru

Первый машинный перевод

Комментарии: