Почти 15 лет разрозненные группы ученых трудились над машинным переводом. В 1952 году они собрались на конференцию. Математики, лингвисты, инженеры объединили свои усилия, и вот через два года машина начала переводить.
В нее на перфокартах вводили русские фразы:
«Качество угля определяется калорийностью».
«Обработка повышает качество нефти».
«Международное понимание является важным фактором в решении политических вопросов».
Машина через каждые пять — восемь секунд выдавала их английский перевод:
«The quality of cool is determined by calori content».
«Processing improves the quality of crude oil».
«International inderstandery constitutes an important factor in decision of political questions».
Во время публичного испытания машина перевела около 60 предложений.
Для такого перевода был специально подготовлен словарь из 250 русских слов, записанных латинскими буквами. Слова были взяты из области политики, математики, химии, металлургии. Их подобрали так, чтобы каждое имело два английских равнозначных по смыслу слова.
Помимо английских значений, в словаре указывались для каждого слова и три специальных кода — числа. Их использовали для управления машиной. Были разработаны также шесть синтаксических правил, обеспечивавших грамотный перевод.
Машина переводила так, как это сделал бы человек, не знающий языка, когда он переводит с помощью словаря. Человек просто отыскивает равнозначимые слова, а потом правила их расстановки. Естественно, что такой перевод очень несовершенен, но в машине и он вызвал огромные трудности.
Первая состоит в том, что специальная программа для управления переводом содержала около 2500 кодов. Это намного больше, чем программа для решения самых сложных математических задач.
Другая трудность заключалась в большом словарном объеме современных языков. Так, в немецком языке имеется около 400 тысяч слов, из которых чаще всего используется всего 5000 слов. В английском языке можно ограничиться лишь тысячей слов общего назначения и тысячей специальных терминов.
Но даже и таким небольшим количеством слов, учитывая их грамматические формы, машине оперировать трудно. Поэтому советские ученые, проанализировав работы американских и английских коллег, отвергли путь чрезмерной связи программы перевода со словарем, так как это создавало искусственные ограничения для перевода.
Была разработана система анализа предложения, позволившая устанавливать значение входящих в него слов и определять их грамматические формы.
Система анализа английской фразы и синтеза русской оказалась практически независимой от словаря и дала возможность в конце 1955 года осуществить машинный перевод.
«Как же так? — спросит каждый, кто знаком с переводом. — Ведь английский язык очень далек от русского, у них совершенно разный грамматический строй. Может быть, переводили сугубо специальный текст?»
Допустим. Но и в специальном тексте иногда встречаются чрезвычайно сложные для перевода фразы.
Например, foolproof («защищенный от нежелательного воздействия») дословно переводится как «защищенный от дурака», а charlleyhorse («судорога в икре ноги») — как «лошадь, по имени Чарли».
Не только в английском языке наблюдаются подобные явления. Один инженер получил странный дословный перевод французской фразы Absorption comfortable des vibrations («комфортабельное поглощение колебаний»), а в действительности в технике фраза означает — «гашение колебаний, обеспечивающее комфортабельность езды». Dos des anes («возвышенные дорожные неровности») буквально переводится еще смешнее — «ослиные спины».
Как видите, трудности велики. А я еще не касался переводов художественной литературы и разговорной речи, обладающих неисчерпаемым многообразием оттенков и музыкальностью слова. Вспомните, для примера, окончание повести Н. В. Гоголя «Нос»:
«…А однако же, при всем том, хотя, конечно, можно допустить и то, и другое, и третье, может, даже… ну да и где же не бывает несообразностей? А все, однако же, как поразмыслишь, во всем этом, право, есть что-то. Кто что ни говори, а подобные происшествия бывают на свете, — редко, но бывают».
Под каждым словом этого отрывка можно подписать английские слова или их сочетания, но они не передадут англичанину всего своеобразия текста повести.
И все же машина переводит.
Идея машинного перевода существует давно. Еще в 30-х годах у нас в стране велась работа в этом направлении. Изобретатель П. П. Троянский в 1933 году создал механизированный словарь.
В 1950 году была предложена машина для перевода, которой помогали два человека: переводчик- подготовитель текста, и переводчик — редактор. Роль машины в таком переводе была незначительной, поэтому ее отвергли.
…Но вот мы в зале, где установлена быстродействующая электронная счетная машина. Научный сотрудник, принимавший участие в опытах машинного перевода, показывает мне по этапам, как с момента ввода английской фразы в машину весь процесс перевода происходит автоматически, без какого-либо вмешательства человека.
Сотрудник ставит в вводное устройство машины большую бобину.
— Здесь записан английский текст, — говорит он, выдергивая из бобины небольшой кусок узкой бумажной ленты, похожей на телеграфную. — Только вместо знаков на ней мелкие отверстия. На ленте отверстиями обозначены буквы, составляющие слова. Это код переводимого текста.
Рядом установлены бобины с узкой магнитной лентой — программой работы машины по переводу.
— Вот и все, — говорит научный сотрудник. — Текст и программа готовы к вводу в машину.
Но где же русские слова, соответствующие английским? Они находятся в «памяти» машины. В каждой ячейке английское и соответствующее ему русское слово.
Подхожу к пульту управления, за который садится оператор. Прямо перед ним на панели пунктиры сигнальных лампочек Они то зажигаются, то гаснут. Оператор смотрит на них и говорит:
— Вводится текст, а теперь идет поиск по словарю.
Сигнальные лампочки вычерчивают новый след. Сотрудник поворачивает рычажки, включающие новые секции.
Когда переводит человек, он тоже пользуется словарем. Просматривая его, переводчик видит слова, составленные из букв. Другое дело в вычислительной машине. Она имеет дело с числами. Поэтому и пришлось для нее буквы переводить на машинный «язык». Английское «а» стало 16, «Ь» — 06, «w» — 13, «т» -11, «п» — 15, «х» — 09, «q» — 23 и т. д. И русские буквы: «а»- 16, «б» — 06, «в» — 13, «м» — 11, «н» — 15, «ь» — 9, «щ» — 23, «ы» — 04 и т. д.
И слова теперь выглядели как строки бухгалтерской записи: 212608, 08232016212, 2281505, 110821262830, 2126080708142280708.
Вам цифры ничего не говорят, а оператор прочитал: «the, equations, method, therefore…»
Перевод начинается с того, что машина отыскивает по своему словарю введенные в нее на ленте слова. Здесь и помогает математический язык.
Машина из каждого числа-слова в словаре вычитает число-слово, заданное перфолентой. Если остаток равен нулю, слово найдено. Все это машина делает с громадной скоростью. Одна операция сравнения занимает всего около десятитысячной доли секунды! Словарь в тысячу слов машина может «просмотреть» быстрее, чем человек успеет моргнуть глазом, — доли секунды.
А дальше, как это ни странно, машина найденные слова… «забывает». Но вместо них остается след, так называемая цифровая информация, характеризующая особенности каждого слова: грамматические признаки английского слова, номер английского слова и соответствующего русского, грамматические признаки русского слова. С этой-то цифровой информацией и имеет дело машина.
Только теперь она начинает анализировать английскую фразу, а затем строить русскую.
Это делается на основе программы перевода, в которой есть разделы: «глаголы», «существительные», «прилагательные», «числительные», «синтаксис», «изменение порядка слов».
И русское предложение, составленное из найденных машиной слов, она же строит по правилам нашей