Scisne?

Начала компьютерной лингвистики

Леонид Иомдин

Комментарии: 0

Когда были проведены первые эксперименты по машинному переводу в США и СССР? Какие теории легли в основу нового направления лингвистики? Об этом рассказывает кандидат филологических наук Леонид Иомдин.

«7 января 1954 года в Нью-Йорке в штаб-квартире IBM при большом стечении публики был осуществлен эксперимент по машинному переводу. Его проводили две организации: компания IBM, которая занималась изготовлением электронно-вычислительных машин (слово «компьютер» тогда не употреблялось), а также лингвисты Джорджтаунского университета в Вашингтоне. Идея принадлежала лингвистам, а воплощение, как всегда, принадлежало компьютерщикам. Машина провела эксперимент по переводу с русского языка на английский. Русский язык был языком вероятного противника. Оказывалось, что нужно переводить огромную массу литературы с русского языка на английский, и люди, которые понимали, насколько это трудно, решили, что, может быть, это можно поручить делать компьютеру, и придумали систему.»

«В 1955–1956 годах Кулагина и Мельчук стали заниматься машинным переводом. Уже в 1955 году появилась первая информация на эту тему, которая была опубликована в советском журнале, а в 1959 году вышел целый том под редакцией Панова, где резюмировались исследования в области машинного перевода. Поскольку этим занялись лингвисты и в первом эксперименте участвовали лингвисты, то машинный перевод стал развиваться от лингвистики. Это значило, что нужно было придумать такую схему, алгоритм, который бы использовал те сведения о языке, которые лингвистам были известны. Что было известно лингвистам? Была известна морфология, синтаксис, были известны словари, была в некоторой степени известна семантика. Лингвисты решили, что машинный перевод надо делать, исходя из тех сведений, которые были в распоряжении лингвистики. Была придумана схема, в общем, вполне универсальная. На вход подавался текст, текст членился на небольшие кусочки, естественно было его членить на предложения, и потом этот текст анализировался сначала морфологически. Результат морфологического анализа (это такая специальная вещь) подавался на следующий этап, который назывался синтаксическим анализом. Вместо линейной морфологической структуры стала строиться более сложная структура. Обычно это была древесная структура, где указывались связи между словами.»

«Исследования Кулагиной и Мельчука проводились вообще без компьютера. Люди просто писали алгоритмы на бумаге, пером, и это публиковалось в виде книг. Даже не вся система машинного перевода, а, скажем, система анализа текстов. Дело в том, как очень быстро выяснилось, анализ и синтез текстов — это вещи, которые как нельзя лучше подходят для машинного перевода. Как устроен язык? Игорь Александрович Мельчук, который придумал лингвистическую теорию «смысл ↔ текст», исходил из одного очень простого предположения, а именно: «Язык — это универсальный преобразователь смыслов в тексты и обратно».»

Леонид Иомдин, кандидат филологических наук, исполняющий обязанности заведующего лабораторией компьютерной лингвистики ИППИ РАН им А.А. Харкевича, профессор кафедры компьютерной лингвистики Института лингвистики РГГУ, преподаватель Школы анализа данных Яндекса.

«ПостНаука»
Комментарии: 0