Формула языка икс

……

…

Формула языка “Икс”
“ЗС” №2/1967

В 1963 году в совете по комплексной проблеме “Кибернетика” при Президиуме Академии наук СССР было решено начать изучение ряд дешифрованных исторических систем письма с широким использованием средств вычислительной техники. Для проведения этой работы были организованы филологическая группа под руководство) Ю. В. Кнорозова, в которую входили Г. В, Алексеев, Б. Я. Волчек, А. М. Кондратов, В. М. Наделяев, В. С. Стариков, И. С. Федорова и А. И. Харсекин, и группа по машинной обработке текстов при Всесоюзном институте научной н технической информации (ВИНИТИ) под руководством М. А. Пробста, в которую входили 3. М. Остроухова и Т. Б. Павлова.

Перед вами статья одного из участников этой работы.

Без билингвы

Перед нами — текст, записанный неизвестными знаками. Как понять его? Самый простой путь — найти человека, знающего неизвестные вам письмена. Предельно просто! И, как ни удивительно, именно так удавалось найти ключ даже к древним письменам! В конце XVIII века французский исследователь Анкетиль-Дюперон сообщил, что ему удалось прочитать и перевести тексты священной книги древних персов “Авеста”. Он много лет провел среди современных огнепоклонников (для которых и поныне “Авеста” — священная книга) и научился у жрецов, из поколения в поколение передававших свои знания, искусству чтения “Авесты”.

Когда Анкетиль-Дюперон опубликовал свой перевод “Авесты”, он единодушно был признан “плодом фантазии” и считался таковым до тех пор, пока успехи языкознания XIX века… не подтвердили правоту отважного исследователя, с риском для жизни добывшего у жрецов-огнепоклонников тайну их священных текстов.

Еще более поразительный случай, произошел совсем недавно, в середине нашего столетия. Как известно, четыреста лет назад испанцы уничтожили великую цивилизацию инков в Южной Америке, а вместе с ней и все памятники письма. Впрочем, памятников этих уже в ту пору было крайне мало — когда-то процветавшее иероглифическое письмо было запрещено самими инками и заменено на “письмо узелков” — “кипу” или “квипу”. Инки сохранили лишь совсем немного иероглифических текстов, где. была записана их история (ведь с помощью узелков “кипу”, родных братьев наших “узелков на память”, длинного связного текста не записать). Однако после испанского завоевания и эти тексты погибли. Но в пятидесятых годах нашего века боливийский археолог и этнограф Дик Эдгар Ибарре Грассо обнаружил живых знатоков иероглифического письма! И не только в отдаленных горных районах Боливии и Перу, но даже в самой столице Боливии, городе Ла-Пас!

В отдаленных районах государства инков, очевидно, были люди, не послушавшиеся запрета. Вот почему и поныне индейцы, не знающие ни европейской “латиницы”, ни испанского языка, пользуются письмом, корни которого уходят во времена культуры Тиагуанако, предшествовавшей культуре инков!

Найти живого знатока древних письмен и с его помощью прочитать тексты — задача увлекательная и романтическая. Но ведь для большинства древних текстов, например египетских, хеттских, шумерских и многих других, это практически невозможно (египетские иероглифы не умели читать сами жрецы уже 20 веков назад). И все-таки мы знаем, что письмена Египта, Малой Азии, Двуречья были прочтены. Почему? Здесь на помощь дешифровщикам пришла билингва, текст, повторенный на двух языках, только один из которых неизвестен.

С помощью знаменитого Розеттского камня Шампольон дешифровал иероглифику Египта.

Помогают исследователям не только билингвы: возможны и другие “ключи” к письменам. В 1929 году французская экспедиция, раскопав холм Рас-Шамра (в Сирии), обнаружила неизвестную письменность, названную угаритской. Ряд надписей был сделан на бронзовых боевых топорах, причем на одних топорах было всего лишь 6 знаков, а на других к тем же 6 знакам добавлялось еще 4 новых. Немецкий филолог Бауэр разумно предположил, что 6 знаков передают имя владельца, а 4 — соответствуют слову “топор”; и это помогло вскоре расшифровать все надписи угаритского письма!

Как быть, если у нас нет билингвы? И вообще никаких других вспомогательных данных? Можно ли тогда дешифровать текст?

“Из ничего нельзя ничего дешифровать, — говорит известный специалист по дешифровке И. Фридрих. — Если не за что ухватиться, если опора пока что не найдена, значит, серьезных результатов достичь невозможно — остается лишь простор для беспочвенных фантазий дилетантов”.

Письмена острова Пасхи, надписи на печатях из Мохенджо-Даро и Хараппы, древнейших городов Индостана, загадочный диск из города Фест иа Крите, письмена этрусков билингвы не имеют. И многочисленные любители, да и. серьезные ученые, тщетно пытались проникнуть в загадку этих письмен, читая их то по-хеттски, то по-тольтекски, то по-гречески, то по-албански, то на санскрите… Но всем этим “дешифровкам” не хватало одного — “точки опоры”. Имеется ли она у текстов без билингвы, у текстов, где отсутствуют какие бы то ни было косвенные данные?

Оказывается, такая “точка опоры” все-таки есть. И это — сами тексты, точнее — их внутренняя структура! Здесь на помощь исследователю приходят точные числа, количественные показатели и электронные вычислительные машины.

Формула системы письма

Первая задача, которая встает перед дешифровщиком древних текстов, — это определение системы письма. Что передает тот или иной знак — букву? слог? корень слова? служебную частицу? слово? или, может быть, целое, сочетание слов и даже предложение? Возможно, что исследуемый текст не является письменным текстом в полном смысле этого слова, то есть текстом, который можно читать, а представляет собой пиктографическую запись, “рисуночное письмо”, и его можно толковать на любом языке мира.

Звуков в языке немного — от 10-12 (в полинезийских) до 70-80 (в некоторых кавказских). Как правило, в алфавитном письме бывает в среднем около 30 различных знаков-букв. Значит, если мы видим текст, где число различных знаков порядка 30, можно с уверенностью считать, что этот текст записан буквенным, алфавитным письмом.

Системы письма, где каждый знак передает слог, насчитывают 50-80 различных знаков. В смешанных, иероглифических системах письма одни знаки передают слоги (или даже отдельные буквы, как в древнеегипетском), другие — корни слов, а третьи, “ключевые” знаки (или детерминативы), никаких единиц языка не передают, а лишь указывают, как должен читаться тот или иной знак или сочетание знаков.

Естественно, что в иероглифике число различных знаков будет гораздо больше, чем в алфавитном или слоговом. Так, в древнеегипетском письме насчитывают около 800 иероглифов, в хеттском — около 500, и т. д.

Среди дошедших до нас древних систем письма нет ни одной, где каждый знак передавал бы целое слово (такая система очень громоздка). Но теоретически можно представить такое “пословное” письмо — и где гарантия, что неизвестный текст не написан как раз таким письмом? Нетрудно подсчитать число знаков, которое должно иметь “пословное” письмо, — оно будет равно числу слов в языке, насчитывать десятки и сотни тысяч знаков.

Бесконечно и число знаков пиктографии, “рисуночного письма”, — каждая новая ситуация требует новых знаков, фиксирующих ее.

Таким образом, каждая система письма имеет свои точные количественные показатели. Нам остается только посчитать число разных знаков — и мы можем тут же определить систему письма. Однако тут имеется одно “но” — и весьма важного свойства.

Дело в том, что дошедшие до нас древние тексты зачастую очень коротки. А поэтому мы не можем знать, вошли ли в эти тексты все знаки письма или нет. Чтобы определить в подобном тексте систему письма, приходится поступать так. Подсчитывают не все разные знаки, а знаки новые, которые появляются вновь на каждые 25, 50, 75, 100 и т. д. знаков текста.

Среди первых 25 знаков немногие будут повторяться — и у алфавитного письма, и у иероглифики, и у слогового. На вторую “двадцатьпятку” у алфавитного письма появится очень мало новых знаков. В третьей “порции” по 25 знаков число алфавитных знаков будет совсем маленьким, начнет исчерпываться и запас слоговых знаков, в то время как число новых знаков иероглифики по-прежнему будет прибывать, хотя и не столь быстро, как вначале (ведь наиболее употребительные иероглифы уже повстречаются нам среди первых 25, 50 и т. д. знаков текста).

Что же касается знаков пиктографии, то число новых будет постоянным — в среднем по 18-20 новых знаков на каждые 25 знаков текста.

Таким образом, мы видим, что каждая система письма отличается не только общим числом всех знаков, но и частотой появления новых знаков в тексте. Значит, можно выяснить (с определенной степенью вероятности), какой именно системой письма написан неизвестный текст.

Для наглядности приведем таблицу, где сопоставляется частота появления новых знаков. Первый столбец — письмена древнего Египта, классический образец иероглифического письма. Второй столбец — письмена долины Инда, до сих пор еще не расшифрованные. Одни ученые считали их иероглифическими, другие — слоговым письмом. Из таблицы явно видно, что числовые показатели графы “Египет” совпадают с показателями, графы “Индия” — видимо, создатели цивилизации Мохенджо-Даро и Хараппы пользовались не слоговым, а иероглифическим письмом.

Числа и кохау ронго-ронго

Какой системой письма пользовались жители острова Пасхи? Тут среди ученых нет единогласия. Были попытки читать значки кохау ронго-ронго как слоговые и даже алфавитные. Советские исследователи Кудрявцев, Ольдерогге, Кнорозов, Бутинов признали письмена острова Пасхи иероглификой. Доктор Бартель из ФРГ полагает, что кохау ронго-ронго является “эмбриописьмом”, в котором нет грамматических показателей, а каждый знак передает целое слово. В недавно вышедшей книге В. Истрина “История письма” высказывается мысль, что островитяне пользовались письмом, в котором одному знаку могла соответствовать даже целая фраза. Известный знаток письмен древнего Востока Игнациус Гельб полагает, что кохау ронго-ронго нельзя назвать “письменностью” даже в примитивном смысле этого слова. Он считает их пиктографической записью.

Очевидно, ответить точно на вопрос, какой же системой письма пользовались жители острова Пасхи (и было ли у них вообще письмо), могут лишь статистические методы исследования, количественные подсчеты. Они были произведены автором этих строк и приводятся в таблице.

Первоначально была определена частота появления новых знаков в двух текстах кохау ронго-ронго: тексте “Тахуа” (в таблице он обозначен буквой “Т”) и тексте “Аруку-Куренга” (буквы “А. К.” в таблице). Кроме того, для сопоставления был взят фольклорный текст острова Пасхи, повествующий о легендарном первом поселенце Хоту Матуа, Хоту-Отце. Этот текст был записан исследователями острова Пасхи латинскими буквами.

В графе таблицы, обозначенной буквами “Ал.”, приводится частота появления в нем новых букв. Но ведь можно подсчитать частоту появления не букв, а целых слогов, и тогда мы получим характеристику слогового письма (на случай, если кохау ронго-ронго записаны им). (Графа таблицы, обозначенная буквами “Сл.”).

Подсчитав частоту появления в том же тексте новых морфем, то есть новых корней слов и грамматических частиц, мы получим характеристику “поморфемного” письма, (графа “Морф.”), а подсчитав частоту появления новых слов, — письма “пословного” (графа “Слов.”)

Сопоставим затем данные по текстам кохау ронго-ронго с данными по тексту Хоту Матуа и древнеегипетскому иероглифическом тексту. Нетрудно убедиться в том, что письмо острова Пасхи никак не может быть алфавитным или слоговым: слишком много новых знаков появляется в письме кохау ронго-ронго. А для того, чтобы оно оказалось письмом “поморфемным” или “пословным”, этих знаков слишком мало. Зато с древнеегипетской иероглификой данные текстов кохау ронго-ронго совпадают очень хорошо. Видимо, жители остров Пасхи пользовались иероглифическим письмом.

Классы знаков и статистика

Система письма определена. Что делать дальше? Следующим шагом в изучении неизвестного текста будет подсчет частоты отдельны знаков.

Если система письма — алфавитная, то самые частые знаки будут передавать самые “популярные” буквы неизвестного языка. Советскими исследователями В. Шеворошкиным и Б. Сухотиным разработан объективный метод, с помощью которого можно произвести разделение знаков неизвестного письма на две группы — группу гласных и группу согласных (подробно о нем читателям нашего журнала рассказал один из авторов этого метода, В. Шеворошкин, в статье “Язык царя Мавсола”, опубликованной в №7 журнала “Знание — сила” за 1965 год).

После разделения знаков на гласные и согласные можно провести и более точное деление. Например, гласная “а” почти в любом языке мира встречается чаще, чем гласная “у” и т. д.

СОПОСТАВЛЕНИЕ ЧАСТОТЫ ПОЯВЛЕНИЯ НОВЫХ ЗНАКОВ
(египетские, протоиндийские и тексты острова Пасхи)


Число знаков	Египет	Индия	о. Пасхи
			Иерогл.		Фольклорный текст
			Т.	А. К.	Ал.	Сл.	Морф.	Слов.
25 50 75 100	13 12 14 9	20 11 11 7	18 1 11 18	7 7 8 6	1 0 0 0	0 2 0 0	6 2 3 2	8 4 6 9
125 150 175 200	8 5 9 6	5 3 4 4	11 9 14 6	0 0 0 0	0 0 0 0	7 8 1 7	2 8 6 8	6 4 0 3
225 250 275 300	4 4 5 2	6 3 5 3	11 2 0 0	2 2 2 4	4 8 4 9	8 11 5 4	8 6 9 8	4 3 4 2
325 350 375 400	4 3 3 6	2 6 5 6	14 7 3 0	9 2 6 5	8 9 12 9	2 3 4 3	5 3 3 4	0 0 0 0
425 450 475 500	0 4 2 4	7 5 5 2	19 10 5 8	5 6 9 1	7 6 4 1	8 4 4 4	0 0 0 0	0 0 0 0
525 550 575 600	2 1 1 4	7 3 2 5	1 1 2 8	10 6 1 11	3 8 8 7	0 0 0 0	0 0 0 1	4 1 2 8
625 650 675 700	3 2 5 3	1 3 0 6	10 12 8 5	9 9 9 2	0 0 0 0	0 2 2 0	8 5 10 5	6 8 6 7