сделать это оказалось не так уж сложно, потому что согласные становятся мягкими в основном в определенных позициях, которые компьютер научился находить.
А что касается других различий звуков и букв, то они оказались либо практически несущественными для расчета фоносемантики слов, либо выбор пришлось сделать в пользу буквы, как то подсказала «примерка на манекенах». Для компьютера это большое удобство, так как слова можно вводить в обычном печатном виде. Компьютер сам устанавливает мягкость согласных и приступает к расчету содержательности «звукобуквенной» формы слов.
Да, форма не звуковая и не буквенная, а именно звукобуквенная. Например, слово любовь в таком виде и вводится в компьютер, но он преображает ее так: л'юбов' (апостроф — знак мягкости). Как видите, компьютер отметил мягкость звуков и в то же время сохранил букву ю. Но чтобы не вводить нового, непривычного термина, станем по-прежнему говорить «звук», и только там, где это необходимо для правильного понимания сказанного, будем употреблять термин «звукобуква».
В расчетах тоже есть свои особенности. Не все звуки в составе слова равноценны, не все вносят равный вклад в восприятие слова как единого звукобуквенного комплекса.
Ясно, что ударные гласные заметнее безударных. Они звучат четче, громче и дольше. Значит, их роль должна быть подчеркнута, вес их средних оценок при расчетах должен быть увеличен.
Но оказывается, первый звук слова информативно еще более важен, чем ударный. Действительно, все первое ново и свежо, особенно заметно, сразу бросается в глаза, выделяется, запоминается. Все последующее блекнет, становится обычным, теряет свою информативность. Так и в жизни, так и в слове. Первый звук слова своей содержательностью как бы задает тон, окраску всем последующим звукам, будто включает регистр, в котором будет звучать слово. Замените «красивый» звук мь на «отталкивающий» хь, и получится вместо красивого слова милый отталкивающее хилый. А ведь поменялись только первые звуки, остальные остались теми же. Или прочитайте наоборот нейтральное, не вызывающее никаких особых эмоций слово мах — получите «грубое» слово хам. Это «грубый» х, став первым, окрасил своей содержательностью всю звуковую форму слова. Следовательно, вес средней оценки первого звука тоже должен быть увеличен, и еще больше, чем ударного.
Однако самая большая разница в информативности звуков слова вызвана обстоятельством, которое мы, казалось бы, не замечаем, а именно — разницей в частотности, или встречаемости, звукобукв в речи. Опять-таки, как и часто повторяющиеся события становятся обычными, теряют информативность, как слова от частого повторения «в привычку входят, ветшают, как платье», так и часто встречающиеся в речи звуки тоже оказываются малоинформативными, не задерживают на себе внимания, а значит, и незначительно влияют на восприятие слова, на формирование его фоносемантического ореола.
Редкие события высокоинформативны, они останавливают на себе внимание, выделяются из общего потока. И если в слове встречается редкий звук, он переключает на себя внимание воспринимающего, его содержательность становится доминирующей. И чем больше разница в частоте встречаемости между частыми и редкими звуками слова, тем выше информативность редких звуков, тем больше нужно увеличивать вес их средних оценок по сравнению со средними оценками остальных звуков.
Все эти расчеты компьютер выполнит легко, но ему для этого нужны данные об употребительности звукобукв. Те сведения, которые имелись в печати, не совсем подходили — ведь нужны данные именно о звукобуквах, а не о звуках или о буквах, да еще и отдельно по ударным и безударным гласным, да еще в какой-то нейтральной «усредненной» речи. Пришлось вести подсчеты по разным текстам, записывать на диктофоны разговорную речь в разных ситуациях. Работа большая, однообразная, изнурительная. Но что делать, других путей не было.
Забегая вперед, следует сказать, что теперь и эту работу смог бы выполнить сам компьютер. Когда мы перешли от отдельных слов к целым текстам (о чем будет рассказано ниже), компьютер все равно подсчитывал вероятности звукобукв. Не удержусь и похвастаю: компьютерные подсчеты, проведенные на гигантском материале, мало что изменили в наших данных, полученных вручную тяжелым трудом на выборках несравненно более скромного размера. Но это так, к слову, и не в укор машине. Ведь сколько времени и сил пришлось потратить на эту в общем-то подсобную, подготовительную работу! А компьютер выполнил ее походя, играючи.
Но наконец готово все. Многократно выверена, уточнена и перепроверена основная таблица, содержащая средние оценки всех русских звукобукв по 20 признаковым шкалам. Готова и таблица вероятностей звукобукв. Теперь слово за компьютером. Вот тут уж с ним вручную не потягаешься. Ручной расчет фоносемантического ореола даже для одного слова по всем шкалам — дело длинное, а печать машины стрекочет безостановочно, успевай только перфокарты загружать. А если работать с дисплеем, то время расчета — это фактически время набора слова на алфавитной клавиатуре. Иначе говоря, компьютер, как и человек, моментально «схватывает» фоносемантику слова.
Для тех, кому нравится более строгое изложение схемы вычислений, приведем формулы, по которым работает компьютер.
Если частотность (вероятность) любого (
Теперь нужно учесть место каждого звука в слове. Для этого коэффициент первого звука слова (k
а для ударного (К
После этих приготовлений напишем основную формулу:
где F — фонетическая содержательность слова (его фоносемантика) ;
f
k
Σ — знак суммы.
Последняя «примерка на манекенах» показывает, что все в порядке — схема расчета в общем верна. Информанты считают, что «слово» незич звучит как нечто «маленькое» и «нежное», а фрыш — как нечто «плохое, грубое, страшное», и компьютер дает примерно те же характеристики. По мнению информантов, хифель и уршух страшное, а лимень и нитис — безопасное; компьютер того же мнения. Вробар и вакам кажутся информантам сильными, и компьютер выдал для них тот же признак.
Значит, способ расчета можно переносить и на настоящие слова. Конечно, спасительная оглядка на информантов теперь невозможна, но компьютер уже научился правильно имитировать человеческое восприятие фоносе-мантического ореола слов. Использовать эти свои умения он может разнообразно, и некоторые из возможностей мы ниже обсудим.
В результате вычислений слово по каждой шкале получает суммарную оценку фоносемантики, выраженную в единицах пягиранговой измерительной шкалы, то есть такую же оценку, как и средняя оценка содержательности отдельного звука. По суммарной оценке, опять-таки точно так же, как и по средней оценке для отдельного звука, слово получает характеристику в терминах шкалы. Например, для слова дом по шкале «хороший — плохой» компьютер получил суммарную оценку 2,3. Оценка находится в левой («хорошей») значимой зоне шкалы «хороший — плохой», поэтому компьютер выбирает для характеристики фоносемантического ореола этого слова признак «хорошее». Другими словами, по «мнению» компьютера, имитирующего наше с вами восприятие фоносемантики, звучание этого слова (точнее, его звукобуквенная форма) производит впечатление чего-то «хорошего». А для слова хам вычислена суммарная оценка 3,8. Она располагается в правой («плохой») значимой зоне шкалы, поэтому компьютер «полагает», что звучание этого слова производит впечатление чего-то «плохого». И так по всем 20 шкалам.
Значимые зоны школы определяются так, как показано на рисунке:
