Если мы возьмем пару “означающее” — “означаемое”, то в Интернете, как в замкнутой информационной модели, соответствие между ними устанавливается очень легко. Оно неоднозначно, но статистически взвешенно. Установление связи между означаемым и означающим всегда возможно, потому что они принадлежат единому пространству и существует инструмент установления этого соответствия.

Возьмем любое слово и введем его в качестве запроса в поисковую систему Яндекс или Google. Поисковик выдаст нам некоторый (возможно, очень большой или, напротив, пустой) набор ссылок на различные интернет-ресурсы — страницы, сайты, блоги, — объединение этих ресурсов и является означаемым. Причем поисковая система сама решает, какой ресурс изо всего набора максимально близок (релевантен) к нашему означающему. Поисковая система делает свой выбор, используя специальные алгоритмы ранжирования результатов. Эти алгоритмы, как правило, не разглашаются, и для пользователя они недоступны. Создатели поисковых систем полагают, что закрытость в данном случае обеспечивает объективность поиска: не зная деталей алгоритма, невозможно манипулировать работой поисковика, невозможно так подстроить свой ресурс, чтобы он оказался на первых позициях в списке поисковых результатов.

Такова в самых общих чертах лингвистическая модель, которая реализуется в глобальном информационном пространстве. Она проста, оперативна, замкнута относительно операции поиска и действительно глобальна: в поисковом индексе Google на сегодня около девятнадцати миллиардов документов на всех языках мира.

В этом глобальном информационном пространстве действуют люди. Они создают ресурсы, они формируют поисковые запросы, они же пишут поисковые системы — то есть создают инструменты навигации по этому океану. И все они взаимодействуют друг с другом и с информационным пространством.

О некоторых моментах этих взаимодействий я хочу сегодня поговорить.

Яндекс на страже нового русского языка. В Яндексе есть сервис проверки орфографии — Query-based speller (можно перевести название примерно так: “Уточнение правописания на основании анализа запросов”). Первоначально он работал таким образом: если в запросе содержалось слово, отсутствующее в базовом словаре, Яндекс брал на себя смелость предлагать исправить это “плохое”, по его мнению, слово на “хорошее” — близкое по написанию и словоупотреблению. В этом случае под строкой поиска появлялась фраза: “Опечатка? возможно, имелось в виду: [предлагаемое „хорошее” слово]”.

Затем сервис был несколько модифицирован, поскольку, с точки зрения Яндекса, этого сегодня уже недостаточно. Один из разработчиков сервиса Алексей Пяллинг так объяснил происшедшие изменения: “„Обычный” словарь — это, конечно, хорошо. Но в наше время, когда новые слова появляются чуть ли не каждый день, поддерживать актуальность словаря невозможно. Сами посудите, ежедневно регистрируются новые фирмы, появляются новые музыкальные группы, новые спортсмены выигрывают новые соревнования. Возникающие при этом новые слова часто бывают непроизносимыми, нечитаемыми и даже непечатными. Разбором и анализом таких ситуаций в Яндексе как раз и занимается новый алгоритм, автоматически строящий словарь исправлений. Запросы пользователей собираются и анализируются, обрабатывается статистика. Если оказывается, что по какому-то слову есть много вариантов исправлений, то из кластера выбирается похожее слово из наиболее распространенных в Интернете. Таким образом, появляется база пар „плохих” и „хороших” слов — слов с ошибками и исправленных, и каждое слово в запросе пользователя теперь проверяется по такому „народному” словарю”.

“Афтар” и “автор”. Инициатива — наказуема. И Яндекс начал получать письма возмущенных пользователей, которые обвинили поисковик в безграмотности. На одно из таких писем ответил директор Яндекса по технологиям и разработке Илья Сегалович: “Нам задают вопросы про Query-based speller, который наряду со словарным орфографическим корректором работает на поиске Яндекса. Автор письма пишет: „Однако меня все равно не устраивает, когда в ответ на запрос ‘афтор‘ с одной опечаткой мне говорят, что, возможно, следует писать ‘афтар‘, а не ‘автор‘”. Отвечаем: [автор] и [афтар] — два разных слова, они принадлежат к двум разным пластам языка, имеют разную сочетаемость. По ассоциациям запросов видно, что такую опечатку делают т. н. „падонки”, которые намеренно пишут это слово через „ф”. Нормальный человек не поставит случайно вместо „в” букву „ф” — и по звучанию не похоже, и расположена она на клавиатуре не рядом. Иными словами, замену [афтор] — [афтар] мы считаем вполне адекватной. Более того, по-видимому, орфографической ошибкой является написание [автор жжот]. Правильно [афтар жжот]””.

Если выполнить запрос “афтар” — Яндекс дает около полумиллиона упоминаний. Этого достаточно, чтобы сказать, что слово адаптировано языком. Впрочем, запрос “афтор” дает тоже немало — около двухсот тысяч ссылок. Причем контекст примерно тот же, что и у слова “афтар”, — сочетание “афтор жжот”, которое Илья Сегалович предлагает считать опечаткой, тоже широко распространено. Но с традиционным “автор” пока ни одно из этих написаний конкурировать не может — “автор” упоминается примерно 150 миллионов раз и побеждает за явным преимуществом.

Появление в русском языке большого количества намеренных искажений и даже возникающий языковой пласт — “новый русский язык, нах” — стал темой статьи “У языка есть афтар” в журнале “Русский NewsWeek”. Это явление исследовал известный филолог, профессор Боннского университета Гасан Гусейнов в статье “Берлога веблога. Введение в эрратическую семантику” <http://speakrus.ru/gg/microprosa_erratica-1.htm>.

“Эрратический” (англ. erratic) можно перевести как “переменчивый, непостоянный” (от латинского “erratum” — опечатка, недосмотр). Эрратическая семантика, как ее определяет Гусейнов, — это семантика, возникающая при намеренном искажении слова. Областью исследования известного филолога стала “эрратическая семантика” в ее бытовании в “Живом журнале” (“ЖЖ”). Но на сегодняшний день можно сказать, что “афтары” уже в изобилии разбрелись по всему русскоязычному Интернету.

Новый сервис Яндекса — проверка орфографии Query-based speller, чутко реагируя на перемены, возникающие в языке, в определенном смысле способствует нормализации и закреплению этих перемен. Норма возникает естественным образом — накоплением словоупотреблений. Выработанная Яндексом орфография ненавязчиво (как вариант запроса) напоминает, что нормой большинство носителей считает написание “афтар”, а не “афтор”. Но Яндекс тем самым как бы расщепляет традиционное слово “автор” по областям употребления и нормализует новое слово “афтар”. Это многим не нравится, поскольку происходит

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату