Язык – очень интересный объект для наблюдений, а Интернет – очень удобная среда для исследований в области языка. Однако выводы и отчеты лингвистов и филологов зачастую не выходят за пределы их весьма узкого круга, как обычно, весьма далекого от народа. Популяризовать исследования, касающиеся языка, не так-то просто. Но при желании можно. Это доказывает проект www.wordcount.org, который ведет подсчет частоты использования слов в английском языке. Делает он это с помощью «Британского национального корпуса» (www.natcorp.ox.ac.uk) – огромного собрания текстов, отображающих язык во всем многообразии стилей, жанров, территориальных и социальных вариантов и тому подобного. Программа анализирует этот массив, выбирает слова, которые встречаются в нем по меньшей мере дважды, и расставляет их по порядку, в зависимости от частоты употребления. В результате образовалась «очередь» более чем из 86 000 слов. Чем популярнее слово, тем крупнее шрифт используется для его написания, и эта визуализация очень наглядна. Вне конкуренции слово the, да и вообще – артикли, предлоги, частицы и союзы прочно обосновались в голове этого списка. Первое существительное, которое здесь встречается, – это time, на 66-м месте. Таких открытий любопытный пользователь сделает много, тем более что возможности для этого есть. Например, можно просто пролистывать весь список вперед по одному слову и при необходимости возвращаться назад. А можно и посмотреть, на какой позиции находится то или иное слово, или наоборот – что за слово стоит под каким-либо номером. Ну а последним в этой «очереди» на момент написания книги было слово conquistador. Интересно также выявлять последовательности слов (например, одно за другим идут слова «Америка», «гарантировать», «нефть» и «возможность») или насколько близкие друг другу слова (по смыслу или привычные по словосочетаниям) отстоят друг от друга. В будущем авторы проекта планируют переориентировать его с «Британского национального корпуса» на работу с любым текстом, сайтом и в конечном счете с Интернетом в целом.
Широко представлены в Интернете и ресурсы, посвященные отдельным языковым пластам, в том числе и жаргону. Интерактивная энциклопедия современного языка www.jargon.ru претендует на всеобъемлющее изложение этого предмета. Пополняется она по популярному ныне принципу «народной энциклопедии», самым ярким воплощением которого является «Википедия» (www.wikipedia.org), речь о которой пойдет совсем скоро. Другими словами, любой, кто хочет написать сюда статью, посвященную какому-либо жаргонизму, может это сделать, предварительно зарегистрировавшись. Поле для деятельности тут весьма широкое. Слов в базе еще не так много (чуть более 4000), развернуться есть где, и практически любой человек найдет словарь, который он мог бы расширить. Написанное просматривается модератором и после этого ставится в словарь. Все словари объединены в большие разделы: социальные, профессиональные, научные, национальные и народные. Есть весьма обширные собрания, например больше четверти всего здешнего «словарного запаса» приходится на тему «Одежда и мода». Скорее всего, кто-то разбирающийся в теме просто не пожалел свободного времени. Можно ходить по разделам или воспользоваться поиском по слову, простым или расширенным, с фильтрами. Помимо профессиональных терминов и жаргона, есть здесь, например, и язык глухих – изображения жестов. Кроме того, здесь есть и разделы, посвященные арго, так что о возможности наткнуться на ненормативную лексику я вас предупредил.
Если русскоязычный пользователь испытывает какие-либо затруднения в области языка, его обычно отправляют на сайт www.gramota.ru – весьма обширный ресурс, посвященный русскому языку. А вот некоторые вопросы в английском лучше всего разъяснять с помощью сайта www.confusingwords.com. Речь здесь идет о словах, которые часто путают друг с другом. Таких тут более 3000. Как правило, это просто похожие друг на друга слова или омонимы, то есть слова с разным значением, сходно звучащие или даже пишущиеся. Кроме того, есть слова, которые не очень-то похожи по написанию, но люди их все равно путают. Этот весьма незатейливый сайт Ричард Уондерман сделал для своей супруги, школьной учительницы, уставшей от ошибок своих учеников. На создание ресурса ушло довольно много времени и труда.
Сама по себе идея возникла более 15 лет назад, когда Интернета в нынешнем смысле, по сути, и не было. До тех пор пока не удалось реализовать задуманное, жена автора собирала примеры, которые затем превратились в содержание сайта. Если вас смущает, какое именно слово лучше употребить, скажем «аффект» или «эффект», можно попытаться поискать его в здешней базе. Вовсе не обязательно точно знать, как именно пишется слово, достаточно заменить те буквы, в которых вы не уверены, вопросительными знаками. Если поиск дал результаты, то вы попадете на страничку, где искомое слово приведено вместе с теми, с которыми его чаще всего путают. Тут же приведено лексическое значение каждого из них и примеры правильного использования. Это не отсылка к словарям, а разъяснения, которые автор и его супруга не поленились написать собственноручно. На первой странице можно найти шестерку слов, вызвавших наибольшие затруднения – и, соответственно, наибольшее количество запросов посетителей. Кроме того, можно увидеть слова, заинтересовавшие пользователя, просматривавшего сайт непосредственно перед вами.
Интереснейшие исследования время от времени публикует на своем сайте www.languagemonitor.com американская компания Global Language Monitor (GLM). Разумеется, речь идет в основном об английском языке, но от этого менее примечательными их отчеты не становятся. Так, проанализировав новостные публикации апреля 2005 года, специалисты пришли к выводу, что о Папе Римском сообщалось гораздо больше, чем о недавнем цунами в Южной Азии и событиях 11 сентября 2001 года, не говоря уж о переизбрании Джорджа Буша или смерти Рональда Рейгана и принцессы Дианы. Новости планетарного масштаба практически всегда оказываются в центре внимания здешних аналитиков: можно проследить, например, какие словосочетания чаще всего употребляются в сообщениях о том или ином событии или персонаже. Впрочем, предметом исследования становятся не только новости. Специалисты GLM пытаются подсчитать количество употребляемых в английском языке слов (на первой странице сайта есть счетчик), хотя и признают, что точно сделать это невозможно. Помимо Интернета, исследуется и офлайновая медиасреда: здесь можно найти список самых политкорректных выражений, а также «слова года» на телевидении и в кино. Следует сказать, что собственных исследований компании на сайте не так много, зато по различным темам, связанным с языком, собрано довольно много статей из других источников. Здесь, в частности, можно узнать о лучших и худших названиях компаний и марок продукции, смайликах, используемых интернет-пользователями, языке героев книги «Властелин Колец» и о многом другом. Сейчас GLM работает над составлением словаря модных политических выражений последнего времени (типа российских «вертикаль власти», «политическая составляющая» или «спор хозяйствующих субъектов») и активно использует для этого Интернет. Специалисты не только осуществляют мониторинг новостных и политических сайтов, блогов и форумов, но и просят посетителей присылать новые словечки политического лексикона по электронной почте.
Новые слова входят в нашу жизнь едва ли не ежедневно. Иногда не успеваешь проследить, когда именно в лексиконе появляется то или иное слово. Глядишь, а все уже щеголяют новым термином, его употребляют в газетах, книгах и даже песнях. В русскоязычной части Интернета я не встречал ресурса, который бы специально прослеживал такие изменения в языке, а вот у американцев есть «Шпион за словами» – www.wordspy.com. Почти каждый день здесь появляется очередной неологизм и объясняется его значение. Слова берутся не с потолка и не из бытовых разговоров, а из прессы, что как бы закрепляет статус новых членов большой лексической семьи. Таким образом, если англоязычный человек начинает (или даже заканчивает) свой день с просмотра этого сайта, он всегда будет в курсе языковых новинок, а заодно еще и прочитает несколько выдержек из газет, на которые он, не будь такого случая, скорее всего, не обратил бы никакого внимания. Вот интересные находки, которые будут понятны и тем, кто не знает английского языка: ranchburger – недорогой загородный дом с типовым дизайном, spinach cinema – скучные, но познавательные фильмы. Из второго примера понятно, что слежка идет не только за словами, но и за словосочетаниями. Есть слова, перевести на русский которые пока невозможно, например yestersol – от yesterday («вчера») и sol («марсианский день»), то есть «марсианское вчера». Если открыть ссылку, которая прилагается к каждому описываемому слову, попадаешь на страничку, где можно посмотреть синонимы или слова, близкие по значению. Кроме того, постоянно ведется ТОР-100 наиболее популярных слов, и лидируют здесь вовсе не те, которые были добавлены последними, как можно было бы ожидать. Наверху таблицы – модные неологизмы, то есть те, которые появились, возможно, даже несколько месяцев назад, но активно мелькать в прессе стали только сейчас. Специальный раздел посвящен новым техническим терминам, которых тоже будет прибывать порядком, пока не остановится научно-технический прогресс. Кстати, само по себе появление такого сайта породило новое слово – lexpionage.
Наверняка каждый из нас сталкивался с незнакомыми аббревиатурами и сокращениями. Мне и моим коллегам на радио еще труднее, поскольку мы должны не только сами знать те сокращения, которые употребляем в эфире, но и быть уверенными, что их понимает подавляющее большинство слушателей. Меня, например, ужасно коробит, когда приходится произносить слова типа РУБОП или ГУБЭП. Поэтому я не мог не обрадоваться появлению такого ресурса, как www.sokr.ru. Он как раз и предназначен для обмена опытом относительно разных зашифрованных названий и понятий. Прежде всего, это, конечно, словарь, с помощью которого можно попытаться узнать, что же кроется за нагромождением букв. Причем досконально помнить аббревиатуру не обязательно, достаточно знать две идущие подряд буквы – и система найдет все возможные варианты. Если же интересует конкретное сокращение, то можно включить параметр «буквально», и тогда, если поиск будет успешным, среди множества вариантов нужный отыскивать не придется. Иностранные аббревиатуры, разве что кроме уже устоявшихся типа ЦРУ и США, здесь можно не искать, поскольку авторы решили не заморачиваться и попросту дали ссылки на аналогичные зарубежные ресурсы. Не стоит запрашивать и сокращения вроде «Мосгаз», поскольку и ежу понятно, что дело пахнет газом в столице нашей родины. Авторам нельзя отказать в чувстве юмора. Явно из хулиганских побуждений было добавлено политическое движение «Прогресс и законность. Демократический единый центр». Для неожиданно заскучавших предоставлена оригинальная возможность погадать на аббревиатуре. Мне, недоучившемуся химику, например, пророчески выпало СХЛ – санитарно-химическая лаборатория. Пользователи могут добавлять известные им аббревиатуры, прошедшие мимо хозяев сайта, но напрямую это сделать нельзя – предлагаемые варианты поначалу просматривает редактор.
Случалось ли вам ошибочно набирать адрес какого-нибудь сайта, забыв переключиться с кириллической раскладки клавиатуры на латинскую? Есть специальные средства, которые позволяют успешно бороться с собственной забывчивостью. Самая популярная из таких программ – Punto Switcher. Но по разным причинам подобные средства используют далеко не все, рано или поздно рискуя попасть на сайт http://opechatka.ru. Это яркий образец остроумного и вполне корректного обращения человеческой забывчивости и рассеянности себе на пользу. Дело в том, что относительно недавно в браузеры стали встраивать функции поиска. Если в адресную строку введена некорректная надпись, то в поисковую систему автоматически отправляется запрос. В результате пользователя либо сразу перебрасывают на первый найденный сайт, либо демонстрируют результаты поиска. Нетрудно догадаться, что по абракадабрам, типа «цццюмувщьщыешюкг» (это написанный в русской раскладке адрес www.vedomosti.ru), результатов будет немного, обычно не больше одного. Этот результат, как правило, дает ссылку, ведущую на http://opechatka.ru. Объясняется все проще простого: владельцы этого ресурса взяли несколько десятков названий популярных сайтов, написали их кириллицей и прописали при регистрации в поисковых системах. Поэтому теперь часть рассеянных пользователей попадает сюда, кто автоматически, а кто и по ссылке, проявив любопытство. Главная страница представляет собой список сайтов, которые «поддерживаются» данным ресурсом. Если вы попадете сюда случайно, то наверняка найдете тот, который искали. Щелкнув на ссылке-абракадабре, вы перейдете на страничку с кратким описанием искомого сайта и напоминанием о программах типа Punto Switcher. Таким образом, пока вы идете к неверно запрошенному сайту, вам покажут два рекламных баннера. Можно, конечно, и не ходить по ссылкам, а просто еще раз, но уже правильно, написать адрес, это уж кому что больше нравится – щелкать кнопкой мыши или набивать буквы на клавиатуре. Правда, пока этот оригинальный прием вряд ли приносит владельцам сайта какую-то ощутимую выгоду, поскольку попадают сюда по 200—400 человек ежедневно.
Орфографические ошибки и опечатки – весьма распространенная штука, даже в печатных СМИ, несмотря на труд литературных редакторов и корректоров. Что уж говорить об остальных компаниях, которые время от времени радуют нас своим «творчеством». Особенно умилительно бывает читать инструкцию на русском языке, написанную где-нибудь в Китае. Проблема эта актуальна не только для нас, но и для американцев, особенно учитывая объем импорта в США. Масштабы явления таковы, что посвященный ему сайт – www.engrish.com – весьма популярен. Название говорит само за себя. Здесь собраны всевозможные опечатки, которые встречаются на упаковках продуктов, сумках, автомобилях, зданиях, в ресторанных меню, на компакт-дисках, гигиенических принадлежностях и т. д. Каждый такой пример сопровождается фотографией объекта с подписью в несколько слов, которая комментирует казус. Автор особо оговаривает, что все экспонаты – абсолютно реальные. Многие ошибки нам непонятны, нужно досконально знать английский язык, чтобы разобраться. Но для некоторых экземпляров вполне хватает и школьных знаний. Например, реклама блюда Hot Bowel Rice буквально означает – «Горячая кишка риса», хотя на самом деле имелась в виду всего-навсего «Горячая чашка риса» (Hot Bowl Rice). Здесь собраны не только опечатки, но и явно ошибочные надписи, сопровождающие какие-либо объекты. Есть фотография игрушечного полковника Сандерса (такой дедушка в белом костюме, символ компании KFC, скорее похожий – в нашем понимании – на земского доктора), под которой лаконично написано: Uncle Sam. Отдельного внимания заслуживают уже упоминавшиеся инструкции, но это уже для тех, кто знает язык неплохо и может вдоволь насладиться огромным количеством ошибок. Сайт пополняется его посетителями. Так что, если уверены, что у вас есть предмет с ошибочно сделанной или просто двусмысленной английской надписью, не поленитесь сфотографировать его и прислать снимок. Только внимательно следите за текстом, который будете писать сами, иначе рискуете попасть в раздел, посвященный опечаткам в письмах читателей.
Раз уж речь зашла о значении слов, невозможно пройти мимо «Википедии» – http://ru.wikipedia.org. Это русскоязычная часть крупного международного проекта http://en.wikipedia.org – огромной энциклопедии, которая, по данным на конец 2006 года, насчитывает в английской версии более 1,5 млн статей. На русском языке все гораздо скромнее, но тоже внушительно – более 100 тыс. статей. Проект продолжает бурно развиваться, и все зависит от посетителей, поскольку пишут эту энциклопедию именно они. Интернет, как ничто другое, позволяет реализовать свободный обмен информацией, в данном случае знаниями. Людей, что-либо знающих на хорошем профессиональном уровне, очень много, среди них полно тех, кто готов поделиться своими знаниями с остальными, более того, сделают это с удовольствием. Так вот, «Википедия» придумана специально для этого. Если вам кажется, что та или иная статья выглядит неполной или в ней есть неточности, ничего не стоит ее тут же отредактировать, и она сохранится именно в таком виде. Разумеется, тут же встает вопрос о злонамеренном искажении текста, или, как здесь принято выражаться, вандализме. С целью защиты от него до коренного изменения содержания допускаются только зарегистрированные пользователи. Кроме того, сохраняются все редакции статьи, и если искажение все-таки произошло, всегда можно найти предыдущий вариант. Вопрос о том, насколько можно доверять энциклопедии, составленной не специально обученными для этого людьми, а всеми желающими, по-моему, практически не стоит. Во-первых, трудно представить, что кто-то по доброй воле будет писать энциклопедические статьи, не зная предмета, а во-вторых, даже если это произошло, почти всегда найдется кому поправить – здесь как раз срабатывает принцип открытого редактирования. В «Википедии» запрещено размещать материалы, защищенные авторским правом, кроме того, сюда лучше не писать тем, кто не хочет, чтобы его текст редактировался кем угодно.
На основе англоязычной «Википедии» работает замечательный сервис Omnipelagos (www.omnipelagos.com). Очень многие вещи в нашей жизни связаны между собой логическими цепочками. Простейший пример: «утро» и «сахар». Подавляющее большинство населения Земли утром обычно завтракает, а завтрак, помимо прочего, часто включает в себя сахар. Выясняется, что подобные связи и логические цепочки, причем зачастую гораздо более длинные и сложные, можно найти практически между любыми вещами, людьми и явлениями. На первой странице сайта справа вверху есть два малоприметных поля, куда нужно ввести слова, между которыми вы хотели бы найти цепочку. Через несколько секунд вы получите один или несколько результатов. Начинается все со слова, которое вы ввели в левом поле. Приводится цитата из энциклопедического определения, одно из слов которого является гиперссылкой. Как правило, это еще не то слово, цепочку с которым вы устанавливаете. Следующей строкой дается определение залинкованному слову, в нем – еще одна гиперссылка, и так до тех пор, пока дело не доходит до результата. Разумеется, необходимо вводить запрос на английском языке, на нем же будет и результат. Я попытался установить связь между двумя похожими словами parrot («попугай») и carrot («морковь»). Самый простой результат выглядел так.
Попугаев держат в качестве домашних животных.
Один из видов животных – грызуны, включая хомяков, мышей и т. д.
Источником воды для хомяков являются свежие огурцы, а также зеленая трава и морковь…
Были и еще два менее очевидных, но не менее интересных варианта. Хотя логические связи находятся отнюдь не всегда. Чем более употребительными являются искомые слова, тем больше цепочек между ними можно установить. Можно настроить поиск на максимальное количество цепочек или, наоборот, на максимально логичный и наименее бессмысленный результат. Цепочка может выглядеть совершенно случайной, ведь в статьях об абсолютно разных понятиях употребляются одни и те же существительные. Но это порой еще интереснее. Все зависит только от вашей фантазии. Можно искать связь между историческими деятелями прошлого и настоящего, конкретными людьми и абстрактными явлениями, реальными и никогда не существовавшими вещами. Кстати, если начало и конец цепочки поменять местами, результаты могут быть совсем другими.
Надо сказать несколько слов и о более практичных сервисах – об онлайновых переводчиках. Самый известный ресурс Рунета такого рода – www.translate.ru. Я пользуюсь им уже лет шесть, и меня очень удивляет, когда кто-то о нем не знает. Он позволяет перевести какой-нибудь текст с одного из нескольких европейских языков и обратно в режиме онлайн. Конечно, качество машинного перевода оставляет желать лучшего, но для того, чтобы понять основной смысл написанного или передать на другом языке ваши слова, этого чаще всего вполне достаточно. Регистрация поможет увеличить объем переводимого текста. Если же предмет перевода находится на интернет-сайте, то последний можно перевести целиком. Причем ссылки на нем останутся активными, и, щелкнув на любой из них, вы откроете новую страницу, которая также будет автоматически переведена.
Иностранный «брат-близнец» рунетовского «транслейта» – Babel Fish на Altavista (http://babelfish. altavista.com) – отличается от остальных онлайновых переводчиков в первую очередь тем, что использует технологию AJAX, ибо вещь это передовая и, кроме того, модная.
Когда эта книга готовилась к изданию, появился и «Google Переводчик» – http://translate.google.com. Google верен себе – его переводчик многое делает по-своему. Страница сервиса не содержит никаких дополнительных элементов, там даже текстовой рекламы нет, поэтому загружается она мгновенно. Есть козырь и помощнее – отсутствие серьезного ограничения в объеме переводимого текста. Во всяком случае, тексты на несколько тысяч знаков здесь переводят целиком. Если навести указатель мыши на любой участок переведенного текста (ссылку или абзац), то во всплывающем окошке покажется исходный вариант. Это избавляет пользователя от необходимости переключаться между окнами или закладками браузера, чтобы посмотреть, как же там было в оригинале. Еще одна замечательная вещь – кнопка, которую можно перетащить на панель закладок браузера и отныне переводить страницы одним щелчком. Новый продукт далеко не идеален, есть у него и недостатки. Так, на русский можно переводить только с английского и наоборот. Таким же недостатком страдает и Babel Fish, так что за переводами с немецкого, французского, итальянского и обратно стоит обращаться на Translate.ru, во всяком случае пока.
Некоторые совершенно серьезные сервисы иногда используются ради баловства, и порой получается весьма забавный результат. Такая же история и с сайтом, находящимся по адресу www.textology.ru/web.htm. Первоначально была придумана программа, которую назвали «Атрибутор 1.01». Она анализирует текст, сравнивая его с имеющимися в базе художественными произведениями известных русских писателей. Для анализа необходимо 20 Кбайт текста, то есть примерно 6 страниц. Конечно, программу не сложно обмануть, попросту клонировав имеющийся у вас кусок текста, однако в этом случае вы рискуете получить менее точный результат. В базе «Атрибутора» несколько сотен романов (пока он умеет анализировать только по ним) 103 писателей прошлого и позапрошлого веков. Разумеется, тексты, уже имеющиеся в базе, он распознает без труда. Тем интереснее попытать его насчет других произведений писателей, которых он знает, а еще интереснее – с теми авторами, кого в этой базе нет. Ну а теперь о настоящем хулиганстве. Решив узнать, на кого из писателей по стилю больше всего похож Михаил Ходорковский, я предложил «Атрибутору» его знаменитое письмо «Кризис либерализма в России». И мне был выдан не лишенный логики ответ, что данный текст скорее похож на газетную статью, нежели на литературное произведение. Но это еще что. Анализ песен, исполняемых эстрадной певицей Катей Лель, дал совершенно обескураживающий результат – Н. Г. Чернышевский.
Через несколько лет после «Атрибутора» появился еще один сайт подобного рода – «Анализ писем» (www.analizpisem.ru). Пользователю предлагается проанализировать любое имеющееся у него письмо на предмет того, в каком состоянии находился человек, который его писал. По сути, это может быть не только письмо, но и вообще любой текст, – программе все равно. Желательно, чтобы в нем было не менее 1200 букв. Для тех, кто пишет электронные письма, это непомерная величина, люди не затрудняют себя написанием более двух-трех предложений. Впрочем, ничто не мешает собрать в единый текст несколько писем или даже объединить фразы из разговора по ICQ и проанализировать их. Программа выдаст характеристику автора, состоящую из нескольких пунктов, типа: «Этот человек мыслит масштабно. Чувствуется полет фантазии» или «Автор замкнут и не склонен к экспрессии».