Автоматизированный конкорданс
Автоматизированный конкорданс. Технологию создания электронного конкорданса и его возможности покажем на примере мегатекста «Фет».
Из-за отсутствия академического издания стихов А.А. Фета в основу мегатекста мы положили все стихотворные тексты, помещённые в первом томе двухтомника сочинений поэта: Фет А.А. Сочинения в двух томах. Том 1. М.: Художественная литература, 1982. С. 41—278.
При подготовке мегатекста из стихов опускаются все элементы, не являющиеся органической частью произведения (пометки о времени и месте написания, примечания различного рода и проч.). Затем с учётом внутренней структуры корпуса осуществляется паспортизация каждого входящего в корпус текста. В нашем случае это метка — номер страницы тома. Эти метки указываются в ломаных скобках. Для компьютерной программы ломаные скобки — это знак, что всё содержащееся в них текстом не является и не учитывается. Мегатекст выглядит следующим образом (приводим его начало).
<41>
О долго буду я, в молчаньи ночи тайной,
Коварный лепет твой, улыбку, взор случайный,
Перстам послушную волос густую прядь Из мыслей изгонять и снова призывать;
Дыша порывисто, один, никем не зримый,
Досады и стыда румянами палимый,
Искать хотя одной загадочной черты В словах, которые произносила ты;
Шептать и поправлять былые выраженья Речей моих с гобой, исполненных смущенья,
И в опьянении, наперекор уму,
Заветным именем будить ночную тьму.
<41>
Когда мои мечты за гранью прошлых дней Найдут тебя опять за дымкою туманной,
Я плачу сладостно, как первый иудей На рубеже земли обетованной.
Не жаль мне детских игр, не жаль мне тихих снов,
Тобой так сладостно и больно возмущенных В те дни, как постигал я первую любовь По бунту чувств неугомонных,
По сжатию руки, по отблеску очей,
Сопровождаемым то вздохами, то смехом,
По ропоту простых, незначащих речей,
Лишь нам звучавших страсти эхом.
<42>
Когда мечтательно я предан тишине И вижу кроткую царицу ясной ночи,
Когда созвездия заблещут в вышине И сном у Аргуса начнут смыкаться очи,
И близок час уже, условленный тобой,
И ожидание с минутой возрастает,
И я стою уже безумный и немой,
И каждый звук ночной смущенного пугает,
И нетерпение сосет больную фудь,
И ты идешь одна, украдкой, озираясь,
И я спешу в лицо прекрасной заглянуть,
И вижу ясное, — и тихо, улыбаясь,
Ты на слова любви мне говоришь «люблю!»,
А я бессвязные связать стараюсь речи,
Дыханьем пламенным дыхание ловлю.
Целую волоса душистые и плечи,
И долго слушаю, как ты молчишь, — и мне Ты предаешься вся для страстного лобзанья, —
О друг, как счастлив я, как счастлив я вполне!
Как жить мне хочется до нового свиданья!
<42>
Постой! здесь хорошо! зубчатой и широкой Каймою тень легла от сосен в лунный свет... Какая тишина! Из-за горы высокой Сюда и доступа мятежным звукам нет.
Я не пойду туда, где камень вероломный,
Скользя из-под пяты с отвесных берегов,
Летит на хрящ морской; где в море вал огромный Придет - и убежит в объятия валов.
Одна передо мной, под мирными звездами,
Ты здесь, царица чувств, властительница дум...
А там придет волна — и грянет между нами...
Я не пойду туда: там вечный плеск и шум!
Заметим, что наша компьютерная программа работает с корпу сом исключительно в текстовом формате.
Для начала работы над созданием автоматизированного конкор данса необходимы: 1) мегатекст и 2) компьютерная профамма. Тре гий компонент конкорданса, словник, создаётся автоматически, и до ступ к нему возможен только посредством этой же программы.
С помощью компьютерной программы мегатекст «рассыпается» на словоформы с указанием количества словоупотреблений. В итоге получается упорядоченный по алфавиту список словоформ, который затем путём лемматизации может быть превращён в словоуказатель лексем. Благодаря словнику, который можно рассматривать как надёжный исследовательский инструмент для решения любых проблем, филолог имеет целостное представление о количественных и качественных параметрах словарного состава мегатекстов. Благодаря компьютерной программе каждая словоформа и каждая лексема связаны со всеми контекстами мегатекста, в которых они наличествуют.
В качестве примера приведём начало словника мегатекста «Фет». В нём словоформы путём лемматизации сведены в лексемы. В нашей практике создавались словники, в которых не все словоформы сводились в лексемы.
Ave Maria 2 |
алмазный 9 |
ангел 22 |
ароматный 1 |
алтарь 5 |
ангельский 1 |
архангел 1 |
|
а 139 |
алчность 1 |
антик 1 |
атлас 1 |
Аваддон 1 |
алчный 1 |
антипод 1 |
Афродита 1 |
авось 1 |
алый 4 |
апельсинный 1 |
ах 13 |
Аврора 4 |
Амальтея 1 |
Апеннины 1 |
|
Агата 1 |
амбра 1 |
Аполлон 4 |
|
агатовый 1 |
Амимона 3 |
апрель 1 |
|
акация 2 |
Амур 1 |
аргамак 1 |
|
Алексей 1 |
Амфитрита 1 |
Арго л и да 1 |
|
алкать 4 |
амфора 1 |
Аргус 1 |
|
аллея 13 |
Анакреон 1 |
Ариадна 1 |
|
алмаз 3 |
анбар 1 |
аромат 14 |
Полученный словник может рассматриваться и как исследовательский результат, и как инструмент для последующей работы над конкордансом.
Теперь мы знаем, что мегатекст «Фет» состоит из 5230 лексем, употреблённых 36 855 раз.
Исследовательские возможности словника увеличиваются, если на его основе параллельно создаётся частотный список лексем. Вот его начало — топ-50.
и 1780 |
все 205 |
весь 134 |
нет 86 |
в 967 |
но 203 |
тот 128 |
ни 84 |
я 967 |
этот 186 |
у 125 |
только 84 |
ты 629 |
за 178 |
быть 114 |
сон 83 |
не 604 |
так 173 |
день 114 |
любить 82 |
на 446 |
к 167 |
под/подо 113 |
вот 81 |
как 421 |
она 166 |
о 106 |
звезда 79 |
с/со 390 |
они 153 |
по 102 |
же 78 |
что 378 |
ночь 150 |
один 101 |
земля 78 |
он 242 |
над/надо 144 |
когда 97 |
жизнь 77 |
твой 242 |
сердце 142 |
где 95 |
от 77 |
мы 239 |
душа 140 |
небо 95 |
|
мой 226 |
а 139 |
свой 89 |
Как обычно, в начале частотного списка сосредоточен так называемый грамматический словарь (союзы, предлоги, частицы, местоимения, связки, артикли). Самое частотное слово у Фета — союз И. Самые частые знаменательные слова — ночь, сердце, душа, день, один, небо, сон, любить, звезда, земля, жизнь.
Напомним, что за каждым словом стоят все контексты с употреблен иями этого слова. Достаточно «кликнуть» любое из 5230 слов нашего словника, чтобы был выведен весь список соответствующих контекстов. Например, существительное аромат.
Аромат 14. Блажен, кто замечал, как постепенно зреют Златые гроздия, и знал, что, виноград Сбирая, он вопьет их сладкий аро- мат <44>; Для тебя ж у бедной розы Аромат, краса и слезы, Заревые сны <80>; Какая тень и аромат Плывут над меркнущею степью! <98>; С тюлей несется голос стада, В кустах малиновки звенят, И с побелевших яблонь сада Струится сладкий аромат < 125>; Злая старость хотя бы всю радость взяла, А руша моя так же пред самым закатом Прилетела б со стоном сюда, как пчела, Охмелеть, упиваясь таким ароматом <138>; Погляди, как спешу Я в помер- кнувший сад — И повсюду ношу Я цветка аромат <141>; Леса полны поныне аромата, Долины те ж и горные хребты; <170>; Смотри, как, голову откинувши назад, Глядит он на тебя и пьет твой аромат, Как дышат негою уста его и взоры! <173>; С улыбкой горькою я пью твой аромат, Которым некогда мое дышало детство <217>; Над землей клубится аромат <220>; Дышит земля всем своим ароматом, Небу разверстая, только вздыхает; <264>; А завтра на заре вновь крылья зажужжат, Чтобы к незримому, к безвестному стремиться: Где за ночь расцвело, где первый аромат, Туда перенестись и в пышной неге скрыться <269>; Точно в нежном дыханья травы и цветов С ароматом знакомым доносится зов, И как будто вот-вот кто-то милый опять О восторге свиданья готов прошептать <278>; Все далекий, давнишний мне чудится сад, — Там и звезды крупней, и сильней аромат, И ночных благовоний живая волна Там доходит до сердца, истомы полна <278>
Прилагательное бархатный.
Бархатный 5. Еще вчера, на солнце млея, Последним лес дрожал листом, И озимь, пышно зеленея, Лежала бархатным ковром <107>; Всем нравятся твой рост, и гордый облик твой, И кудри пышные, беспечностью завиты, И бледное чело, и нежные ланиты, Приподнятая грудь, жемчужный ряд зубов, И огненный зрачок, и бархатная бровь; <167>; Стихи мои в ряду других Прочтут ли бархатные глазки? <202>; Где волы, склонясь, прошли, Лентой бархатной чернеет Глыба взрезанной земли <218>; Как много пылких или томных, С наклоном бархатных ресниц. Веселых, грустных и нескромных Отвсюду улыбалось лиц! <23 8>
Глагол затрепетать.
Затрепетать 5. Я пришел к тебе с приветом, Рассказать, что солнце встало, Что оно горячим светом По листам затрепетало <211>; Как будто с трепетом здесь каждого листа Моя пробудится и затрепещет совесть, И станут лепетать знакомые места Давно забытую, оплаканную повесть <217>; я жду, нельзя ли превозмочь Твоей холодности, подметить миг участья, Чтобы в глазах твоих, загадочных как ночь Затрепетали звезды счастья <219>; Пред тенью милою коленопреклоненный, В слезах молитвенных я сердцем оживу И вновь затрепещу, тобою просветленный, — Но всё тебя не назову <251 >; Умолкла я, — я вся затрепетала Перед твоим лицом <254>
Вослед — эго и устаревшее наречие, и предлог. Исчерпывающий список контекстов мегатекста даёт возможность провести работу над омонимией. Ещё один пример целесообразности конкорданса для точной работы над толковыми словарями.
Вослед 8. Но сколько любви благодатной Светит в лазурных очах мальчику злому вослед <48>; И снова я люблю, и снова я любим, Несусь вослед мечтам любимым, А сердце грешное томит меня своим Неправосудьем нестерпимым <70>; Когда вослед весенних бурь Над зацветающей землей Нежней небесная лазурь И облаков воздушен рой, Как гой норой оградно мне Свергать земли томящий прах, Тонуть в небесной глубине И погасать в ее огнях! <92>; Я веслом прибавил ходу — И луна бежит вослед <121>; За девой смуглолицей Вослед толпа <170>; Богом света покинута, дочь Громовержца немая, Ночь Гелиосу вослед водит возлюбленных чад <174>; На утре дней все ярче и чудесней Мечты и сны в груди моей росли, И песен рой вослед за первой песней Мой тайный пыл на волю понесли <205>; Лечу на смерть вослед мечте <267>
В отличие от толковых словарей, автоматизированный конкорданс в случае обнаружения ошибок любого рода в мегатексте или словнике даёт возможность их оперативно исправить.
Наличие конкордансов нескольких мегатекстов обеспечивает возможность сравнительного или сопоставительного анализа. Так, в нашем распоряжении имеется мегатекст «Тютчев», что в своё время позволило нам предложить опыт контрастивного словаря двух русских поэтов [Бобунова, Хроленко 2005]. У Фета есть слово вереница средней частотности.
Вереница 6. Ведь снова не пойму я ни одной страницы — И яркий белый свет начнет в глазах мелькать, И ложных призраков заблещут вереницы <46>; Пускай вокруг меня, тяжелые громады, Из праха восстают и храмы и дворцы, И драгоценные пестреют колоннады, И воскресают мертвецы, И шум на площади, и женщин вереница, И вновь увенчанный святой алтарь горит, И из-под новых врат златая колесница К холму заветному спешит <50>; И гам, в глубине, молодая царица, Бегут пред гобой светоносные пятна, И этих несметных огней вереница Одной лишь тебе и видна и поня тна <182>; Не мчались ласточки, звеня, перед окном, И мошек не толклись блестящих вереницы, Сидели г олуби, нахохлившись, рядком, И в липник прятались умолкнувшие птицы <218>; Конь морской, Ты понесся быстрой птицей — Только пляшут вереницей Нереиды за тобой <226>; Видений пестрых вереница Влечет, усталый теша взгляд, И неразгаданные лица Из пепла серого глядят <228>
В стихах же Ф.И. Тютчева это существительное не зафиксировано вовсе.
Разумеется, конкорданс за исследователя не думает, но он моментально и с величайшей точностью обеспечивает его необходимым фактическим материалом, что способствует мысли филолога.