Предмет компьютерной лингвистики

Что такое компьютерная лингвистика?

Создание ЭВМ в середине 20-го века и быстрое развитие кибернетических идей стимулировали появление новых наук, которые ранее просто невозможно было представить. Как правило, они возникали на стыке наук, часто не связанных друг с другом. Так, на стыке биологии и инженерных наук возникла бионика. На стыке вычислительной техники и лингвистики родилась наука, которая несколько раз меняла название: сначала она называлась математической лингвистикой, потом структурной лингвистикой и вычислительной лингвистикой. Наконец за ней прочно укрепилось ее современное название — компьютерная лингвистика.

Две причины обусловили появление новой науки. Во-первых, исследователи-лингвисты надеялись, что современные точные науки (и прежде всего математика) помогут лингвистике обрести недостающую ей точность. Появление ЭВМ укрепило эти надежды, так как многим языковедам с самого начала было ясно, что компьютеры — это не только «быстро работающие арифмометры», но и мощное средство для автоматизации работы с текстами. Появилась возможность автоматизировать многие трудоемкие процессы, например статистическую обработку текстов, ведение разнообразных словарных и лексических картотек. Во-вторых, с появлением компьютеров почти сразу же возникла проблема общения с ними неподготовленных пользователей. Бесспорно, наилучшей формой для таких пользователей мог быть привычный естественный язык. Но для организации такого взаимодействия надо прежде понять законы и особенности использования естественного языка в процессе общения людей между собой. А, как вскоре выяснилось, традиционная лингвистика изучением этих законов практически не занималась.

Таким образом:

«компьютерная лингвистика» = «лингвистика в изложении для компьютера» (компьютер выступает в роли субъекта восприятия лингвистики)

или:

«компьютерная лингвистика» = «лингвистика, которую делают на компьютере».

Важнейшими понятийными категориями компьютерной лингвистики являются такие структуры знаний, как «фреймы» (понятийные, или, как принято говорить, концептуальные структуры для декларативного представления знаний о типизированной тематически единой ситуации), «сценарии» (концептуальные структуры для процедурного представления знаний о стереотипной ситуации или стереотипном поведении), «планы» (структуры знаний, фиксирующие представления о возможных действиях, ведущих к достижению определенной цели).

Эти структуры соответствуют двум основных типам знания.

«Знание что» — декларативные знания, представляются обычно в виде совокупности пропозиций, утверждений о чем-либо. Например, чашка — небольшой сосуд для питья округлой формы, обычно с ручкой, из фарфора, фаянса и т. п. Декларативные знания поддаются процедуре верификации в терминах «истина-ложь».

«Знание как» — процедурные знания, представляются как последовательность (список) операций, действий, которые следует выполнить. Характерный пример процедурных знаний — инструкции по пользованию бытовыми приборами. В отличие от декларативных знаний, процедурные знания невозможно верифицировать как истинные или ложные. Их можно оценивать только по успешности - неуспешности алгоритма.

Декларативное знание легче осознается человеком, чем процедурное. В то же время инженерная лингвистика представляет собой скорее знание «как», а не знание «что».

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >