Автоматический анализ текста

Морфологический уровень

Представление морфологической информации

Будем считать, что словоформа характеризуется пятеркой — строкой словоформы; частью речи; нормальной формой (леммой), от которой была образована данная словоформа; частью речи нормальной формы; набором морфологических параметров, приписываемых к данной словоформе. Часть речи нормальной формы необходима, так как, например, деепричастие удобно считать формой глагола, а не выводить в отдельное слово.

Полный набор словоформ, образованных от одной леммы, называется парадигмой.

Морфологический параметр — это пара <имя параметра, значение параметра^ Именем параметра может служить род, число, время, склонение, краткость формы прилагательного и другие признаки слов, принятые в данном языке. Значение параметра — это конкретное значение, которое может принимать данный признак. Так, например, падеж может быть именительным, родительным, ...; род может быть мужским, женским, средним; число — единственным, множественным и т. д. Параметры равны между собой, если равны их имена и значения.

В ряде случаев значение параметра определить невозможно или в этом нет необходимости. Например, в русском языке существительным во множественном числе не приписывают род. Также существуют слова, которые имеют только форму множественного числа. Если словам, обладающим единственным числом значение рода может быть приписано из единственного числа, то слова, не обладающие единственным числом (очки, часы), такой информации лишены полностью. В этом случае можно считать, что значение параметра нулевое

Среди параметров слова выделяют словообразовательные и формообразовательные. Словообразовательные параметры не изменяются при изменении слова по формам. Так, например, слово «мама» остается женского рода в любой своей форме. Формообразовательные параметры изменяются при изменении слова по формам. Для существительных падеж будет формообразовательным параметром. Словообразовательные параметры для одних частей речи могут являться формообразовательными для других. Например, параметр рода не меняется у существительных, однако будет образовывать формы у прилагательных и глаголов.

В русском языке количество словоформ для одной леммы может быть очень большим. Так если наречия и предлоги имеют только одну форму, то существительные— 12, прилагательные— 24 (без учета краткости и степеней сравнения), а у глаголов число словоформ может превышать 300

(если считать деепричастия и причастия формами глагола).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >