Системы понимания естественного языка, машинный перевод

Для понимания текста интеллектуальная система должна отвечать на все прямые вопросы, а также представлять ситуации реального мира по тексту. Она должна включать три уровня интерпретации: морфологический анализ и предсинтез, синтаксический анализ, семантический анализ.

Подсистемы языковых форм общения интеллектуальных систем должны понимать предложения ЕЯ, выводить ответ на основании имеющихся у систем фактов, выражать ответ на естественном языке, накапливать и корректировать свои знания.

Любая развитая система искусственного интеллекта должна иметь интеллектуальный интерфейс. Эта проблема тесно связана с проблемой автоматического перевода с одного языка на другой.

Машинный перевод —это перевод, строящийся на использовании машиной определенных и постоянных для данного вида материала соответствий между словами и грамматическими явлениями разных языков.

Выделяют два подхода к разработке систем машинного перевода: традиционный (основанный на правилах) и статистический (основанный на статистической обработке словарных баз).

Системы с непрямым переводом делятся на системы типа «transfer» и типа «interlingua». Алгоритмы перевода для систем типа «transfer» строятся как композиция трех процессов: анализ входного предложения в терминах структур входного языка, преобразование этой структуры в аналогичную структуру выходного языка и затем синтез выходного предложения по полученной структуре.

Системы типа «interlingua» предполагают наличие некоторого промежуточного языка, на котором можно описать все структуры как входного, так и выходного языков.

Искусственный интеллект и компьютерная лингвистика

Под термином «компьютерная лингвистика» обычно понимается широкая область использования компьютерных инструментов — программ, компьютерных технологий организации и обработки данных —для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах, а также сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах [2].

В узком смысле проблематика компьютерной лингвистики часто связывается с моделированием общения человека с ЭВМ на естественном языке (для этого создаются специальные системы обработки естественного языка), а также с теорией и практикой информационно-поисковых систем. К компетенции компьютерной лингвистики относится машинный перевод.

Язык можно рассматривать с двух точек зрения:

  • • средство организации, представления, передачи, усвоения и развития знаний — когнитивный феномен;
  • • универсальный механизм общения людей (либо непосредственно, либо через компьютер) — коммуникативный феномен.

Основными проблемными целями компьютерной лингвистики являются:

  • • понимание компьютером глубинного содержания больших массивов естественных текстов;
  • • повышение уровня естественности диалога между человеком и компьютером (режима меню и свободного общения на естественном языке (ЕЯ));
  • • создание больших банков данных и знаний на основе лексических единиц естественного языка;
  • • создание многоязычных информационных систем;
  • • общение с компьютером в режиме звучащей речи.

Представим тезаурус основных направлений развития работ в области компьютерной лингвистики, но не фундаментальных, а практических для различных прикладных систем.

  • 1) Системы обработки письменного текста на естественном языке.
  • 2) Системы диалога пользователя с компьютером на естественном языке.
  • 3) Системы машинного перевода с одного естественного языка на другой естественный язык.
  • 4) Системы наполнения баз знаний и баз данных на основе естественноязыковых источников.
  • 5) Системы вывода знаний на основе «логики» естественного языка.
  • 6) Системы автоматического построения текстов на естественном языке.
  • 7) Системы интеллектуальных машинных словарей.
  • 8) Системы общения в режиме звучания речи.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >