В рамках реализуемого
проекта предполагается разработать методы, которые позволят проводить
разносторонний анализ текстов и отдельных предложений на естественном языке. Планируется
использовать такие методы, как: представление смысла текста в рамках подхода
И.А. Мельчука и предложенные им лексические функции, теоретико-множественные
модели Маркуса, а также адаптировать для целей изучения текстов на естественном
языке некоторые методы и конструкции математической логики: конструкцию
Генцена, применяемую в теореме о существовании модели и в теоремах об опускании
типов, конечный форсинг и т.д.
Предложены разнообразные
алгоритмы сопоставления предикатов и формул узкого исчисления предикатов
текстам на естественном языке.
Разрабатывается
исследовательская система для анализа текстов на естественном языке.
Система
позволяет осуществлять следующие функции: загрузка текста, разбиение на
предложения, редактирование и навигация по тексту; графематический и
морфологический анализ текста (были усовершенствованы модули системы Диалинг);
вывод определения (словарной статьи) анализируемого слова из словаря Ожегова и
др. Для реализации используются следующие инструменты: Microsoft Visual Studio 2005 (8), C#, Windows Workflow Foundation, компоненты системы Диалинг, Infragistics Net Advantage 5.2.
Результаты
работы могут быть применены в автоматизированных системах акцепции информации
из текстов на естественном языке, интеллектуальных системах поиска информации в
сети, при построении систем автоматического резюмирования, электронных
переводчиков и словарей.