Проекты

Исследования по математической лингвистике

В рамках реализуемого проекта предполагается разработать методы, которые позволят проводить разносторонний анализ текстов и отдельных предложений на естественном языке. Планируется использовать такие методы, как: представление смысла текста в рамках подхода И.А. Мельчука и предложенные им лексические функции, теоретико-множественные модели Маркуса, а также адаптировать для целей изучения текстов на естественном языке некоторые методы и конструкции математической логики: конструкцию Генцена, применяемую в теореме о существовании модели и в теоремах об опускании типов, конечный форсинг и т.д.

Предложены разнообразные алгоритмы сопоставления предикатов и формул узкого исчисления предикатов текстам на естественном языке.

Разрабатывается исследовательская система для анализа текстов на естественном языке.

Система позволяет осуществлять следующие функции: загрузка текста, разбиение на предложения, редактирование и навигация по тексту; графематический и морфологический анализ текста (были усовершенствованы модули системы Диалинг); вывод определения (словарной статьи) анализируемого слова из словаря Ожегова и др. Для реализации используются следующие инструменты: Microsoft Visual Studio 2005 (8), C#, Windows Workflow Foundation, компоненты системы Диалинг, Infragistics Net Advantage 5.2.

Результаты работы могут быть применены в автоматизированных системах акцепции информации из текстов на естественном языке, интеллектуальных системах поиска информации в сети, при построении систем автоматического резюмирования, электронных переводчиков и словарей.