Автоматическая обработка текста

Дыбо А.В., Шеймович А.В.
Аппарат автоматического морфологического анализа для корпуса хакасского языка

В статье освещается работа по созданию корпуса текстов хакасского языка и снабжению его научным аппаратом, а именно — инструментами морфологического анализа. Основное внимание уделяется созданию компьютерно ориентированной модели хакасской словоформы. Работа ведется в рамках масштабного проекта по созданию корпусных ресурсов языков народов России, в частности корпусов на малых тюркских языках РФ. Алгоритм автоматического морфологического аннотирования базируется на словаре, учитывающем фонетическое чередование внутри основы, и на компьютерной модели словоформы. В настоящей работе представлена попытка создания такой модели и определения набора фонетических правил, которые ограничивают выбор компонентов словоформы.

Ключевые слова: корпус языка, морфологическая разметка, морфологический анализатор, словоизменение, компьютерно ориентированная модель словоформы, система StarLing

pdf-iconЧитать статью целиком...

Бахтоваршоев А.Ш.
Транслитерация памирских языков

В статье рассмотрен вопрос о преобразовании (транслитерации) алфавитов некоторых памирских языков (шугнанского и рушанского) с кириллицы на латиницу и наоборот. Предложена и проанализирована конкретная таблица преобразования алфавитов по системам А и Б. Показано, что предложенная таблица сохраняет естественную частоту появления символов на данных языках и может быть использована в практической работе.

Ключевые слова: информационные технологии, транслитерация, памирские языки, шугнанский язык, рушанский язык

pdf-iconЧитать статью целиком...