Начало на реферати

Формализацията на българския език и разработката на лингвистичен процесор (морфология


ФОРМАЛИЗАЦИЯТА НА БЪЛГАРСКИЯ ЕЗИК И РАЗРАБОТКАТА

НА ЛИНГВИСТИЧЕН ПРОЦЕСОР (МОРФОЛОГИЯ)

Г. Тотков, Хр. Крушков, М. Крушкова

Автоматичният морфологичен анализ (преход от български тексткъм неговите морфологични единици) е първата необходима крачка към осъществяването на диалог на естествен език с компютъра. Проблем, който е тривиален за английския и други езици се оказва доста сложен за езиците от флективен тип, какъвто е българския.

За руския език такива изследвания са описани в [1], [6] и [8] (вж и литературата, цитирана там). Поради различните варианти на словоизменение, реализираните системи не можеха да се адаптират за нашия език. Липсата на формализация на правилата на словоизменение в българския език беше съществена пречка за реализцията на автоматизирана система за морфологичен анализ. След публикуването на [5] се появи възможност за компютъризацията му ([4], [7]). Системата "АБВ" (БСНИПИ "Интерпрограма") вече се разпространява масово.

Разработването на собствени средства се налага от няколко причини:

- компактност на речника, в който ще бъдат заложени не само морфологичните характеристики на думите;

- възможност за оптимизация и усъвършенствуване;

- проучване на възможността за "приближен" морфологичен анализ с прилагане на средства от теорията за разпознаване на образи.

1.МОРФОЛОГИЧНА КЛАСИФИКАЦИЯ

В зависимост от признака изменяемост думите в българския език се делят на две категории - изменяеми и неизменяеми.

Изменяеми части на речта са съществителните, прилагателните, местоименията, числителните и глаголите. Те менят формата си посредством формообразуващи морфеми и по такъв начин изразяват различни граматически значения. Така всяка изменяема дума притежава различен брой словоформи.

Например:

кожух, кожуха, кожухът, кожуси, кожусите;

нов, нова, ново, нови, новите;

три, трите, трима, тримата;

мой, моя, мое, мои, моят, моята, моето, моите;

играя, играеш, играем, играл. . .

Формализацията на българския език и разработката на лингвистичен процесор (морфология facebook image

Увод във функционалното програмиране 9 out of 10 based on 2 ratings. 2 user reviews.