Клъстеризация
| Информационни технологии | 2009-12-04 | 121 сваляния |
15. Клъстеризация
Постановка на задачата : имаме множество от образи {а1, , аn}. Всеки образ се характеризира от n признака {x1,, xn}. Необходимо е входното множество от образи да се раздели в m клъстъра(групи) така, че всеки образ от даден клъстър да е по-близо до образите в този клъстър отколкото до всеки образ от останалите клъстъри. За реализацията на клъстеризацията се използва алгоритъма за ефективна клъстеризация, който се реализира като показател за качеството на клъстеризация. Този показател се изчислява по следната формула :
J = j=1..mGKj|| a - Zj|| 2
m брой на клъстърите, които сме задали
Kj клъстър съдържащ подмножество от образи
Zj вектор от средните стойности на елементите в клъстъра Kj.
r брой на образите в клъстъра
J - показва сумата от разликите на образите до центровете на техните клъстъри.
При минимизация на тази сума се постига ефективна клъстеризация.
Алгоритъм за клъстеризация :
-
Определят се m центъра na клъстерите : Z1Zm . Обикновенно се вземат първите m образа.
-
i = 1 - параметър на цикъла (итерации)
-
Определят се най-близките образи до центровете, т.е. формират се m клъстъра К1i,,Kmi - това са клъстърите формирани на i-тата итерация.
-
За клъстърите получени в точка 3 се определят нови коиригирани центрове. Изхожда се от условието, че сумата от квадратите на разстоянията между новия център на зададеният клъстър и образите в него ще бъде минимална. Ji = aKji || a Zji+1|| , j = 1,,m
-
Ако се получат едни и съши центрове за клъстърите в две последователни итерации се преминава към 6) иначе се връщаме към 3
-
Край
Задачата за клъстеризация се използва в медицината и други области за взимане на решения.
Алгоритъма за клъстеризация по същество представлява обучение без учител.
Тагове от реферата: ъстеризия, неободимо, однот, еризира, постновка, имаме, множество











