Многи од нас су чули израз "кластер анализа", али оно што то значи није све. Штавише, звучи више него мистериозно! У ствари, ово је само назив методе поделе узорка података у категорије елемената према одређеним критеријумима. На пример, кластер анализа омогућава људима да буду подељени у групе са високим, средњим и ниским самопоштовањем. Једноставно речено, кластер је тип објеката који су слични у одређеном атрибуту.
Кластер анализа: проблеми у употреби
Након што сте одлучили да примените овај метод у свом истраживању, морате имати на уму да су кластери који су изабрани у његовом току можда нестабилни. Стога, као иу случају факторске анализе, потребно је провјерити резултате на другој групи објеката или, након одређеног временског периода, израчунати грешку мјерења. Штавише, најбоље је користити кластер анализу на великим узорцима, одабраним рандомизацијом или стратификацијом, јер само на тај начин можемо направити знанствени закључак користећи индукцију. Најбоље од свега, показао се да тестира хипотезе, а не да их креира од нуле.
Хијерархијска кластер анализа
Ако треба да класификујете случајне елементе брзо, онда можете почети са разматрањем сваке од њих у почетној фази као посебан кластер. То је суштина једног од најлакших за разумевање типова кластер анализе. Користећи га, истраживач у другој фази формира парове елемената који су по својим карактеристикама слични, а затим их међусобно повезују потребним бројем пута. Кластери који су на минималној удаљености између себе одређују се користећи интегративни поступак. Понавља се док не задовољи један од следећих критеријума:
Да би правилно израчунали растојање између кластера, они често користе следеће технике:
Следећи критеријуми се користе за процену резултата кластеризације:
Методе кластер анализе
Најчешће се при анализи узорка објеката користи метода минималне удаљености. Оно се састоји у чињеници да кластер комбинује елементе са коефицијентом сличности, који је већи од прага. Када се користи метода локалног растојања, разликују се два кластера: растојање између тачака првог је максимално, а друго је минимум. Метода центроидног кластерирања укључује израчунавање удаљености између просјечних вриједности индикатора у групама. А Вард метода је најрационалнија за груписање кластера блиских у параметру који се проучава.