Кластер анализа: њен метод и обим

14. 5. 2019.

Многи од нас су чули израз "кластер анализа", али оно што то значи није све. Штавише, звучи више него мистериозно! У ствари, ово је само назив методе поделе узорка података у категорије елемената према одређеним критеријумима. На пример, кластер анализа омогућава људима да буду подељени у групе са високим, средњим и ниским самопоштовањем. Једноставно речено, кластер је тип објеката који су слични у одређеном атрибуту.

Кластер анализа: проблеми у употреби

кластер анализа Након што сте одлучили да примените овај метод у свом истраживању, морате имати на уму да су кластери који су изабрани у његовом току можда нестабилни. Стога, као иу случају факторске анализе, потребно је провјерити резултате на другој групи објеката или, након одређеног временског периода, израчунати грешку мјерења. Штавише, најбоље је користити кластер анализу на великим узорцима, одабраним рандомизацијом или стратификацијом, јер само на тај начин можемо направити знанствени закључак користећи индукцију. Најбоље од свега, показао се да тестира хипотезе, а не да их креира од нуле.

Хијерархијска кластер анализа

хијерархијска кластер анализа Ако треба да класификујете случајне елементе брзо, онда можете почети са разматрањем сваке од њих у почетној фази као посебан кластер. То је суштина једног од најлакших за разумевање типова кластер анализе. Користећи га, истраживач у другој фази формира парове елемената који су по својим карактеристикама слични, а затим их међусобно повезују потребним бројем пута. Кластери који су на минималној удаљености између себе одређују се користећи интегративни поступак. Понавља се док не задовољи један од следећих критеријума:

  • добијање унапријед планираног броја кластера;
  • сваки кластер садржи потребан број елемената;
  • свака група има потребан омјер хетерогености и хомогености унутар ње.

Да би правилно израчунали растојање између кластера, они често користе следеће технике:

  • јединствена и потпуна комуникација;
  • интерконекција средњег краља;
  • центроид метода;
  • просечна група за пријем.

Следећи критеријуми се користе за процену резултата кластеризације:

  • индекс дефиниције;
  • партициони фактор;
  • нормална, нормализована и модификована ентропија;
  • други и трећи Рубенс функционалан.

Методе кластер анализе

методе кластер анализе Најчешће се при анализи узорка објеката користи метода минималне удаљености. Оно се састоји у чињеници да кластер комбинује елементе са коефицијентом сличности, који је већи од прага. Када се користи метода локалног растојања, разликују се два кластера: растојање између тачака првог је максимално, а друго је минимум. Метода центроидног кластерирања укључује израчунавање удаљености између просјечних вриједности индикатора у групама. А Вард метода је најрационалнија за груписање кластера блиских у параметру који се проучава.