CHAID

From snake wiki
Jump to navigation Jump to search

CHAID: Хи-квадратно автоматично откриване на взаимодействие (CHAID) е алгоритъм за дърво на решенията, който използва хи-квадрат теста за разделяне на данните във всеки възел. Обикновено се използва за класификационни задачи.

Този метод е разновидност на класификационните дървета. При генерирането на дървото е избрана разновидността Exhaustive CHAID. CHAID, или Хи квадрат автоматично откриване на взаимодействие, е класификационен метод за изграждане на дървета на решения чрез използване на хи-квадрат статистика за идентифициране на оптимални разделяния.


Изисквания. Полетата за цел и въвеждане могат да бъдат непрекъснати или категорични; възлите могат да бъдат разделени на две или повече подгрупи на всяко ниво. Всички редни полета, използвани в модела, трябва да имат числово съхранение (не низ). Ако е необходимо, възелът за прекласифициране може да се използва за преобразуването им.


Силни страни. За разлика от възлите C&R Tree и QUEST, CHAID може да генерира недвоични дървета, което означава, че някои сплитове имат повече от два клона. Следователно има тенденция да създава по-широко дърво от двоичните методи за отглеждане. CHAID работи за всички видове входове и приема както тегла на случаите, така и честотни променливи.

References:

https://ncpha.government.bg/uploads/konkursi%20i%20proceduri/Avtoreferat_E.Manasiev.pdf