KNN: K най-близки съседи

From snake wiki
Jump to navigation Jump to search

KNN: K-най-близките съседи (KNN) е непараметричен алгоритъм, използван за задачи за класификация и регресия. Това е алгоритъм за мързеливо обучение, който съхранява всички екземпляри на данните за обучение и класифицира новите екземпляри въз основа на тяхното сходство с данните за обучение.

Анализът на най-близкия съсед е метод за класифициране на случаи въз основа на тяхната прилика с други случаи. В машинното обучение той е разработен като начин за разпознаване на модели на данни, без да се изисква точно съвпадение със съхранени модели или случаи. Подобните случаи са близо един до друг, а различните случаи са отдалечени един от друг. По този начин разстоянието между два случая е мярка за тяхната разлика. Случаите, които са близо един до друг, се наричат „съседи“.

Когато се представи нов случай (задържане), се изчислява разстоянието му от всеки от случаите в модела. Класификациите на най-сходните случаи – най-близките съседи – се събират и новият случай се поставя в категорията, която съдържа най-голям брой най-близки съседи. Може да се посочи броят на най-близките съседи за изследване; тази стойност се нарича k. Анализът на най-близкия съсед може също да се използва за изчисляване на стойности за непрекъсната цел. В тази ситуация средната или средната целева стойност на най близките съседи се използва за получаване на прогнозираната стойност за новия случай.

References:

https://ncpha.government.bg/uploads/konkursi%20i%20proceduri/Avtoreferat_E.Manasiev.pdf