Skirstymas į Grupes Ir Klasifikaciją

Turinys:

Skirstymas į Grupes Ir Klasifikaciją
Skirstymas į Grupes Ir Klasifikaciją

Video: Skirstymas į Grupes Ir Klasifikaciją

Video: Skirstymas į Grupes Ir Klasifikaciją
Video: XXI Vydūno konferencijos sporto, rekreacijos ir turizmo, socialinio darbo sekcijos 2024, Balandis
Anonim

Pagrindinis skirtumas tarp grupavimo ir klasifikavimo yra tas, kad grupavimas yra neprižiūrima mokymosi technika, grupuojanti panašius egzempliorius pagal ypatybes, o klasifikacija yra prižiūrima mokymosi technika, priskirianti iš anksto nustatytas žymes egzemplioriams pagal ypatybes.

Nors grupavimas ir klasifikavimas yra panašūs procesai, tačiau tarp jų yra jų skirtumas pagal jų reikšmę. Duomenų gavybos pasaulyje klasteriai ir klasifikavimas yra dviejų tipų mokymosi metodai. Abu šie metodai apibūdina objektus į grupes pagal vieną ar daugiau funkcijų.

TURINYS

1. Apžvalga ir pagrindiniai skirtumai

2. Kas yra grupavimas

3. Kas yra klasifikacija

4. Palyginimas greta - grupavimas ir klasifikavimas lentelėmis

5. Santrauka

Kas yra grupavimas?

Grupavimas yra objektų grupavimo būdas taip, kad objektai, turintys panašių savybių, susijungtų, o objektai, turintys nepanašių savybių, išsiskirtų. Tai yra įprasta mašininio mokymosi ir duomenų gavybos statistinės duomenų analizės technika. Tiriamoji duomenų analizė ir apibendrinimas taip pat yra sritis, kurioje naudojamas grupavimas.

Skirstymas į grupes ir klasifikaciją
Skirstymas į grupes ir klasifikaciją

01 pav. Grupavimas

Grupavimas priklauso neprižiūrimam duomenų gavybai. Tai nėra vienas konkretus algoritmas, tačiau tai yra bendras užduoties sprendimo būdas. Todėl klasterizaciją įmanoma pasiekti naudojant įvairius algoritmus. Tinkamas grupių algoritmas ir parametrų nustatymai priklauso nuo atskirų duomenų rinkinių. Tai nėra automatinė užduotis, tačiau tai yra kartotinis atradimo procesas. Todėl būtina modifikuoti duomenų apdorojimą ir parametrų modeliavimą, kol rezultatas pasieks norimas savybes. K reiškia klasterizavimas ir hierarchinis klasterizavimas yra du įprasti klasterizavimo algoritmai duomenų gavyboje.

Kas yra klasifikacija?

Klasifikavimas yra klasifikavimo procesas, kurio metu naudojamas duomenų rinkinys objektams atpažinti, atskirti ir suprasti. Klasifikacija yra prižiūrima mokymosi technika, kai yra mokymų rinkinys ir teisingai apibrėžti stebėjimai.

Pagrindinis skirtumas - grupavimas ir klasifikavimas
Pagrindinis skirtumas - grupavimas ir klasifikavimas

02 pav. Klasifikacija

Klasifikaciją įgyvendinantis algoritmas yra klasifikatorius, o stebėjimai yra pavyzdžiai. K-artimiausio kaimyno algoritmas ir sprendimų medžio algoritmai yra žinomiausi klasifikavimo algoritmai duomenų gavyboje.

Koks skirtumas tarp grupavimo ir klasifikavimo?

Grupavimas yra neprižiūrimas mokymasis, o klasifikavimas yra prižiūrima mokymosi technika. Jis grupuoja panašius egzempliorius pagal ypatybes, o klasifikavimas priskiria iš anksto nustatytas žymas egzemplioriams pagal ypatybes. Grupavimas padalijo duomenų rinkinį į pogrupius, kad būtų sugrupuotos panašių savybių egzemplioriai. Jis nenaudoja paženklintų duomenų ar mokymo rinkinio. Kita vertus, suskirstykite naujus duomenis pagal mokymo rinkinio pastebėjimus. Treniruočių rinkinys yra paženklintas.

Grupavimo tikslas yra grupuoti objektų rinkinį, kad būtų galima sužinoti, ar tarp jų nėra jokių ryšių, o klasifikavimo tikslas yra nustatyti, kuriai klasei naujas objektas priklauso iš anksto nustatytų klasių.

Skirstymas į grupes ir klasifikaciją 3
Skirstymas į grupes ir klasifikaciją 3

Santrauka - grupavimas ir klasifikavimas

Grupavimas ir klasifikavimas gali atrodyti panašūs, nes abu duomenų gavybos algoritmai duomenų rinkinį dalija į pogrupius, tačiau jie yra du skirtingi mokymosi metodai, taikant duomenų gavybą, kad gautų patikimą informaciją iš neapdorotų duomenų rinkinio. Skirtumas tarp grupavimo ir klasifikavimo yra tas, kad grupavimas yra neprižiūrima mokymosi technika, grupuojanti panašius egzempliorius pagal ypatybes, o klasifikacija yra prižiūrima mokymosi technika, priskirianti iš anksto nustatytas žymas egzemplioriams pagal ypatybes.

Vaizdo mandagumas:

1. „Cluster-2“, sukurtas „Cluster-2.gif“: „Hellisp“išvestinis darbas: (Viešasis domenas) per Wikimedia Commons. 2. „Magnetizmas“, autorius John Aplessed - Nuosavas darbas. (Viešasis domenas) per „Wikimedia Commons“

Rekomenduojama: