Pagrindinis skirtumas - prižiūrimas ir neprižiūrimas mašininis mokymasis
Vadovaujamas ir neprižiūrimas mokymasis yra dvi pagrindinės mašininio mokymosi sąvokos. Prižiūrimas mokymasis yra mašininio mokymosi užduotis, išmokstanti funkciją, kuria įvestis susiejama su išvestimi, remiantis įvesties ir išvesties porų pavyzdžiais. Neprižiūrimas mokymasis yra mašininio mokymosi užduotis, leidžianti nusakyti paslėptą struktūrą apibūdinančią funkciją iš nepažymėtų duomenų. Pagrindinis skirtumas tarp prižiūrimo ir neprižiūrimo mašininio mokymosi yra tas, kad prižiūrimas mokymas naudoja pažymėtus duomenis, o neprižiūrimas - nepažymėtus duomenis.
Mašininis mokymasis yra informatikos sritis, suteikianti galimybę kompiuterinei sistemai mokytis iš duomenų, be aiškaus programavimo. Tai leidžia analizuoti duomenis ir numatyti jų dėsningumus. Yra daugybė mašininio mokymosi programų. Kai kurie iš jų yra veido atpažinimas, gestų atpažinimas ir kalbos atpažinimas. Yra įvairių algoritmų, susijusių su mašininiu mokymusi. Kai kurie iš jų yra regresija, klasifikacija ir grupavimas. Dažniausiai programavimo kalbos, skirtos kurti mašininio mokymosi programas, yra R ir Python. Taip pat galima naudoti kitas kalbas, tokias kaip „Java“, „C ++“ir „Matlab“.
TURINYS
1. Apžvalga ir pagrindiniai skirtumai
2. Kas yra prižiūrimas mokymas
3. Kas yra neprižiūrimas mokymasis
4. Panašumai tarp prižiūrimo ir neprižiūrimo mašininio mokymosi
5. Gretimas palyginimas - prižiūrimas ir neprižiūrimas mašininis mokymasis lentelių pavidalu
6. Santrauka
Kas yra prižiūrimas mokymasis?
Mašininio mokymosi sistemose modelis veikia pagal algoritmą. Vadovaujantis mokymu, prižiūrimas modelis. Pirma, reikia mokyti modelį. Turėdamas įgytas žinias, jis gali nuspėti atsakymus būsimiems atvejams. Modelis mokomas naudojant paženklintą duomenų rinkinį. Kai sistemai pateikiama duomenų iš atrankos, ji gali nuspėti rezultatą. Toliau pateikiama nedidelė ištrauka iš populiaraus IRIS duomenų rinkinio.
Pagal aukščiau pateiktą lentelę atributais vadinami taurelės ilgis, taurelės plotis, mentės ilgis, mentės plotis ir rūšys. Stulpeliai yra žinomi kaip funkcijos. Vienoje eilutėje yra visų atributų duomenys. Todėl viena eilutė vadinama stebėjimu. Duomenys gali būti skaitiniai arba kategoriški. Modeliui pateikiami stebėjimai su įvestimi atitinkamu rūšies pavadinimu. Pateikus naują stebėjimą, modelis turėtų numatyti rūšies rūšį, kuriai jis priklauso.
Vadovaujant mokymuisi yra klasifikavimo ir regresijos algoritmai. Klasifikavimas yra paženklintų duomenų klasifikavimo procesas. Modelis sukūrė ribas, kurios atskyrė duomenų kategorijas. Kai modeliui pateikiami nauji duomenys, jis gali būti suskirstytas į kategorijas pagal tai, kur yra taškas. K-artimiausi kaimynai (KNN) yra klasifikavimo modelis. Atsižvelgiant į k reikšmę, nustatoma kategorija. Pavyzdžiui, kai k yra 5, jei tam tikras duomenų taškas yra arti aštuonių A kategorijos duomenų taškų ir šešių B kategorijos duomenų taškų, tada duomenų taškas bus klasifikuojamas kaip A.
Regresija yra ankstesnių duomenų tendencijos prognozavimo procesas, siekiant numatyti naujų duomenų rezultatus. Regresijos metu išvestis gali būti sudaryta iš vieno ar daugiau tęstinių kintamųjų. Spėjimas atliekamas naudojant liniją, kuri apima daugumą duomenų taškų. Paprasčiausias regresijos modelis yra tiesinė regresija. Tai greita ir nereikia derinti parametrų, tokių kaip KNN. Jei duomenys rodo parabolinę tendenciją, linijinės regresijos modelis netinka.
Tai yra keli prižiūrimų mokymosi algoritmų pavyzdžiai. Paprastai prižiūrimų mokymosi metodų rezultatai yra tikslesni ir patikimesni, nes įvesties duomenys yra gerai žinomi ir paženklinti. Todėl mašina turi analizuoti tik paslėptus modelius.
Kas yra neprižiūrimas mokymasis?
Neprižiūrint mokymosi, modelis nėra prižiūrimas. Modelis veikia savarankiškai, kad numatytų rezultatus. Jis naudoja mašininio mokymosi algoritmus, kad padarytų išvadas apie nepažymėtus duomenis. Paprastai neprižiūrimi mokymosi algoritmai yra sunkesni už prižiūrimų mokymosi algoritmus, nes informacijos yra nedaug. Grupavimas yra neprižiūrimo tipo mokymasis. Jis gali būti naudojamas nežinomų duomenų grupavimui naudojant algoritmus. K-vidurkis ir tankiu pagrįstas klasterizavimas yra du klasterizavimo algoritmai.
k-vidurkio algoritmas, atsitiktinai kiekvienam klasteriui pateikia k centroidą. Tada kiekvienas duomenų taškas priskiriamas artimiausiam centroidui. Euklido atstumas naudojamas atstumui nuo duomenų taško iki centroido apskaičiuoti. Duomenų taškai skirstomi į grupes. Vėl apskaičiuojamos k centroidų pozicijos. Nauja centroido padėtis nustatoma pagal visų grupės taškų vidurkį. Vėlgi kiekvienas duomenų taškas priskiriamas artimiausiam centroidui. Šis procesas kartojasi tol, kol centroidai nebesikeičia. k-vidurkis yra greito grupavimo algoritmas, tačiau nėra konkretaus klasterizacijos taškų inicializavimo. Be to, yra labai daug klasterių modelių, pagrįstų klasterių taškų inicijavimu, variacijos.
Kitas klasterizavimo algoritmas yra tankiu grįstas klasterizavimas. Jis taip pat žinomas kaip „Density Based Spatial Clustering Applications“su triukšmu. Tai veikia apibrėžiant grupę kaip maksimalų tankiu sujungtų taškų rinkinį. Jie yra du parametrai, naudojami tankio grupavimui. Jie yra Ɛ (epsilonas) ir minimalūs taškai. Ɛ yra didžiausias apylinkės spindulys. Mažiausias taškų skaičius yra mažiausias taškų skaičius kaimynystėje Ɛ, norint apibrėžti klasterį. Tai yra keletas grupių, kurios patenka į neprižiūrimą mokymąsi, pavyzdžių.
Paprastai neprižiūrimų mokymosi algoritmų gaunami rezultatai nėra daug tikslūs ir patikimi, nes mašina turi apibrėžti ir pažymėti įvesties duomenis prieš nustatydama paslėptus modelius ir funkcijas.
Koks yra prižiūrimo ir neprižiūrimo mašininio mokymosi panašumas?
Ir prižiūrimas, ir neprižiūrimas mokymasis yra mašininio mokymosi rūšys
Kuo skiriasi prižiūrimas ir neprižiūrimas mašininis mokymasis?
Skirtingas straipsnis viduryje prieš lentelę
Prižiūrimas ir neprižiūrimas mašininis mokymasis |
|
Prižiūrimas mokymasis yra mašininio mokymosi užduotis, išmokstanti funkciją, kuria įvestis susiejama su išvestimi, remiantis įvesties ir išvesties poromis. | Neprižiūrimas mokymasis yra mašininio mokymosi užduotis, leidžianti nusakyti paslėptą struktūrą apibūdinančią funkciją iš nepažymėtų duomenų. |
Pagrindinis funkcionalumas | |
Vykdant prižiūrimą mokymą, rezultatas numatomas pagal paženklintus įvesties duomenis. | Neprižiūrimo mokymosi metu modelis, nenustatydamas duomenų, prognozuoja rezultatus, pats nustatydamas modelius. |
Rezultatų tikslumas | |
Prižiūrimų mokymosi metodų rezultatai yra tikslesni ir patikimesni. | Neprižiūrimų mokymosi metodų rezultatai nėra daug tikslūs ir patikimi. |
Pagrindiniai algoritmai | |
Yra regresijos ir klasifikavimo vadovaujamame mokyme algoritmai. | Yra algoritmai, skirti klasterizuoti neprižiūrimą mokymąsi. |
Santrauka - prižiūrimas ir neprižiūrimas mašininis mokymasis
Prižiūrimas mokymasis ir neprižiūrimas mokymas yra dvi mašininio mokymosi rūšys. Prižiūrimas mokymasis yra mašininio mokymosi užduotis, išmokstanti funkciją, kuria įvestis susiejama su išvestimi, remiantis įvesties ir išvesties poromis. Neprižiūrimas mokymasis yra mašininio mokymosi užduotis, leidžianti nusakyti paslėptą struktūrą apibūdinančią funkciją iš nepažymėtų duomenų. Skirtumas tarp prižiūrimo ir neprižiūrimo mašininio mokymosi yra tas, kad prižiūrimas mokymas naudoja pažymėtus duomenis, o neprižiūrimas - nepaženklintus duomenis.