Duomenų gavyba ir OLAP
Duomenų gavyba ir OLAP yra dvi įprastos verslo intelekto (BI) technologijos. Verslo žvalgyba nurodo kompiuterinius metodus, kaip identifikuoti ir išskirti naudingą informaciją iš verslo duomenų. Duomenų gavyba yra informatikos sritis, kurioje nagrinėjami įdomūs modeliai iš didelių duomenų rinkinių. Tai sujungia daugybę metodų, pradedant dirbtiniu intelektu, statistika ir duomenų bazių valdymu. OLAP (internetinis analitinis apdorojimas), kaip rodo pavadinimas, yra kelių dimensijų duomenų bazių užklausų pateikimo būdų rinkinys.
Duomenų gavyba taip pat žinoma kaip žinių atradimas duomenyse (KDD). Kaip minėta pirmiau, tai yra informatikos sritis, užsiimanti anksčiau nežinomos ir įdomios informacijos išskyrimu iš neapdorotų duomenų. Dėl eksponentinio duomenų augimo, ypač tokiose srityse kaip verslas, duomenų gavyba tapo labai svarbia priemone, norint paversti šį didžiulį duomenų kiekį verslo intelektu, nes per pastaruosius kelis dešimtmečius rankiniu būdu atkurti modelius tapo neįmanoma. Pavyzdžiui, šiuo metu jis naudojamas įvairioms programoms, tokioms kaip socialinių tinklų analizė, sukčiavimo nustatymas ir rinkodara. Duomenų gavyba paprastai apima šias keturias užduotis: grupavimą, klasifikavimą, regresiją ir susiejimą. Grupavimas yra panašių grupių nustatymas iš nestruktūrizuotų duomenų. Klasifikavimas yra mokymosi taisyklės, kurios gali būti taikomos naujiems duomenims ir paprastai apima šiuos veiksmus: išankstinis duomenų apdorojimas, modeliavimo projektavimas, mokymasis / funkcijų pasirinkimas ir įvertinimas / patvirtinimas. Regresija yra funkcijų su minimalia paklaida radimas modeliuojant duomenis. Asociacija ieško ryšių tarp kintamųjų. Duomenų gavyba paprastai naudojama atsakant į klausimus, pavyzdžiui, kokie yra pagrindiniai produktai, kurie kitais metais gali padėti gauti didelį pelną „Wal-Mart“. Duomenų gavyba paprastai naudojama atsakant į klausimus, pavyzdžiui, kokie yra pagrindiniai produktai, kurie kitais metais gali padėti gauti didelį pelną „Wal-Mart“. Duomenų gavyba paprastai naudojama atsakant į klausimus, pavyzdžiui, kokie yra pagrindiniai produktai, kurie kitais metais gali padėti gauti didelį pelną „Wal-Mart“.
OLAP yra sistemų klasė, teikianti atsakymus į daugialypius klausimus. Paprastai OLAP naudojamas rinkodarai, biudžeto sudarymui, prognozavimui ir panašioms programoms. Savaime suprantama, kad OLAP naudojamos duomenų bazės yra sukonfigūruotos sudėtingoms ir ad-hoc užklausoms, atsižvelgiant į greitą našumą. Paprastai OLAP išvesties rodymui naudojama matrica. Eilutes ir stulpelius formuoja užklausos matmenys. Jie dažnai naudoja agregavimo metodus keliose lentelėse, kad gautų suvestines. Pavyzdžiui, jį galima naudoti norint sužinoti apie šių metų „Wal-Mart“pardavimus, palyginti su praėjusiais metais? Kokia prognozė apie ateinančio ketvirčio pardavimus? Ką galima pasakyti apie tendenciją, žiūrint į procentinį pokytį?
Nors akivaizdu, kad duomenų gavyba ir OLAP yra panašūs, nes jie naudoja duomenis, kad gautų intelektą, pagrindinis skirtumas atsiranda dėl to, kaip jie valdo duomenis. OLAP įrankiai teikia daugialypę duomenų analizę ir pateikia duomenų santraukas, tačiau, priešingai, duomenų gavyba sutelkiama į duomenų rinkinio santykius, modelius ir įtaką. Tai yra OLAP sandoris dėl agregavimo, kuris susijęs su duomenų veikimu per „papildymą“, tačiau duomenų gavyba atitinka „padalijimą“. Kitas pastebimas skirtumas yra tas, kad nors duomenų gavybos įrankiai modeliuoja duomenis ir pateikia veikiančias taisykles, OLAP realiuoju laiku atliks palyginimo ir kontrasto metodus pagal verslo aspektą.