Andego Tanácsadó Kft.
  • Bemutatkozunk
  • Tanácsadás
    • Adatbányászat
    • Hálózatelemzés
    • Weblog elemzés
    • CRM
  • Megoldások
    • Csalásdetektálás
    • Céginformációs szolgáltatás
    • Cégcsoport detektálás
    • Kockázati Modul
  • Oktatás
    • Szemináriumos naptár
    • Microsoft Akadémia
      • Excel
      • Power Pivot
      • Machine Learning
    • Open Source adatbányászat
      • R
      • Rapid Miner
    • Adatbányászat
    • Hálózatkutatás
  • Kapcsolat
  • Andego Blog
Andego Tanácsadó Kft.
  • Bemutatkozunk
  • Tanácsadás
    • Adatbányászat
    • Hálózatelemzés
    • Weblog elemzés
    • CRM
  • Megoldások
    • Csalásdetektálás
    • Céginformációs szolgáltatás
    • Cégcsoport detektálás
    • Kockázati Modul
  • Oktatás
    • Szemináriumos naptár
    • Microsoft Akadémia
      • Excel
      • Power Pivot
      • Machine Learning
    • Open Source adatbányászat
      • R
      • Rapid Miner
    • Adatbányászat
    • Hálózatkutatás
  • Kapcsolat
  • Andego Blog
  • Home
  • Blog
  • Oracle Data Mining – Advanced Analytics

Oracle Data Mining – Advanced Analytics

2013. április 6. szombat Bejegyezte Kovács Gyula

Bevezető

Egy új sorozatot indítunk blogunkon. Hazai adatbányász szoftver szállítókat mutatunk be egy interjú sorozaton keresztül. Az első interjút Fekete Zoltánnal készítettük, aki az Oracle Üzleti Intelligencia és Adattárház csapatát erősíti már jó ideje. (itt szeretnénk jelezni, hogy az interjúk mindig az interjúalany személyes gondolatait tartalmazzák, amik nem minden esetben egyeznek cégük hivatalos álláspontjával!)

Interjú

Kedves Zoli, bemutatkoznál röviden olvasóinknak?

1998 óta dolgozom az Oracle Magyarországnál. A tevékenységem úgynevezett presales tanácsadás, ahol az értékesítésünket támogatom szakmai tanácsadással. A kezdetekben Oracle Express tartozott hozzám, ezen belül is a Financial Analyzer-rel foglalkoztam sokat. Első kapcsolatom adatbányászati szoftverrel a 2000-es évek környékén volt, amikor az Oracle felvásárolta a Thinking Machines Darwin nevű szoftverét. Ez volt egyben az első lépés, hogy az Oracle elkezdett adatbányászati megoldásokat integrálni meglévő rendszereibe. 2007-ben az Oracle felvásárolta a Siebel CRM gyártót, ami után az Oracle a Siebel BI megoldásra alapozta a BI megoldásait. Ezen kívül 2 évig az Oracle Exadata Database Machine rendszerekkel is foglalkoztam. Az elmúlt években az Oracle relációs adatbázis-kezelő presales munkájában veszek részt.

Az emberek többségének az Oracle szó hallatán relációs adatbázis kezelők  ugranak be. Helyes ez a kép, vagy az Oracle ennél lényegesen több?

Lényegesen több, ezzel nem árulok el nagy titkokat. Mivel ez egy adatbányászattal kapcsolatos blog, így nem mennék nagyon bele a részletekbe, de talán az elmondható, hogy az Oracle gyakorlatilag minden informatikai beruházással kapcsolatos igényt ki tud szolgálni. Ez köszönhető magának az Oracle üzleti filozófiájának. Igen széles a szoftver-harver készlet, a vállalat aktívan vásárol fel cégeket, melyek termékeit integrálja a portfóliójába. Néhány felvásárlás BI, adattárház és Big Data területen az elmúlt évekből: Timesten (2005), Siebel (2006), Sunopsys (2006), Hyperion (2007), HyperRoll (2009),  GoldenGate (2009),  Datanomic (2011), Sigma Dynamics (2006), Endeca (2011) és még sok más. De nemcsak BI megoldásai vannak az Oracle-nek, a Sun felvásárlás nyitotta meg a hardver üzletágat (Storage, Server), operációs rendszereket, relációs adatbázis kezelőket vagy különböző üzleti applikációkat, például Fusion Applications, EBS, Siebel, JD Edwards, stb., továbbá vertikális alkalmazásokat, retail, telco, közmű, stb.  Az alábbi ábra elég tömören összefoglalja az Oracle széles portfólióját:

o_arch

"Cipős dobozok" - ahogy Fekete Zoltán kislánya nevezi a portfólió egyes elemeit

Ez elég lenyűgöző, de most mégis maradjunk az adatbányászatnál. Ebben az óriási portfólióban hol kell keresni Oracle adatbányászati megoldásait?

Az Oracle esetében az adatbányászati kifejezés in-database miningot jelent. Az adatbázis-kezelő részeként futó adatbányászati motort megszólíthatjuk grafikus modellező eszközzel, amivel az elemzők dolgoznak (Data Miner), SQL-ből és PL/SQL-ből, másrészt az Oracle számos alkalmazásba is beépítette az adatbányászatot.

Beszéljünk először az Oracle adatbányászati szoftveréről, az Oracle Advanced Analytics-ről.

Az Oracle adatbányászati motorja magába az adatbázis-kezelőbe, az Oracle Data Miner felület (GUI) pedig az ingyenes SQL Developer-be van integrálva. Az Advanced Analytics árazása elég kedvező. Az Exadata Database Machine-ben pedig az integrált storage rétegben futnak az adatbányászati algoritmusok, ez még nagyobb sebességet jelent. Az Advanced Analytics opcionálisan rendelhető meg a relációs adatbázis kezelőhöz. A közhiedelemmel ellentétben az adatbányászati motorhoz jár egy grafikus felhasználói felület (hasonlóan a többi  nagy adatbányászati eszközhöz), azaz nemcsak programozók, hanem üzleti elemzők is kényelmesen tudnak elemezni az Analytics-el.

vizualis_felulet

A grafikus felület a már jól ismert folyamat vezérelt programozást követi. Az ikonokon keresztül az adatfeldolgozástól kezdve a modellezésig gyakorlatilag minden olyan lépés megvalósítható, ami szükséges egy adatbányászati elemzés végrehajtásához. A rendszeren belül az Oracle Data Mining olyan adatbányászati algoritmusok gyűjteménye, melyek gyakorlatilag SQL nyelven megírt scriptek. Ennek köszönhetően az Oracle valósította meg először az úgynevezett "In Database Mining" technológiát, ami annyit takar, hogy az adatbányászati algoritmusok magán az adatbázis kezelőn belül futnak, ami jelentős sebességbeli előnyt jelent a hagyományos adatbányászati szoftverekhez képest. Az Analytics egy másik jelentős újdonsága, hogy lehet benne R nyelven programozni, amiről köztudott, hogy az adatbányászok egyik kedvelt programozási nyelve.

Ha jól tudom az Oracle Advanced Analytics-en belül lehet szövegbányászkodni is!

Igen az Oracle adatbányászat széleskörű algoritmuskészlete tartalmaz, ezek közül számos a szövegbányászatban is használható. Emellett az Oracle 2011-ben felvásárolta az Endeca nevű céget, így további lehetőségek állnak rendelkezésre a nem-strukturált adatokhoz.

Említetted korábban, hogy az Oracle olyan kész üzleti megoldásokat is kínál, melyekben ott ketyeg valamilyen adatbányászati motor. Ezekről említenél néhány szót?

A megoldások egyik fele valójában egy „dobozos adattárház modell", melyek megvásárlása után azonnal lehet adatbányászati elemzéseket készíteni. Ilyen megoldásunk az Oracle Communications Data Model, Airline Model vagy a Tax Analytics. De vannak konkrét üzleti problémákra adott analitikai megoldásaink is. Ilyen a Spend Classification vagy a CRM Sales Prospector On Demand. És természetesen azt se felejtsük el, hogy a CRM megoldásaink nagy része erősen köthető valamilyen adatbányászati elemzéshez.Legvégül hadd hívjam fel az olvasók figyelmét, hogy ingyenes adatbányászati tutoriálok segítségével el lehet kezdeni az ismerkedést az Oracle Advanced Analytics-szel. Érdemes figyelemmel kísérni a híreket, az Oracle adatbázis-kezelő és így az adatbányászat területén is újdonságok várhatók.

Ha napjainkban szóba kerül az adatbányászat, akkor szinte rögtön előbukkan a Big Data kifejezés is. Az Oracle hogyan tekint a Big Data-ra? Mint egy konkurens technológia vagy mint egy új üzleti lehetőség?

Remek a kérdés. Az Oracle-ben a Big Data terület is szerves része az enterprise data warehouse információs architektúrának, kiegészíti a korábbi üzleti intelligencia (vagy Business Analytics) és relációs adattárház területeket. Az Oracle a Clouderával is együttműködik a Big Data témakörben. A NoSQL, Hadoop, R, stb. technológiák mind az architektúra elemei. Az Engineered Systems területen (saját körülírása/fordítása: „minden rétegükben együtt tervezett célrendszerek") az első megoldás volt az adatbázisgép: Exadata Database Machine, van már köztes szoftvergép: Exalogic, ezek funkcionális uniója, a konszolidációra ideális SPARC SuperCluster, BI-gép: Exalytics In-Memory Machine és a Big Data Appliance család is, ami kifejezetten a Big Data adatfeldolgozás optimális támogatására született. Az Oracle Data Integrator ELT eszközhöz használhatók az Oracle Big Data Connectors termékek is. Érdemes elolvasni a következő dokumentumot: Information Management and Big Data A Reference Architecture.

Kedves Zoltán, köszönjük szépen az interjút!

 

Blog
adatbányászat, fekete zoltán, oracle
Junior adatbányászt keresünk!
Füstbe ment terv

Legutóbbi bejegyzések

  • Így olvastok Ti!
  • Mennyit keres egy programozó?
  • A rosszat tudod javítani – a jót nem!
  • Mihez is ért a Data Scientist?
  • Adatok hulladékgazdálkodása

evolve theme by Theme4Press  •  Powered by WordPress