HÁTTÉR
2012 április 25-én tartotta meg a Clementine Consulting (korábban SPSS Hungary) a XI. SPSS Adatbányászati és Adatelemzési Konferenciát. Az Andego Kft.-től Kovács Gyula tartott előadást "Csődterjedés modellezése hálózati módszertannal" címmel. Lapozás után személyes beszámolója olvasható.
KOMMENTÁR
Minden évben kíváncsian várom az SPSS konferenciát. Az adatbányász szakma számára az SPSS (új nevén Clementine Consulting) rendezvények mellett a SAS és IQSYS konferenciái tartogathatnak érdekes előadásokat, utóbbi években pedig a BI Consulting által szervezett BI/Adattárház konferenciák. Azonban az SPSS konferencia az egyetlen kizárólag adatbányászat/adatelemzés köré szerveződő rendezvény. Nézzük miket láttunk idén.
A Clementine Consulting ügyvezető igazgatója, Körmendi György nyitotta a programot. Előadása két részből állt. Az első részben a data mining projektek megtérülésével foglalkozott. Az indítás rá jellemzően provokatív volt. "Tegye fel a kezét, akinél az adatbányászat igazi sikersztori volt az elmúlt években!" kérdés jó indításnak tűnt, ezt mutatta a feltartott kezek csekély száma. Innentől kezdve gyilkos logikával bemutatta egy esettanulmányon keresztül, hogy mennyit is számít néhány százalékos javítás a modelleken. Azonban azonnal hozzátette, hogy ehhez egy pontos megtérülési számítás is kellett - ami egyenlőre nem igazán jellemző a szakmára. Miután feldobta a magas labdát,ezt egyből le is csapta az előadás második részében. Ebben felvázolta a régi/új cég szolgáltatás portfólióját, és benne csodák csodájára szerepelt egy ún. adatbányászati audit is, ami célja szerint az itthoni cégek adatbányászati állapotát mérné fel (majd Gartner szerű riportban közölné is ezt). Az első SPSS konferencia óta szinte az összesen voltam, és tanulságos azt látni, hogyan kezd egyre professzionálisabb lenni az SPSS/Clementine értékesítési stratégiája. Nekem mindenesetre tetszett!
Az ezt követő Takács Károly már a szakmára fókuszált. A Corvinus Egyetem oktatója "Kapcsolathálók és szervezeti siker" címmel tartott előadást. Rengeteg ábrát láthattunk sok-sok gráffal. A sok érdekes esettanulmány talán most túl sok is volt, igazából nehéz volt kihámozni mi is volt az előadás fő üzenete.
A hálózati témát folytatva én következtem a "Csődterjedés modellezése hálózati módszertannal" címmel. Sok gratulációt kaptam, majd erről a témáról fog születni egy külön poszt.
A kávészünet után Csatlós Béla a NAV-tól tartott előadást. Ha jól emlékszem már tartott előadást korábbi SPSS konferencián is, és jó volt látni hogy az adatbányászat iránti lelkesedése nem csökkent! Néhány éve az előadása azt hangsúlyozta ki, hogy a Clementine az adatbányászaton túl kiváló eszköz adatmanipulációra is. Idén az adatbányászat integrálhatóságának témáját járta körbe. Fontos téma - jó hogy szerepelt a programban.
A Millward-tól Juhász Ferenc igen látványos példákat mutatott arra, hogy az online adatfelvétel jelenleg hol tart. A piackutató szakma később is képviselte magát (Hoffman Márta - "Zen a reklámokban"). Engem most jobban érdekelt a Millward előadás, mivel meglátásom szerint a piackutatói szakma egyik legfontosabb kihívásáról szólt - új adatfelvételi eljárásokról. Az előadó is említette, hogy a hagyományos adatfelvételi csatornák (személyes, telefonos) egyre kisebb hatékonyságú a fejlett fogyasztói társadalmakban (és egyre drágább is teszem hozzá!), így nem meglepő módon jön fel az online adatfelvétel (ami ráadásul kezd átterelődni az okos telefonokra). Az online adatfelvétel ereje egyértelmű, az ábrák, képek és videók ötvözése a hagyományos kérdőívekkel teljesen új perspektívát ad az adatelemzésnek. Kár hogy ez utóbbiról kevés szó esett!
Ezzel szemben Hoffman Márta előadása ("Zen a reklámokban") számomra elrettentő példája a piackutatásnak. Persze az üzleti marketing és a hozzákapcsolódó kutatások mögött óriási tudás van, de talán már túl sok is. Hoffman Márta az egyik legnagyobb név a szakmában, így h valakitől, akkor Tőle tényleg hitelesek az egészen mély, szofisztikált fogyasztói magatartás kutatás. A hiba talán nem is benne volt, hanem bennem, mert én az elmúlt években egyre szkeptikusabb vagyok az ilyen mélységű fogyasztói elemzésekkel kapcsolatban (aki nem látta: különböző országokban fényképek alapján vetették össze a helyi és a nemzetközi hirdetők által hangsúlyozott emberi attitűdöket). Ezekkel az elemzésekkel a legnagyobb bajom, hogy szépek - de használhatók-e üzleti célokra? Míg velünk szemben (mármint adatbányászokkal szemben) egyre keményebben kérik számon elemzéseink megtérülési mutatóit (lásd nyitó előadás kiváló témaválasztása), addig a piackutatók esetében sokszor érzem úgy magam, mint egy avantgard képzőművészeti bemutatón. Kívülállóként semmit sem értek az egészből, de jól láthatóan a szűk szakma iszonyúan élvezi az egészet! No de valaki méri, hogy ezek az elemzések hogyan térülnek meg?
Nem tudom hogy bennem van-e a hiba, de számomra a legfontosabb előadás Katona Krisztináé (ING) volt. Pedig szakmailag csak erős közepes volt. Nézzük miért is tetszett akkor! Az előadás első része standard BI/analitikus CRM diákat tartalmazott (kezdtem unatkozni), de aztán bemutatta azokat a szegmenseket, amikkel dolgoznak a hétköznapokban. És innentől kezdtem én is jobban figyelni. Hogy miért? A válasz rém egyszerű: azért, mert végre láttam üzleti folyamatokba integrált, jól működő ügyfél szegmentációt! Ott tartunk, hogy ügyfél szegmentációs koncepciót sok biztosító (bank, mobilszolgáltató, stb.) tudna bemutatni 2012-ben, de üzleti folyamatokba integráltat alig néhány. Az ING példája azt mutatja, hogy egyszerű üzleti elvek alapján is jól használható szegmensek képezhetők, és ami nagyon fontos, hogy éppen egyszerűségük miatt egyben jól integrálhatók az üzleti folyamatokba. Tanulság: nekünk adatbányászoknak végre el kellene fogadnunk, hogy sok esetben nem az elemzések mélysége a legfontosabb, hanem az interpretálhatósága!
Délután két szekció volt: (1) Nem strukturált adatok elemzése, illetve (2) Kockázatkezelés. Én az előbbit választottam. Hoffmann Márta előadásáról már írtam, de még volt jó néhány érdekes rész. Az Aegon által bemutatott ClemVoice hangbányászati szoftver volt ezen szekció csúcspontja. Az előadó Hans Zoltán a konferencia látogatók számára nem lehet ismeretlen. Ő azon hazai menedzserek közé tartozik, aki őszintén hisz az innovációban. Kifejlesztett egy hálózati módszertanra épülő csalás detektáló rendszert a KFKI-vel, illetve ezt a hangbányászati rendszert az SPSS/AITIA konzorciummal. A bemutató jól szemléltette a nem strukturált adatok erejét (egy Call centeres hangfelvétel alapján talán többet meg lehet tudni egy ügyfélről, mint több éves tranzakciós adatai alapján!). Az AITIA által kifejlesztett technológia felismeri az elhangzott szöveget, az SPSS pedig erre engedi rá szövegbányászati megoldását. Úgy gondolom, hogy ez a technológia bizonyos esetekben (pl. ügyfélmegtartás) lényegesen hatékonyabb lehet, mint a hagyományos adatbányászat.
KONKLÚZIÓ
Milyen volt összességében a konferencia? Mindenképpen hasznos. Hasznos, mert a szakmán belül érzékelt útkeresési folyamatot jól reprezentálta. Az jól látszik, hogy a hagyományos adatbányászat eltűnőben, illetve kezd felolvadni új technológiákban. Ha az adatbányászatot mégis elfogadjuk egy központi magnak, akkor két fejlődési pont volt most a fókuszban. Egyrészt: "Hogyan lehet üzleti értéket teremteni adatbányászattal?" téma, illetve a "Hogyan lehet továbbfejleszteni a strukturált adatokra épülő módszertant nem strukturált adatokkal?". Vegyük észre, hogy a nemzetközi trendek nem ezek (Big data, Cloud Computing), de szerintem az egyáltalán nem ha, ha a saját problémáinkra fókuszálunk egy ilyen konferencián.