Háttér
A zseniális LienkedIN közösségi oldalon az egyik adatbányászattal foglalkozó csoporton belül "Cluster Analysis on survey data" címmel már hetek óta fut egy igen érdekes vita. A témával kapcsolatban régi emlékek jöttek elő.
Kommentár
2005 tájékán igen rövid ideig voltam független tanácsadó, mivel egy nagy adatbányászati céggel történő szakításom után 1 hónappal összeismerkedtem a TÁRKI vezérigazgatójával, és félóra alatt megegyeztünk abban, hogy egy új céget hozunk létre TÁRKI-Data Research Kft. néven. A koncepció az volt, hogy megpróbálunk olyan metódust kifejleszteni, ahol az adatbányászatot kombináljuk piackutatási adatokkal. Azt hiszem szakmailag az egyik legizgalmasabb 2 évem következett, számos olyan elemzést készítettem a kollégáimmal, amik akkor a teljes újdonság erejével hatottak.
Az együttműködés azonban nem volt zökkenőmentes. Elég gyorsan kiderült számomra, hogy a piackutatók világa leginkább egy brit klubra hasonlít, legalábbis a zártságát illetően. Ez esetemben annyit jelentett, hogy az elemzéseimet igencsak kétkedve fogadták, mivel a hagyományos metódusok helyett igen gyakran használtam adatbányászati eszközöket. Egy igen kedves elemzésem volt, amikor autóvásárlói szokásokat elemeztem az Autó2 által készített kutatási adatokra. A szokásos "X százalék számára nagyon fontos a kényelem" típusú elemzések helyett, elkészítettem a márkáknak egy szegmentációját az alapján, hogy a vásárlóik számára mely szempontok a legfontosabbak.
Véletlenül sem akarok belemerülni a részletekbe, de a poszt megértése szempontjából annyit azért az ábráról el kell mondanom, hogy a sárga szegmensben tartozó márkák vásárlóinál elsődlegesen az ár volt a fontos, a zöld szegmensnél a kényelem, míg a lila szegmensben a technikai paraméterek.
Na de!
Az elemzés után ezt megpróbáltuk eladni a márkaképviseleteknek, akik hümmögve végighallgatták a prezentációt, félénken az órájukat nézték, és gratuláltak, hogy milyen érdekes munkám van - majd kimenekültek a szobából. Aztán persze senkinek se kellett az anyag. Na de mi is volt a gond?
Elsőre gondolom mindenki könnyen rávágja, hogy a fenti ábra nagyon "bonyi", a hiba az én készülékemben volt. Ezzel talán egyet is lehet érteni, de azért érdemes azon is elgondolkodni, hogy miért egyszerű elemzéseket igényelnek az ügyfelek? Például ilyet:
A grafikon egyébként azt mutatja, hogy az emberek hány százalékának fontos valamelyik paraméter az autóvásárlásnál (megbízhatóság 64%-nak, design csak 14%-nak). Csak a történeti hűség kedvéért: az első ábra 2005-ös tanulmányból van, a második a 2011-esből. Ugyanis egy idő után feladtam/alkalmazkodtam/elfogadtam a megrendelői igényeket, és szép lassan semmilyen adatbányászati elemzést nem tettem be ezekbe a tanulmányokba.
Na de!
Látszólag tehát az volt a gond, hogy az első elemzésem nem volt "felhasználó barát". De azért van itt más is. Figyelmen kívül hagytam ugyanis egy igen fontos dolgot! Azt, hogy a piackutatás és adatbányászat célja homlokegyenest eltér egymástól, és ezt az elemzéseknél szem előtt kell tartani!
A piackutatás ugyanis madártávlatból néz rá a sokaságra, és kizárólag általános összefüggések detektálására fókuszál. Egyéni szint érdektelen, hiszen eleve csak a mintában részt vevőkről vannak adatok.
Az adatbányászat ezzel szemben éppen az apró részletekben keresgél. A cél az, hogy mindenkire (értsd: minden ügyfélre) a lehető legpontosabb becslést/előrejelzést adjuk. Ez azért lehetséges, mert általában minden egyes egyedről/ügyfélről ugyanannyi adat áll rendelkezésre. Ráadásul az se gond, ha az adatbányászon kívül senki sem érti a modellt, mivel a modellekkel szemben az egyedüli elvárás a pontos működésük.
A piackutatás és az adatbányászat tehát igencsak távoli testvérek. Megjegyzem ezt az idő is igazolta. A 2000-es évek közepén a TÁRKI-n kívül jó néhány piackutató cég elkezdett adatbányászattal foglalkozni (én legalább 3-ről tudok), később ez a lendület jelentősen alábbhagyott. De a nagyvállalatokon belül is ugyanez a folyamat figyelhető meg. 2000-es években sok cégnél a marketingen belül volt az adatbányászat, míg napjainkban ilyenre alig találni példát.
DE!
Bizonyos üzleti problémáknál a két módszertan igenis jól ötvözhető, de erről majd egy következő bejegyzésben fogok írni.