Háttér
Az Andego ügyvezető partnere, Kovács Gyula, egy könyvélményét és ezzel kapcsolatos néhány gondolatát osztja meg az olvasóival.
Kommentár
Nemrég került a kezembe egy amerikai író, kicsit olasz maffiozó nevére emlékeztető Don DeLillo Cosmopolis könyve. Egy kiégett tőzsdecápa utolsó napjáról szól a könyv. A könyvet jó szívvel nem ajánlom senkinek, eléggé zavaros az egész, de mivel a könyvben szereplő pénzemberek sikereiket adatelemzésekkel alapozták meg, igen eredeti gondolatokat találtam magukról az adatokról és adatelemzésről. Néhány idézet:
"... az adattömeg önmagában is mélyre érző, ragyogó jelenség, jól mutatja az életfolyamatok dinamikáját. Olyan, mint a különféle ábécék vagy számrendszerek ékesszólása, s most, a kettes számrendszeren alapuló világban, elektronikus formában maradéktalanul érvényre juthat - ez az a digitális imperatívusz, amely a bolygólakók milliárdjainak minden lélegzetvételét meghatározza." (a főhős milliárdos tanítása elemző beosztottjának)
"Ami el akarja hitetni veled, hogy léteznek előrelátható erők és trendek. Pedig valójában csupa véletlenszerű jelenségről beszélünk. Persze alkalmazod a matematikát meg más tudományokat is, igen. De végeredményben mégiscsak egy olyan rendszerrel van dolgod, ami irányíthatatlan." (a főhős tanácsadójának gondoltai, amikor egy ügylete nem jön be a főhősnek)
"Kétely. Végül is mi a kétely? Te nem is hiszel a kételkedésben, már mondtad. A számítógép ereje megszünteti a kételyeket. Minden kételynek múltbeli tapasztalat a forrása, csakhogy a múlt eltűnőben van. Valaha ismertük a múltat, és nem tudtunk a jövőről. Ez az állapot éppen most változik meg." (ugyanennek a tanácsadónak egy másik gondolata)
Na de miért is érdekesek a fenti mondatok egy adatbányász számára. Érdemes megnézni a könyv születésének a dátumát (2003), illetve a cselekmény időpontját (2000). Miért érdekesek ezek a dátumok? Nos a 2000-es évek első fele volt az adatelemzés első nagy berobbanásának a dátuma (utána volt még egy Big Data néven). Ekkor az adattárházak, BI rendszerek, és adatbányászati elemzések gombamód szaporodtak az üzleti életben. Ez a forradalmi változás az adatelemzésben gyorsan kihatott a kultúra más részeire is. Filmek, könyvek és cikkek ezrei próbálták megérteni az új helyzetet. Az adatelemzés annyira benne volt a levegőben, hogy nagyon sok íróhoz hasonlóan DeLillo is megfogalmazott néhány gondolatot ezzel kapcsolatban (lásd idézetek). Miért is érdekesek ezek?
- Az első idézet jól szemlélteti az új techniológiába vetett hit korlátlanáságát. Az emberiség mindig hajlamos túlzásokra. A első számítógépektől egyből egy szuper mesterséges intelligenciát vártak az emeberek, az első holdraszállás után az egész világűr meghódítását, míg 2000-es évek elején az óriási adattömegek elemzésétől a végső igazságok feltárását. A főhős ezt az irracionális hitet képviseli monológjával.
- A második idézet már a csalódást írja le. Ebben persze benne lehetett a 2001. szeptember 11-i tragédia hatása is, amikor az amerikaiak csalódtak a terrorista elleni harcban, és ezen belül az adatelemzésben. De ez a néhány mondat ettől függetlenül is érdekes. Az előrejelzés tényleg csak a vakszerencsén múlik, minden esemény csak a véletlen műve? Nyilván nem. De elég ha a "Fekete hattyú" jelenségre gondolunk, hogy lássuk a véletlen és nem előrejelezhető eseményeknek mekkora ereje van bizonyos történelmi helyzetben.
- "A múlt eltűnőben van." Milyen érdekes ezt is olvasni. Hogyan értelmezhető ez? Hiszen az újkori adatelemzés lényege éppen az, hogy soha nem látott mennyiségű adatot tárolunk a múltról. A kulcsszó a tárolunk. Vajon ebből a rengeteg adatból tényleg megismerjük a múltat? Nem igazán. Ha jobban belegondolunk, az adatbányászat lényege nem a múltbeli összefüggések feltárása, HANEM: azon múltbeli összefüggések feltárása, melyek még érvényesek a jelenben és egy darabig a jövőben. Ami elavult, az már nem érdekes, és a digitális kukába fog kerülni.
A tanulság tehát? 10 év telt el a könyv megírása óta, de ezek a gondolatok továbbra is elevenek. Továbbra is van egy vakhit az adatok erejében (lásd Big Data hype), de azért sokan már túl vannak egy-két csalódáson, és továbbra is igaz az is, hogy "sokat elemzünk, de keveset tudunk".