Andego Tanácsadó Kft.
  • Bemutatkozunk
  • Tanácsadás
    • Adatbányászat
    • Hálózatelemzés
    • Weblog elemzés
    • CRM
  • Megoldások
    • Csalásdetektálás
    • Céginformációs szolgáltatás
    • Cégcsoport detektálás
    • Kockázati Modul
  • Oktatás
    • Szemináriumos naptár
    • Microsoft Akadémia
      • Excel
      • Power Pivot
      • Machine Learning
    • Open Source adatbányászat
      • R
      • Rapid Miner
    • Adatbányászat
    • Hálózatkutatás
  • Kapcsolat
  • Andego Blog
Andego Tanácsadó Kft.
  • Bemutatkozunk
  • Tanácsadás
    • Adatbányászat
    • Hálózatelemzés
    • Weblog elemzés
    • CRM
  • Megoldások
    • Csalásdetektálás
    • Céginformációs szolgáltatás
    • Cégcsoport detektálás
    • Kockázati Modul
  • Oktatás
    • Szemináriumos naptár
    • Microsoft Akadémia
      • Excel
      • Power Pivot
      • Machine Learning
    • Open Source adatbányászat
      • R
      • Rapid Miner
    • Adatbányászat
    • Hálózatkutatás
  • Kapcsolat
  • Andego Blog
  • Home
  • Blog
  • Ki volt az első adatbányász?

Ki volt az első adatbányász?

2017. május 3. szerda Bejegyezte hadhazi

Ki volt az első adatbányász?

Az adatelemzés napjainkban egy kulcsfontosságú terület. Cégek, befektetők, sportklubok, webáruházak naponta dolgoznak fel és elemeznek adatokat. Már a 60-as években megjelentek az első statisztikai programok, de az adatelemzés széles körű elterjedését a 90-es évek közepén megjelenő adatbányászati szoftverek tették lehetővé. A 90-es évektől kezdődően egy új elemzési iparág jött létre (az adatbányászat), az adatbázis méretek drasztikus növekedése pedig új adatkezelési technológiát váltott ki (Big Data).

Az adatbányászat definícióját igen sokféleképpen próbálták meghatározni, de lényege: viszonylag kis mennyiségű adat alapján egy elég bonyolult esemény valószínűségét számolja ki. Vegyünk egy egyszerű példát. A bankok vagy telekommunikációs cégek közül sokan fejlesztettek ki az utóbbi időben ún. churn-modellt. A churn-modell az ügyfelek folyamatosan változó adatai alapján kiszámolja annak a valószínűségét, hogy az ügyfél elmegy az adott szolgáltatótól.

Milyen adatok alapján számolja ki ezt a valószínűséget?

  • ügyfél demográfiai adatok (életkor, nem, jövedelem, …)
  • viselkedés adatok (bankoknál pénzügyi tranzakciók, telko cégeknél hívásszokás)
  • szerződés adatok (mikor kötötte a szerződést, van-e hűségnyilatkozata, …)
  • fizetési szokások (mennyire fizet időben)
  • …

Bár jól láthatóan igen sok adat áll rendelkezésre az ügyfelekről, másrészt igen kevés. Legalábbis abban a tekintetben, ha egy ember döntési mechanizmusát szeretnénk leírni. Ha jobban belegondolunk, egy embert naponta több ezer impulzus éri, és ezek hatására hozza meg a döntéseit, akár arról hogy felmond egy szolgáltatást. Sokszor mi magunk se tudjuk megmondani, hogy miért hoztunk meg egy döntést – a racionális és nem racionális elemek folyamatosan keverednek ilyenkor.

Ha újra megnézzük, milyen adataink vannak az ügyfelekről, akkor szinte reménytelennek tűnik, hogy az ügyfelek döntései előre jelezhetők, hiszen épp azokról az impulzusokról nincs információnk, amik alapján sokszor a döntéseket meghozzuk. Az empirikus tapasztalatok mégis azt mutatják, hogy a fenti adatok alapján jól beazonosíthatók az elvándorlók egy része.

Ha elfogadjuk azt a definíciót, hogy az adatbányász lényegében információ morzsák alapján modellez egy bonyolult problémát, akkor feltehetjük a kérdést, hogy ki volt az első adatbányász?

Bevallom, a tudománytörténetet az egyik legizgalmasabb tudományágnak tartom, mindenkinek ajánlom, ha szeretné megismerni az emberiség fejlődésének mozgatórugóit.  Ha jobban belegondolunk az ókori csillagászok mind adatbányászok voltak. Mai szemmel nézve minimális információk alapján próbáltak megválaszolni olyan „egyszerű” kérdést, hogy pl. hol van a világ középpontja. A geo- és heliocentrikus világkép harcáról tán mindenki hallott, de talán kevesen tudják, hogy már az ókori görögöknek viszonylag pontos becslésük volt arra vonatkozóan, hogy mekkora lehet gömb alakú Föld átmérője. Azt, hogy a Föld gömb alakú már igen korán tudta az emberiség pl. a hajósok tapasztalatai alapján (a távoli vitorlásoknak először mindig csak a tetejük látható).

De vajon honnan tudták, hogy mekkora ennek a „gömbnek” az átmérője? Eratoszthenész (i.e. 276-i.e. 194), egy ókori polihisztor volt az, aki meglepően pontos becslést adott erre vonatkozóan. Ha valaki kíváncsi a módszerre, az alábbi linken tudja megismerni.

 

eratoszthenesz

 

Számunkra a lényeg: gyakorlatilag 2 adat alapján ki tudta számolni, hogy mekkora a Föld kerülete (két település távolsága, és hogy egy rúd árnyéka hány fokos szöget zár be). Ha elfogadjuk az adatbányászat fenti definícióját, akkor nagy valószínűséggel Eratoszthenész volt az emberiség egyik első adatbányásza.

 

 

 

 

Blog
R-re érdemes volt áldozni egy szombatot!
Egyszerű adattisztítást mindenkinek!

Legutóbbi bejegyzések

  • Így olvastok Ti!
  • Mennyit keres egy programozó?
  • A rosszat tudod javítani – a jót nem!
  • Mihez is ért a Data Scientist?
  • Adatok hulladékgazdálkodása

evolve theme by Theme4Press  •  Powered by WordPress