Andego Tanácsadó Kft.
  • Bemutatkozunk
  • Tanácsadás
    • Adatbányászat
    • Hálózatelemzés
    • Weblog elemzés
    • CRM
  • Megoldások
    • Csalásdetektálás
    • Céginformációs szolgáltatás
    • Cégcsoport detektálás
    • Kockázati Modul
  • Oktatás
    • Szemináriumos naptár
    • Microsoft Akadémia
      • Excel
      • Power Pivot
      • Machine Learning
    • Open Source adatbányászat
      • R
      • Rapid Miner
    • Adatbányászat
    • Hálózatkutatás
  • Kapcsolat
  • Andego Blog
Andego Tanácsadó Kft.
  • Bemutatkozunk
  • Tanácsadás
    • Adatbányászat
    • Hálózatelemzés
    • Weblog elemzés
    • CRM
  • Megoldások
    • Csalásdetektálás
    • Céginformációs szolgáltatás
    • Cégcsoport detektálás
    • Kockázati Modul
  • Oktatás
    • Szemináriumos naptár
    • Microsoft Akadémia
      • Excel
      • Power Pivot
      • Machine Learning
    • Open Source adatbányászat
      • R
      • Rapid Miner
    • Adatbányászat
    • Hálózatkutatás
  • Kapcsolat
  • Andego Blog
  • Home
  • Blog
  • Happy birth day!

Happy birth day!

2012. december 5. szerda Bejegyezte Kovács Gyula

Pontosan egy évvel ezelőtt, 2011 szeptember 05-én indult az Andego saját blogja. E jeles születésnapon megpróbálunk egy kis összefoglalót adni az elmúlt egy év terméséből, méghozzá egy kis színes elemzéssel.

A kérdés adott: mikről is írtunk az elmúlt 1 év 30 bejegyzésében? Nos először nézzük, meg hogy mik voltak a leggyakoribb címkéi a  cikkeknek?

Nem meglepő módon egy adatbányászattal foglalkozó blogon a bejegyzések zöme adatbányászati témájú. Sokat foglalkoztunk ezen kívül a hálózatkutatással, ami ugyancsak nem meglepő, hiszen a cég egyik fő profilja a hálózatkutatásra épülő elemzések. Az hogy a harmadik helyen a BI téma van talán meglepő, de ez köszönhető annak, hogy az Andego többször is foglalkozott big data témával, illetve több BI konferencián is megjelent, amelyről beszámolt.

A cikk írójának is feltűnt azonban, hogy klasszikus data mining témák (churn, x-sell, ügyfélszegmentáció) csak elvétve fordult elő. Ígérjük, ezen mindenképpen változtatunk, terveink közt szerepel egy cikksorozat elindítása ezen témák köré.

Azonban ennyire egyszerűen nem akartuk elintézni az elemzést, megpróbáltunk egy összetettebb kérdésre választ adni: a blog bejegyzései témájuk alapján hány klaszterbe sorolhatók?

Ehhez segítségül hívtuk a hálózatkutatást. Elkészítettük a cikkek hálózatát, ahol két cikket/bejegyzést akkor kötöttünk össze, ha legalább 1 közös címkéjük volt (kivéve persze az adatbányászat címkét, ami alapján szinte az összes cikket összekötöttük volna egymással). Majd a kapott cikkek hálózatán futtattunk egy klaszterező algoritmust. Nézzük az eredményt:

Az algoritmus négy klasztert hozott létre. A "kék" klaszterbe kerültek a kampánymenedzsment témához köthető bejegyzések, a "pink" klaszterbe a Big Data, a "zöld" klaszterbe a hálózati témájúak és a "piros" klaszterbe az oktatás és RapidMiner cikkek.  "Zöld" klaszter tartalmaz két kakukktojás cikket. A "Ki nyer ma" és a "Pénzcsinálók" nem hálózati témájú cikkek, de az algoritmusnak döntenie kellett, és végül a "Zöld"-be sorolta őket.

(Egyébként négy cikk egyáltalán nem került be a hálózatba, mivel ezek teljesen függetlenek voltak a többiektől. Vagy mégsem? Mint később kiderült, egyszerűen pontatlan volt a címkézés ezen cikkeknél.)

Végül zárszó helyett:

Remélem az elmúlt egy év az olvasóinknak is adott legalább annyi élményt, mint a szerkesztőségnek, és ígérjük hogy a következő egy évben még érdekesebb és színesebb cikkekkel fogunk jelentkezni.

Blog
adatbányászat, andego blog, hálózat, összefoglaló
Desktop, tömeggyilkosság, lottó
Ősszel folytatódik a Data Mining Akadémia

Legutóbbi bejegyzések

  • Így olvastok Ti!
  • Mennyit keres egy programozó?
  • A rosszat tudod javítani – a jót nem!
  • Mihez is ért a Data Scientist?
  • Adatok hulladékgazdálkodása

evolve theme by Theme4Press  •  Powered by WordPress