Az elmúlt években többen is biztattak szakmai (adatbányászat, data science) blogok írására. Sokáig ellenáltam, de idén június környékén úgy döntöttem adok egy esélyt magamnak.
Mi szólt mellette? Kíváncsi voltam, kit érdekelnek egy ilyen régi típusú adatbányász gondolatai, mint amilyen én vagyok? Kíváncsiság mellett talán még fontosabb volt, hogy egyszerűen élveztem az írást. Igazából ezeket akkor is kiírtam volna magamból, ha zéró olvasottságot értem volna el.
Mi szólt ellene? A lustaság. Fura dolog ez - egyszerre élmény az írás, de teher is. Élmény, amikor már elkészült az új blog bejegyzés, de kín amikor „el kell kezdeni” egy új írást.
A döntést tehát tett követte, de ehhez el kellett dönteni hogy hova írok és milyen típusú írásokat?
A „hova” kérdésre egyértelmű volt a válasz, a LinkedIn egy erre fejlesztett szakmai portál, így nem volt kérdés, hogy ide fogok írni. A másik kérdésre, hogy miket írjak, nagyjából a Ti olvasási szokásotok alakította ki.
Jó adatelemzőként szorgalmasan rögzítettem a posztok olvasottsági adatait, „hátha még jó lesz valamire” alapon. Közel fél év alatt 24 posztot tettem ki, és lett ezzel párhuzamosan egy 24 soros „kis adatbázisom”. Nem hagyott nyugodni a dolog, megnéztem hogy ilyen kis minta alapján megválaszolhatók-e az alábbi kérdések:
- Mitől lehet sikeres egy poszt? És mitől sikertelen?
- Van-e kapcsolat a like-ok és a nézettség között?
- Mennyire alkalmas kapcsolatépítésre szakmai posztok kihelyezése?
Amikor elkezdtem a posztokat írni, téma választásaim ösztönösen jöttek:
- Linkeden lévő (angol nyelvű) szakmai posztokat osztottam meg saját gondolataimmal megspékelve
- Szakmámhoz csak tágabb értelemben kapcsolódó színes, kicsit „funny” gondolatok osztottam meg
- Szakmai rendezvények beharangozóját, illetve összefoglalóját írtam meg
- És ami a számomra legfontosabb volt – hosszabb szakmai blog bejegyzéseimet promótáltam a LinkedIn-en
A módszerem mindig a következő volt: a LinkedIn-en írtam egy rövid posztot (itt 1200 karakterbe bele kell férni). A Funny írásoknál betettem mindig egy érdekes diagramot, de linket nem (ez mint később kiderült - fontos volt), a többi esetben a poszt végére mindig betettem egy linket:
- angol nyelvű blog posztok esetében magára a posztra
- rendezvény felvezető/összefoglaló esetében a rendezvény honlapjára
- saját blog poszt esetén a külső blogom oldalára
Az alábbi táblázat röviden összefoglalja a 4 kategória legfontosabb jellemzőit:
Jellemző | Angol szakmai link | Funny, érdekes írások | Rendezvény | Saját blog poszt |
Volt (külső) link? | Igen | Nem | Igen | Igen |
Szakmai tartalom? | Minden esetben érdekes téma, de szakmai háttér kellett a megértésükhöz | Inkább szórakoztató kis írás – szakmán kívülieknek is érthető | Figyelemfelkeltő írások - minimális szakmai háttért igényeltek | Minden esetben érdekes téma, de szakmai háttér kellett a megértésükhöz |
LinkedIn bevezető miről szólt? | A szakmai cikkben leírt témával kapcsolatos saját gondolataim | Személyes élmény: ahogy egy adatbányász látja a „világot” | Rendezvény programjával kapcsolatos gondolataim | Az eredeti blog poszt első bekezdése (kedvcsináló) |
Leközölt témák | - Adatpótlási technikák
- Advanced Analytics összefoglaló - Prediktív modellezési technikák - Klaszter optimalizálás - Big Data kihalás szélén? - ML vs. Statistics |
- Szuperinfo hirdetések alapján társadalom kritika
- Egy egészség témájú cikkben talált szakmai pontatlanság tanulságai - Menedzser gyilkos Excel - Egy Dwayne Johnson idezet, ami fontos nekem - R fejlesztők fizetése - EB selejtező vs. Eurovízió |
- Menta konferencia előzetes
- Citizen Data Scientist meetup - Budapest BI Fórum - Context konferencia |
- Kaggle átok
- Létezik-e prediktív modellezés - Adatbányászok doppingja - Adatok hulladék-gazdálkodása - Mihez ért a Data Scientist? - Rosszat tudod javítani a jót nem - Mennyit keres egy programozó |
Az írás elején feltettem 3 kérdést - nézzük mire jutott ezekkel egy adatányász!
1. Mitől lesz sikeres egy blog poszt?
Alapvetően két mutatót lehet erre gyorsan elővenni:
- lájkok száma (like)
- megtekintések/nézettség száma (view)
Először nézzünk egy idősort, ami a publikált posztok megtekintéseinek (view) számát mutatja:
Minden pont egy posztot jelöl. A vízszintes tengelyen a poszt megjelenés dátumát, a függőleges tengely az adott poszt megtekintéseinek (view) számát mutatja. Pontok színezése:
- Világoskék: angol szakmai link
- Sötétkék: rendezvény
- Zöld: saját poszt
- Bordó: funny.
Hacsak nem vak az olvasó, akkor azonnal láthatja, hogy volt egy kiemelkedően sikeres poszt („Menedzsergyilkos Excel”), ami 146 like-ot kapott és 19.000 megtekintése volt. Úgy voltam ezzel, mint Kiss Tibi (Quimby) a „Most múlik pontosan” számmal. Az egyik koncertjén úgy konferálta fel ezt a dalt, hogy a dal érzése szerint már önálló életet él, követni se tudja a feldolgozások számát, így el se énkeli, ezt ránk bízza (és tényleg mi énekeltünk helyette).
Szóval azt láttam, hogy a poszt kezd önálló életet élni, számomra tök ismeretlenek lájkolták, kommentelték, vitatkoztak egymással. A lényeg, hogy ez a poszt bár nagy olvasottságot hozott, de valahol le is vált rólam. Épp ezért innentől ezt a posztot kivettem az elemzésekből (de a kapott eredmények ígérem így is érdekesek lesznek).
Akkor most nézzük, újra az előző ábrát – de a „Menedzser gyilkos” poszt nélkül.
Továbbra is minden kis kör egy posztot jelöl, a számok a posztok nézettségi (view) adatait mutatják, és a színezés jelentése is ugyanaz, mint az előző ábrán. Mi látható ebből?
A trend vonal szerint folyamatosan nő posztjaim olvasottsága, ami nagyon jó hír - de egy kicsit nézzünk azért a számok mögé.
Ha figyelmesen nézzük az ábrát, akkor látható, hogy a „színek” nem egyenletesen oszlanak el. Az első posztot 2019.06.20-án tettem ki, és egészen 2019..09.12-ig a posztok fele „világoskék” (angol szakmai link). Jól láthatóan ezek a bejegyzéseim mérsékelt sikert arattak. A saját blog posztjaim olvasottsága egy erős kezdés után (1700-1900 view) visszaesett egy kicsit, de év végére újra felment 1600-3000-es olvasottságra. Megjegyzem saját posztjaimba sokszor több napos munkát tettem, így eléggé váratlanul ért, hogy az ún. „funny” bejegyzéseim jóval sikeresebbek, ahol gyakorlatilag kirakok egy jópofa ábrát, próbálok hozzáírni valami szellemes dolgot (nettó ráfordítás sokszor fél óra se volt), és mégis jóval nagyobb olvasottságot (és lájk számot) értem el velük. Ne felejtsük el, hogy az ábrán nem látható „Menedzsergyilkos Excel” is idetartozott (19.000 view), de ezen kívül volt még egy 6.500-as olvasottságú bejegyzésem (R fejlesztők fizetése), és egy 3.300-as is (foci EB vs. Eurovízió).
Igazából az olvasottság növekedése leginkább abból fakadt, hogy a sikertelen típusú posztokat leépítettem (angol szakmai linkek), és a sikereseket („funny”) előtérbe helyeztem.
Azonban én azt szeretném elérni, hogy a szakmai írásaim minél több emberhez jussanak el! Éppen ezért megvizsgáltam, hogy a lájkolás hogyan befolyásolja saját blog posztjaim olvasottságát. Ehhez fontos volt a következő kérdés megválaszolása.
2. Milyen kapcsolat van a lájkok és a megtekintések (view) között?
Az elég hamar nyilvánvaló lett számomra, hogy ez a két dolog erősen összefügg egymással:
- Ha sokan olvasnak egy posztot, akkor nagyobb az esély, hogy valaki belájkolja
- Ha valaki belájkolja, akkor ezzel növelheti az olvasottságát (mivel ismerősei üzenőfalán megjelenik a lájk, és vele együtt a posztom).
Ez az elmélet, nézzük mi a valóság:
Ezen az ábrán is a körök a posztokat mutatják, x tengelyen a nézettségi számai, míg az y tengelyen a like számok. A piros nyíl egy „1 like = 100 view” szabályt reprezentál, azaz ha egy poszt erre a vonalra kerül, akkor a view-k száma 100-szorosa lenne a like-ok számának (pl. 9 like mellett 900 lenne a view szám). Az látszik, hogy a posztok többsége ezen vonal körül van – mintha tényleg lenne egy ilyen láthatalan „1 like-100 view” összefüggés. Azonban az is látszik, hogy ez az összefüggés leginkább a „világoskék”, „sötétkék” és a „zöld” posztokra igaz – pont azokra, ahol volt egy kifelé mutató link.
Az ún. „funny” posztok esetében ez az összefüggés nem érvényes, itt az látható hogy egy 20-25 körüli like számhoz tartozhat 2000-es nézettség, de akár 6500-as is – úgy tűnik, hogyha nincs link a posztnál, akkor a poszt terjedése a LinkedIn-en belül szinte előrejelezhetetlen. Ezzel szemben ha van link, akkor a bűvös 2000-es view számot nem nagyon tudja átlépni egy poszt.
(Egyetlen nem funny poszt van a fenti ábrán, ami túllépte a 2000-es view számot, ez pedig a „Mihez ért a Data Scientist” című volt - azonban ez különleges körülmények között született, erről még később írok.)
A saját blog posztjaim esetében az az érdekes jelenség látható (zöld körök), hogy a legtöbb poszt eléri az 1500-2000-es nézettségi (view) tartományt, de a like-ok száma csak minimálisan növeli az olvasottságot (narancssárga nyíl – 4 poszt között óriási különbség like számban, de a view-k számában minimális az eltérés). Ez azt sugallja, hogy a saját blog bejegyzéseimre mutató posztok nézettségét kevésbé befolyásolja a like szám, egy fix körhöz minden esetben eljutnak ezek az írások.
Oké, tehát egyelőre fogadjuk el a 2.000-es view határt sajág blogjaim esetében. Máris két kérdés felmerülhet:
- 2000-es view szám csak LinkedIn nézettségi adat – korántsem biztos hogy mindenki rákattintott a linkre, hogy átmenjen a blog bejegyzésemre. Az első kérdés tehát: hányan jutottak el az írásaimhoz (blog oldalamra)?
- Hogyan tudom növelni a LinkedIn nézettséget, ezáltal bővíteni a fix olvasói körömet?
HÁNYAN JUTNAK EL AZ IRÁSAIMHOZ?
Nézzük az első kérdésre a választ egy diagrammal.
Az oszlopok azt jelölik, hogy egy adott blog írásomig hányan jutottak el a LinkedInről, míg a vonaldiagram egy érdekes mutatószámot jelöl: LinkedIn elért olvasók (view) közül hány százalék jutott el az írásomig. (a diagramban a blog bejegyzések megjelenés sorrendjében követik egymást)
Az eredmény elég gyászos képet mutat. Amikor elkezdtem saját posztokat kitenni a LinkedIn-re, akkor az elért LinkedIn felhasználók 8-9%-a rákattintott a linkre, és jutott el az írásomig, majd ez a ráta idővel csökkent, sőt maga az olvasói szám is csökkent. Ne felejtsük el, hogy a LinkedIn-en belül a posztok stabil 1700-1900 körüli olvasottságot érnek el, de az elért olvasók közül egyre kevesebben jutottak el magához a blog bejegyzéshez.
Egy kiugró olvasottságú blog bejegyzés volt, a „Mihez ért a Data Scientist”. Mint említettem, ez nem egy átlagos blog poszt volt. A LinkedIn profil alapján összegyűjtöttem 300 data scientist adatait (végzettség, milyen programozási nyelvekhez értenek, stb), ezeket kielemeztem, és ezen elemzések eredményei alapján írtam egy blog bejegyzést. Előtte mind a 300 szakemberrel felvettem a kapcsolatot, hogy adatai bekerültek a kutatásba, és ez mennyire zavarja őket. Gyakorlatilag mindenki nagyon pozitívan állt a kutatáshoz, és sokan vissza is jeleztek, hogy feltétlenül elolvassák majd a cikket. Magyarul, itt elég erős „hátszelet” kapott a poszt, de sajnos ezt a lendületet nem sikerült később meglovagolni (legalábbis egyelőre).
GYULA FELADATA 1: növelnem kell a fenti konverziós rátát 10%-ra! (így megduplázhatom az olvasóim számát).
Azért 10%-ot jelöltem be célnak, mert még az erősen promótált "Mihez ért a Data Scientist" esetében se léptem át ezta konverziós rátát, úgy tűnik ezt az értéket el kell fogadni egy elméleti plafonnak. Viszont így érdemes azon is elgondolkozni, hogyan lehet növelni a LinkedIn-en a nézettséget (view szám) - hisz
"view szám" * konverziós ráta = blog poszt olvasottság.
HOGYAN NÖVELHETEM A LINKEDIN NÉZETTSÉGET?
Ha valaki posztokat tesz ki a LinkedIn-en, akkor meg tud nézni néhány alapadatot a látogatókról:
- mely cégektől látták a posztot – és cégenként hányan
- milyen szakmákból látták a posztot – és szakmánként hányan
- melyik országból látták a posztot – és országonként hányan.
Az ország statisztika sose hozott izgalomba, mivel magyar nyelvű posztjaim miatt nem meglepő módon az olvasóim zöme magyarországi (az viszont érdekes, és talán majd kezdek vele valamit, hogy a külföldi olvasók aránya, ha lassan is, de nő).
A cégstatisztika talán akkor lesz érdekes számomra, ha majd egyszer tanácsadóként ügyfeleket szeretnék szerezni. Az azért jól látszik, hogy van kb. 10 hazai cég, ahonnan rendszeresen jönnek az olvasóim. Ezek bankok, telekommunikációs és startup cégek.
A legérdekesebb statisztika mégis számomra az olvasók szakmai eloszlása. Amikor az olvasottság növelésén gondolkozom, akkor nem árt, ha el tudom dönteni kikre is célzok? Adatelemzőkre? Programozókra? Menedzserekre?
Hogy őszinte legyek, sokáig csak a sötétben tapogatóztam, de elkészítettem az alábbi táblázatot, ami alapján egy kicsit okosabb lettem.
Továbbra is azon LinkedIn posztjaimra fókuszálok, amelyek saját blog bejegyzéseimre mutattak. 7 ilyen posztom volt, ezeket 4 csoportba osztottam, az alapján hogy a blog bejegyzésnek hány olvasója volt (azaz hányan kattintottak a LinkedIn-ről a blog bejegyzésre). A táblázatban a szakmák alatti számok azt mutatják, hogy ezen szakmákból átlagosan hányan olvasták az adott csoportba tartozó posztokat. Az Extra olvasottságú csoportba (zöld sor) egy poszt esett („Mihez ért a Data Scientist”) - innen 307-en kattintottak át a blog posztra. A többi oszlopban viszont LinkedIn nézettségi (view) adatok vannak (tudom ez egy kicsit zavaró – nem tanácsolom kezdő elemzőknek, hogy alma-körte táblát készítsenek, de most sajnos meg volt kötve a kezem). Ezt a posztot pl. 44 „Analyst” látta a LinkedIn-en, 44 „BI konzulens” és így tovább.
A szakmákat megpróbáltam úgy sorbarendezni, hogy mennyire vannak közel az adatelemző szakmához. Ez nyilván nagyon szubjektív, vitatkozni is lehet vele – de volt egy másik szempont is, ami a sorrendet eldöntötte. Azt vizsgáltam, hogy mely szakmákba eső értékek korrelálnak legjobban a blog látogatottsági adatokkal (tehát a második oszloppal) – azaz mely szakmák azok, ahol ha nő a nézettség, egyben nő a blog olvasottsága is. Nos ez alapján 4 szakma tűnik jó célszegmensnek:
- Elemzők (Analyst) – nem meglepő módon
- BI konzulensek – ez se meglepő
- Projekt menedzserek és ügyvezető igazgatók – ez azért meglepő volt egy kicsit.
A többi szakmában ilyen egyenes megfeleltetés nem látszik. Azonban van egy szakma, ami óriási lehetőséget rejt számomra – a szoftver fejlesztők. Posztjaim olvasóinak többsége sokszor közülük kerül ki, de úgy tűnik, hogy bizonyos blog bejegyzéseimre egyáltalán nem rezonálnak.
GYULA FELADATA2: (a) a fenti 4 szakmából minél több embert elérni – így áttételesen növelni a blog olvasottságot, (b) szoftver fejlesztők számára új típusú posztok fejlesztése.
Még egy kérdés maradt nyitott.
3. Mennyire alkalmas kapcsolatépítésre szakmai posztok kihelyezése?
Korábban említettem, hogy volt egy speciális posztom, a „Mihez ért a Data Scientist”. A teljes történetet még nem mondtam el. A következő volt az ötlet:
- A LinkedIn-en rákerestem tőlem 1, 2 távolságra lévő datat scientistekre, adatbányászokra, AI szakértőkre
- A kapott listákból kiválasztottam 300 szakembert
- Minden szakembernek megnéztem a LinkedIn profilját, hogy milyen elemző szoftverekhez, programozási nyelvekhez értenek - ebből felépítettem egy „mini adatbázist”, amiben eltároltam a szakember nevét, jelenlegi beosztását (szakmáját), végzettségét és szakmai profilját
- A kapott adatbázison készült egy elemzés, majd az eredményeket publikáltam egy önálló blog bejegyzésben.
Napjainkban lassan egy fenyegető szitokszóvá kezd válni a „GDPR”, így biztos ami biztos alapon mindenkinek írtam egy üzenetet, hogy van ez az adatbázis, benne az Ő adataival is, mennyire zavarja ez?
Az elképzelés szép volt, de ekkor szembesültem azzal az egyszerű ténnyel, hogy csak közvetlen ismerőseimnek küldhetek üzenetet a LinkedIn-en, a 2 távolságra vagy még távolabb lévő szakembereknek így nem tudtam írni. Nem hagyott nyugodni a dolog, így egy életem egy halálom alapon, a kutatási adatbázisban szereplő összes olyan szakembert bejelöltem ismerősnek, aki addig nem volt az. Itt több mint 200 bejelölésről van szó! Legnagyobb meglepetésemre több mint 100-an elfogadták a bejelölést. Nekik megírtam az engedélykérő emailt, ami után újabb pozitív élményben volt részem – gyakorlatilag mindenki megadta az ezt, sőt a poszt megjelenése után sokan gratuláltak a blog bejegyzéshez.
Mi is történt pontosan?
A diagram ugyancsak a LinkedIn egyik szolgáltatása – heti bontásban mutatja hányan nézték meg a LinkedIn profilunkat. Jól látható, hogy a bejelölések után drasztikusan megnőtt a profilomat megtekintők száma. Azaz a többség nem automatikusan fogadta el a bejelölésemet, hanem előtte megnézték, ki is vagyok pontosan. Ebből a szempontból biztosan hasznos, ha valaki rendszeresen posztol, tesz ki anyagokat, ezáltal „érdekesebbé” teheti magát mások számára.
Mint korábban írtam, bejelölésemet sokan elfogadták, aminek tényleg nagyon örültem – de adódik a kérdés, hogy ez hogy hatott a posztjaim nézettségére.
A táblázatban posztjaim korábban ismertetett kategóriái szerepelnek. A posztokat egy kategórián belül két részre osztottam: a „Mihez ért a Data Scientist” poszt előttiekre és az utániakra (még egyszer - ne felejtsük el, hogy a bejelölések után több mint 100 új „ismerősöm” lett).
A táblázat utolsó 4 oszlopa a cikk előtti és utáni posztok átlagos like számát és view számát mutatja. A számok döbbenetesek – mind az átlagos like-ok száma, mind az átlagos view-k száma jelentősen megnőtt.
A feltett kérdésre tehát a válasz: szakmai posztok igenis segíthetnek új kapcsolatok szerzésében, és ezek az új kapcsolatok értékesek – a későbbi posztok nézettségét nagy valószínűséggel növelik.
Összefoglaló helyett
Nem tartom kizártnak, hogy jó néhány olvasó feltette magában a kérdést – hogy „oké, ez érdekes – de mit is akart ezzel a cikkel ez az ürge?”.
Először is szeretném leszögezni, hogy nem vagyok „content” szakember – nem nagyon értek a közösségi oldalak kapitalizációjához. Jómagam egyszerű (de tapasztalt) elemző vagyok, szerettem volna egy érdekes témán keresztül bemutatni, hogy érdemes felépíteni egy elemzést. Természetesen ezek csak tanácsok (nem biztos hogy meg kell fogadni). Tehát:
- Az elemzés elején emeljük ki, hogy milyen kérdés(ek)re keressük a választ!
- Utána mutassuk be az adatokat – de ne túl részletesen, csak azt emeljük ki, amiket a kérdés megválaszolásához fel fogunk használni!
- Az elemzésnek legyen íve – ha több kérdés van, akkor kezdjük az egyszerűek megválaszolásával, és utána menjünk bele a mélyebb és mélyebb elemzésekbe!
- A végére hagyjunk csattanót – azaz a legérdekesebb eredmény felé tereld a közönséget! Ne felejtsd el, hogy az utolsó benyomás a legfontosabb!
- A konklúzió mindeképpen kell a végére!
Ja igen, az utolsó ponttal még adós vagyok. Szóval mik a tanulságai az egész elemzésnek?
- Deverzifikáció – ne csak egyfajta posztokat írj ki! Esetemben a „funny” tipusú posztok jól láthatóan növelik a láthatóságomat, de ez csak eszköz arra, hogy növeljem szakmai posztjaim olvasottságát
- Visszamérés – vannak hipotézisek, amiket folyamatosan ellenőrizni kell. Esetemben az látható, hogy a láthatóságom növekedett, de ezzel párhuzamosan sajnos nem nőtt a blog bejegyzéseim olvasottsága. Ez önmagában nem baj – az adatok egyben alkalmasak arra is, hogy megoldást találjunk.
- Célkitűzés – mindig kellenek célok. Esetemben az látszik, hogy az elérhetőség növelése sikerült (ehhez kellett a „bejelölő” kampány), de most ki kell találnom, hogy ezt hogyan tudom hasznosítani a szakmai cikkeim olvasottságának növeléséhez? Most épp a fenti feladatok megoldásán gondolkozom – ígérem, az eredményekről még írni fogok.