Jaké jsou skutečné podíly vyhledávačů?

Seznam má 54 a Google 33 procent, hlásají poslední statistiky Navrcholu.cz. Každoroční tiskové zprávy Internet Infa jsou často považovány za důvěryhodný přehled o rozložení sil vyhledávačů na českém trhu. Ve skutečnosti jsou ale podíly fulltextů nejspíš úplně jiné.

Co je vlastně český trh?

Pokud se chceme bavit o podílech vyhledávačů na českém trhu, musíme si nejprve onen relevantní trh vymezit. Což samo o sobě není úplně triviální. Nabízí se mnoho různých možností:

Počty unikátních českých návštěvníků

Reflektuje aktivní známost jednotlivých vyhledávačů mezi uživateli. Víceméně nepoužitelné, protože uživatel brouzdající po internetu celý den je započítáván stejně jako uživatel, co se připojí večer na deset minut.

Počty zobrazených pageviews českými uživateli

Nejlépe asi počty zobrazení stránek s výsledky hledání. Klasická metoda mediálního poměřování, ovšem vyhledávače nejsou klasickým mediálním prostorem, který by byl postavený na bannerových impresích, takže pageviews jsou u nich z tohoto pohledu irelevantní. Navíc tu platí nepřímá úměra – čím horší kvalita vyhledávání, tím za jinak stejných okolností více pageviews, protože se uživatelé častěji vrací z nerelevantních stránek zpátky do výsledků hledání. To asi není měřítko, jakým bychom chtěli posuzovat tržní úspěšnost jednotlivých vyhledávačů.

Počet hledání resp. počet zadaných dotazů českými uživateli

Z mého pohledu nejlepší měřítko pro vyhodnocení podílů vyhledávačů. Počet hledání provedených českými uživateli by měl být očištěný o opakované dotazy téhož uživatele při návratu z nerelevantních webů či přechodech na další stránky výsledků.

Finanční příjmy z vyhledávání

Z pohledu vyhledávačů je jediným smysluplným dlouhodobým měřítkem řepa, kterou jim hledání vydělá. Při současných obchodních modelech by nás tedy mohl zajímat zejména poměr celkových search útrat v Adwords či Skliku, a to buď za české hledající uživatele, nebo za české inzerenty.

Počet prokliků není dobrým měřítkem

Další možností pak je počítat prokliky z výsledků hledání. To se dá sledovat na cílových webech počty příchozích uživatelů z jednotlivých vyhledávačů. Což je metoda, kterou používá právě třeba i Navrcholu.cz. Bohužel je významně ovlivněná chováním konkrétní cílové skupiny a dalšími okolnostmi, které s tržním podílem nemají nic společného:

Nekvalitní vyhledávač s méně relevantními výsledky takto získá vyšší „tržní podíl“, protože jeho uživatelé budou muset z jednoho hledání prokliknout v průměru více výsledků, než dojdou k tomu správnému.
Méně zkušení uživatelé se hůře orientují na stránkách a mohou mít sklony méně číst a více zběsile a náhodně klikat na jakékoliv i jen lehce povědomé odkazy. Nejsem bez nějakého testování schopen říct, zda to povede k menšímu (prokliknou se hned prvním odkazem pryč a už se nevrátí) či většímu (proklikají si všechno, zatímco zkušený uživatel jde rovnou na slibně vypadající odkaz) počtu celkových prokliků, každopádně to naše číslo nějak ovlivní.
Zkušenější uživatelé si často preventivně rozkliknou více výsledků do nových tabů a teprve potom je postupně procházejí, zatímco ti méně zkušení se mohou spokojit už s prvním výsledkem.
A tak podobně.

Odlišné chování různých skupin uživatelů tak může způsobit nezanedbatelné rozdíly v těchto statistikách na jednu či na druhou stranu, aniž by to cokoliv říkalo o tržním podílů jednotlivých vyhledávačů. Můj ničím nepodpožený pocitový odhad je, že celkově to jde spíš ve prospěch Seznamu a na úkor Google.

Ale to by se asi dalo s přihmouřením oka přehlédnout, kdyby kdyby tu nebyla ještě jedna věc. Vždycky je tu nějaká „ještě jedna věc“.

Nejpalčivější problém? Nereprezentativní vzorek webů!

Důležité je uvědomit si, že Seznam posílá úplně všechny své české uživatele výhradně na české weby (pomiňme teď hledání ve světě – používá to vůbec někdo?). Google posílá nemalou část z nich i jinam do světa.

Navrcholu.cz přitom měří pouze na českých webech.

Do statistiky Navrcholu.cz tedy padají naprosto všechny prokliky ze Seznamu, ale jen část prokliků z Google a dalších světových vyhledávačů!

Můžeme se teď bavit, jak velkou odchylku oproti reálnému podílu vyhledávačů všechny uvedené chyby zaviní. Já si myslím, že poměrně zásadní. A vůbec bych se nedivil, kdyby měl ve skutečnosti Google už nějakou dobu srovnatelný počet hledání českými uživateli jako Seznam. Nebo klidně i více.

Není to tržní podíl vyhledávačů

Kde ale vzít věrohodnější statistiky? Nikde. Je to smutné, ale opravdu nikde.

Hodnoty, které by nás zajímaly, vyhledávače nezveřejňují nebo dokonce ani nesledují. Všechny české měřicí systémy jsou z uvedených důvodů nepoužitelné. O mnoho lepší by byla třeba obdobná data z Google Analytics, ta ale není reálné jakkoliv získat.

Abych tedy nebyl špatně pochopen, reporty od Navrcholu.cz vůbec nezavrhuji. Právě naopak, při vší téhle bídě je to stále jeden z nejlepších dostupných zdrojů a díky za ně. Jenom je potřeba z nich číst pouze to, co tam je. Tedy z jakých vyhledávačů chodí různí uživatelé na české weby. Nic víc, nic míň.

S reálnými podíly vyhledávačů na českém trhu, tak jak alespoň já tento pojem intuitivně chápu, mají statistiky Navrcholu.cz pramálo společného.

Ostatně se sluší zdůraznit, že Internet Info nikdy ani nic jiného netvrdilo a ve svých tiskových zprávách a metodikách bylo vždy úzkostlivě přesné. Za zcestnou intrerpretaci si mohou až média a čtenáři sami.

Zveřejněno 29.1.2010 v rubrice Analytika se štítky Seznam.cz, Vyhledávače.

Jan Tichý

Honza provozuje analytickou, konzultační a vývojářskou firmu Medio Interactive. Vystudoval informační a znalostní inženýrství na VŠE v Praze, kde příležitostně přednáší o webové analytice, webdesignu a internetovém marketingu.

Google+ profil @jantichy tichy@medio.cz

Komentáře k článku

[1] Martin Šimko | 29. 1. 2010 v 18.22

Děkuji za zajímavý článek! Co se týče nezapočítávání prokliků na nečeské stránky… Není to tak správně? Český internet == česky psané weby. Proč tedy započítávat prokliky na cizojazyčné stránky. Tato „teorie“ ale zase naráží na celkový počet vyhledávání českými uživateli. Vytvořit ideální statistiku tedy asi nebude jednoduché:-)

[2] Slávek Černý | 29. 1. 2010 v 23.29

Pěkný zamyšlení, ale moc mi to nesedí. Můžu porovnat reklamní kampaně na google a seznamu. Podobný kampaně s podobným umístěním přivádějí návštěvníky v poměru který zhruba odpovídá těm číslům 54/33. Ty prokliky by zhruba mohli odpovídat počtu hledání daných slov a ty počty hledání by mohli odpovídat počtu uživatelů. Oblast vybavení koupelen se mi jeví jako poměrně neutrální téma. Takže shrnuto: ten poměr indikují i jiné statistiky.

[3] Marek Prokop | 30. 1. 2010 v 13.20

Honzo, dobrý článek. Jsem rád, že to konečně někdo napsal. Jen bych snad opravil formulaci „z jakých vyhledávačů chodí různí uživatelé na české weby“ na „z jakých vyhledávačů chodí různí uživatelé na *malé* české weby“, protože ty velké měření Navrcholu nepoužívají, ale dost hledání u nich může končit.

[1] Martine, myslím, že většina lidí interpretuje statistiku Navrcholu jako podíly hledajících uživatelů z ČR, případně (o něco správněji, ale stále chybně) jako podíly na objemu vyhledávání z ČR. Při tom si neuvědomují, že výsledky statistiky jsou zároveň ovlivněny počtem česky psaných stránek, které Seznam a Google nacházejí.

Když to dotáhnu do důsledků, tak podíl Googlu podle Navrcholu by mohl stoupat jenom tím, že by stoupal počet česky psaných stránek při konstantním podílu objemu hledání.

[2] Slávku, obávám se, že z počtu kliků v kampaních AdWords a Skliku nic moc odhadovat nejde. Šlo by to částečně leda z počtu impresí na přesné shody, ale pak by záleželo na správné konstrukci vzorku dotazů. Zatím mi není úplně jasné, jak takový vzorek sestavit.

Oblast koupelen je jednak strašně malý vzorek a jednak právě ve smyslu Honzových závěrů zřejmě vůbec neutrální není. Předpokládám, že to je obchodní web a že si Češi vybavení koupelen v zahraničí kupují minimálně.

[4] karel | 31. 1. 2010 v 11.08

Proč se nepodíváte taky na globální statistiky Toplistu? Používá ho mnohem víc lidí než Navrcholu.

http://www.toplist.cz/stat/?a=history&type=4

[5] Michal Pařízek | 2. 2. 2010 v 10.30

Hezký článek, Honzo, děkuju.

Myslíš, že někdy v budoucnu bude možné objektivně změřit podíly vyhledávačů u nás?

[6] Honza Simkanič | 2. 2. 2010 v 23.31

Výborný text, Honzo, velice inspirativní pohled. Díky za něj. Líbí se mi, jak jste pečlivě oddělil statistiky jako takové a to, jak v nich číst a co vlastně můžou ta fakta znamenat, to se bohužel moc často nestává :)

My se opravdu nesnačíme moc říkat, co ta čísla znamenají, jen konstatujeme, co nám naše statistiky ukazují. A vaše úvahy jdou směrem, který dává smysl, byť bych to možná neviděl tak jasně, že ta čísla jsou proti relatitě tolik vychýlená v neprospěch Googlu, pokud se to takto dá říct. Toplist má ty trendy a síly ve svých statistikách podobné, Google sám si dělal průzkum využití, resp. snad znalosti značky, a vyšlo mu to myslím relativně podobně, a vzhledem k tomu, že ČR je jediná evropská země, kde nemohou říkat, že jsou větší než lokální hráč, jsem přesvědčen, že by se pochlubili s tím, že se jim to podařilo zlomit. Ale kdo ví :)

[7] Martin Roman | 23. 2. 2010 v 16.21

Děkuji Vám, Honzo, za velmi profesionálně a intuitivně-inovativně zpracované téma. Zejména reflektování aktivního klasického metodologického problému s definováním relevantního pojmu „relevantní trh“ je nejen lokálně inspirativní.

Podstatné na celé věci je to, že nelze srovnávat hrušky s jablky, a příslušné statistiky mají přesně zobrazovat všemožné a různě členěné výstupy, z nichž si lze vybrat to podstatné. Pro jednoho to je počet přístupů, pro jiného strávená doba, pro dalšího průměrný počet prokliků z jednoho výsledku hledání atd. Takže držím palce a někdy se zase ozvěte.

[8] Bestmen | 2. 4. 2010 v 12.51

Google ma v Cesku podstatne mensi navstevnost nez Seznam, coz je presny opak ostatnich statu sveta – tam Google jasne vede. Osobne si myslim, ze podil Seznamu (oproti Google) je vyssi nez 54%, bohuzel. Odhaduji neco okolo 60-70%. Takovy je trend v Cesku.

[9] Honza | 3. 6. 2010 v 22.15

Ono to s těmi statistikami může být jako se sledováním Babici nebo Pohlreicha a volbou sociální demokracie. Nikdo to nechce přiznat, protože to není cool, ale tajně si všichni stejně chodí vyhledávat na Seznam, pochutnávat na kečupu a progresivně danit :-)

[10] volani.webnode.cz | 26. 10. 2010 v 16.02

Co je špatného na tom používat český fultext? Budme hrdi na to ze mame pouzitelne sluzbu schopnou konkurovat nadnarodnimu molochu :)