Open Refine: snadná cesta k získání klíčových dat z našeptávače

V mém guestpostu se podíváme na to, jak můžeme pomocí nástroje Open Refine načíst data z našeptávače Google. Využitím této metody získáme více návrhů klíčových slov, která pak můžeme použít např. na klasifikační analýzu klíčových slov nebo je případně zapracovat do našich PPC kampaní.

Reaguji na článek o placeném nástroji z pera Zdeňka Dvořáka. Postup uvedený v tomto článku je zdarma a dojdete ke stejnému výsledku.

Abych demostroval sílu návrhů z našeptávače Google, vzal jsem data z mé série článků o analýze klíčových slov, kde jsem tagoval 12 000 dotazů. Díky postupu níže, jsem získal dalších 40 000 klíčových slov. Soubor pro náhled přikládám zde.

Konec teorie, jdeme na postup.

Co budeme potřebovat?

  1. Nástroj Open Refine. Doporučuji poslední beta verzi 2.6, ve které je odstraněna spousta chyb z předchozích verzí.
  2. Seznam slov, který budeme chtít rozšířit o návrhy z našeptávače. První návrhy můžeme čerpat z následujících zdrojů:
    1. Z vyhledávacích dotazů v rámci PPC systémů Sklik a Adwords..
    2. Z nástroje pro návrhy klíčových slov Sklik a Adwords.
    3. Z přehledu organických klíčových slov z Google Analytics (dnes již čerpáme data pouze od Seznamu), přes která lidé přišli na náš web.
    4. Z klíčových slov z Google Search Console.

Nyní nám pro ilustraci postačí 100 klíčových slov na téma ledničky. Nejedná se o všechna dostupná slova z tohoto oboru. Cílem je ukázat postup. Sami pak můžete pracovat s větším množstvím dat.

Import dat do Open Refine

Klíčová slova pro získání návrhů z našeptávače jsme si připravili a nyní je potřebujeme nahrát do Open Refine. Zvolíme si tedy vložení dat pomocí volby „Create Project“ > „Clipboard“.

Vložení klíčových slov přes Create Clipboard

Následně budeme pokračovat volbou „Next“, kde zvolíme opět „Create Project“. Nyní se nemusíme zabývat žádným zásadním nastavením, nemáme zde žádné sloupce s různými formáty a podobnými věcmi.

Vytvoření projektu a kontrola importu

Kódování klíčových slov do správného tvaru

Jakmile založíme projekt, rozbalíme volby u prvního sloupečku a vybereme „Edit column“ > „Add column based on this column“. Následně vložíme vzorec:

Výsledkem toho, co jsme doteď udělali, je transformace klíčových slov na jejich zakódovanou verzi. Proč děláme tento krok? Potřebujeme totiž klíčové slovo dynamicky dosazovat do url adresy, kde není možné používat spaciální znaky (jako je česká diakritika).

Kde najdu založení sloupce na základě jiného sloupce

Zakódování klíčového slova pro URL adresu

Načítání návrhů z našeptávače

Dostáváme se k dalšímu kroku, kdy rozbalíme sloupec „Data“ a zvolíme „Edit column“ > „Add column by fetching URLs“, kam zadáme

 

Zvolíme „Throttle delay 1000 ms“. To z toho důvodu, aby nás nástroj neodřízl za příliš požadavků v čase. Vzorec pak dosadí za „q“ do každého řádku klíčové slovo, na které se našeptávače chceme zeptat.

Kde najdu založení sloupce z externí URL

Vzorec pro vyjmutí návrhu z našeptávače

Pokud celý postup uděláme správně, měli bychom vidět tabulku podobnou té na následujícím obrázku.

Jak bude vypadat Vaše tabulka

Získání klíčových slov ve správném tvaru

Jestliže chceme získat klíčová slova z daného sloupce, použijeme vzorec „parseJson“, Přes volbu „Edit Column“ > „Add column based on this column“ vložíme následující v jazyce GREL následující:

 

Tento vzoreček vezme všechny návrhy klíčových slov z našeptávače a oddělí je středníkem. Pokud bychom chtěli dostat jedno klíčové slovo na řádku, zvolíme následně „Edit cells“ > „Split multi-valued cells“ a tam zvolíme jako oddělovač středník.

V datech se pravděpodobně objeví i duplicitní klíčová slova. Je možné je odstranit buď přímo v Open Refine, nebo až následně v Excelu.

Jak bude vypadat Vaše tabulka

Na závěr si pojďme zhodnotit, co dělá metodu získávání dat z našeptávače tak jedinečnou. Je to především fakt, že proces můžeme opakovat znovu s nově vzniklými slovy. Díky tomu získáme stovky tisíc klíčových slov, které oceníme při plánování naší online strategie a která nám podstatně rozšíří data na analýzu klíčových slov.

Pokud si někteří nechtějí vyzkoušet celý postup, jak jsem jej popisoval výše, je možné použít mojí historii operací, kterou přikládám ke stažení zde. Pokud nyní použijete tlačítko „Apply“, celou sekvenci kroků udělá Open Refine sám. To však pouze v případě, jmenuje-li se první sloupeček stejně jako můj, tedy Column 1.

Vložení historie operací do Open Refine

Soubor s historií je ke stažení zde.


Dodatečné doplnění článku ke dni 27. 7. 2015

Doplnění článku o našeptávač Seznamu

Pro načtení našeptávače Seznamu bude postup úkonů v Open Refine podobný.

  1. Rozbalíme volby u sloupečku s klíčovým slovem a zvolíme: „Edit column“ > „Add column by fetching URLs“, kam zadáme:
  2. Po načtení dat z našeptávače na nový sloupec aplikujeme:
  3. Následně Edit Cells > Split-multi-cells value a jako separátor zvolíme středník „;“.

Související články a odkazy

Zveřejněno 7.7.2015 v rubrice Internetový marketing se štítky , , , , .
kasparu

Jakub Kašparů

Spolumajitele společnosti Lynt services. Milovník sloupečků v Excelu, Universal Analytics a Open Refine. Aktivně se věnuje analýze PPC kampaní a Linkbuildingu.

@jkasparu jakub.kasparu@lynt.cz

Komentáře k článku

[1] Petr Rozkošný | 8. 7. 2015 v 20.56

Bylo by prosím možné článek rozšířit o stahování dat z našeptávače Seznam?

Díky

PR

[2] Jakub Kašparů | 10. 7. 2015 v 11.13

Jsem domluvený na rozšíření článku i o Seznam. Potřebuji to jen sepsat.

[4] Jakub Kašparů | 18. 8. 2015 v 13.11

Pořádně jsem to zatím nezkoumal, ale zatím mi Google našeptávač a moje metoda funguje. Tak buď to nějak odložili a nebo nevím.

[5] Karel Borovička | 23. 8. 2015 v 13.51

Ahoj, super postup.
Dá se nějak omezit data z našeptavače na .cz ? teď mi to háže třeba maďarštinu a tu moc nevyužiju :-)

[6] Jakub Kašparů | 23. 8. 2015 v 13.56

Karel Borovička:
Ahoj, díky.
Bohužel víc to nejde. V url adrese je nastavený jazyk hl=cs.
Je nutné si pak nějaké drobnosti pročistit.