Google operátory a Google dorks (Návod)

od | dec 14, 2022

Vyhľadávanie vo vyhľadávačoch často krát vykonávame intuitívne. Preto je úplne prirodzené, že užívatelia svoj hľadaný výraz opakovane preformulujú. Zmena a prepísanie hľadaného výrazu sa veľa krát deje opakovane.

Dôvod je jednoduchý. Dostať sa k presnejšiemu a relevantnejšiemu výsledku na výraz ktorý hľadáme. V niektorých prípadoch pomôže našepkávanie (“suggestion”) slovných výrazov, ktoré nám ponúkne samotný vyhľadávač.

Zmena slovného spojenia, alebo zmena poradia slov však veľa krát nestačí. Vyhľadávanie si vyžaduje priamejšiu kontrolu nad súvislosťami medzi hľadanými slovnými spojeniami. Výsledky častokrát nezodpovedajú tomu, čo hľadáme.

Výsledok vyhľadávania je dokonca ovplyvnený personalizáciou Google konta. Čo to znamená? Ak je človek prihlásený do akejkoľvek služby, napr. Gmail, sú nám podsúvané výsledky na základe nášho profilu a teda podľa toho čo sme predtým hľadali.

Faktorov, ktoré nám skresľujú výsledky, je veľa. Patrí medzi ne napríklad: geolokácia, typ zariadenia či to, aký máme navolený operačný systém. To je naozaj základné minimum.

Aby sme sa vyhli preklikávaniu jednotlivých stránok výsledkov na pomoc sa hodí dodatočné filtrovanie výsledkov. Tu prichádzajú na pomoc Google operátory.

Článok je členený do jednotlivých podkapitol. Slúži ako čiastočný návod pre prácu s Google operátormi a s pokročilými Google operátormi. Následne prinesie pár príkladov ako používať tzv. Google dorks. Po jeho prečítaní sa budete mať šancu dostať k žiadaným a omnoho hodnotnejším výsledkom omnoho ľahšie.

Čo sú google operátory

Google a jeho vyhľadávanie má vo svojej výbave špecifické výrazy. Tieto sa volajú aj Google operátory. Tých nie je až tak veľa a preto, ak si chcete uľahčiť vyhľadávanie, odporúčame vám ich zahrnúť pri vyhľadávaní do svojho repertoáru.

Spomenuté výrazy – google operátory – pomáhajú spresniť hľadaný zámer. Pomáhajú vyšpecifikovať, obmedziť, prípadne inak filtrovať výsledky k žiadanej spokojnosti za použitia dodatočných “príkazov”, prípadne ich kombinácií.

V praxi to znamená spresnenie vašej vyhľadávacej techniky tak, aby ste sa dostali k informáciám, ktoré by ste bežnou vyhľadávacou technikou nenašli.

Google dorks – Google hacking

Inou nie až takou známou technikou je používanie tzv. “Google dorks“ alebo “Google Dorking”.

“Dorking“ nie je nič iné ako použitie pokročilej syntaxe vyhľadávania na odhalenie skrytých informácií na verejne dostupných webových stránkach. “Google Dorking“ je vo svojej podstate spôsob, ako využiť známeho vyhľadávacieho giganta, Google, na identifikáciu slabých miest a nedostatkov pri nastavení zverejnených webových stránok. Napríklad ich nedostatočné zabezpečenie pred indexáciou či dohľadaniu citlivých informácií z nich, ktoré možno ďalej využiť a spracovať.

Čo je to GHDB

Áno, hádate správne. Je to skratka z anglického termínu “Google Hacking DataBase”. Jedná sa o kategóriu vyhľadávacích dopytov zadávaných do internetového vyhľadávača navrhnutých tak, aby odhalili zaujímavé a zvyčajne senzitívne informácie zverejnené na internete.

História Google dorks

Používanie “dorks” má svoje korene v roku 2002. Johnny Long (penetračný tester) hľadal konkrétne prvky webových stránok pomocou vlastných vyhľadávaní – tzv. dopytov. Časť týchto špecifických vyhľadávacích dopytov zadával pri svojom postupe práve do textového vyhľadávača Lynx.

Johnny Long sa preslávil ako aktívny autor a pomerne známy rečník k témam o počítačovej bezpečnosti. John Long sa vyprofiloval ako odborník v oblasti hackovania Google a bol jedným z prvých priekopníkov v tejto oblasti.

Ešte dodnes je zaujímavá jeho prednáška z DEFCON 13: Google Hacking for Penetration Testers, ktorá sa konala v Las Vegas 29. – 31. 2005, Na tejto konferencii dokonca vtipkoval, že ďalšia prednáška bude o Yahoo vyhľadávači.

Johnny Long o spomenutom postupe napísal aj knihu – Google Hacking for Penetration Testers. Prednáška na DEFCON nebola jediná, kde sa prezentoval.

amazon book about google hacking for penetration testers - google dorks for google

Aktuálne je dostupných cez 7000 “Google dorks” operátorov na verejne dostupnej databáze Exploit Database, pričom za rok 2022 pribudlo do tejto databázy cez 150 operátorov. Sumarizovaná a publikovaná prezentácia od Johnny Longa pod názvom Using Google as a Security Testing Tool stojí aj dnes za prezretie.

Ako používať základné a pokročilé Google operátory

Základné ale aj pokročilé operátory pomáhajú zošľachťovať a vylepšovať vaše vyhľadávanie.

Základné operátory sú zadávané súčasne spolu s ďalším slovným údajom bez medzery. Sú tu však výnimky ako napríklad pri operátore OR a | ,kde sa vyžaduje uvádzať medzeru. Ďalšou výnimkou je operátor * (hviezdička). Operátor * vyžaduje pri svojom použití za slovným spojením medzeru. V prípade, že budete používať * (hviezdičku) aj v kombinácii s ďalšími operátormi, tam sa medzera nevyžaduje. Viac nájdete na následných príkladoch nižšie.

Tak ako základné operátory aj pokročilé operátory sú vpisované do vyhľadávania (input poľa Google vyhľadávača) a sú zahrnuté ako súčasť štandardného vyhľadávacieho dopytu. Pokročilé operátory používajú syntax, ako napríklad:

operátor:vyhľadávaný_výraz

Medzi operátorom, dvojbodkou a znakom nie je žiadna medzera pre hľadaný výraz. Medzi jednotlivými operátormi sa ponecháva medzera, ale ako sme uviedli v texte vyššie, medzera sa zadáva až keď chceme použiť ďalší operátor. Dôvod je zrejmý. Pridávame ďalší príkaz pre filtrovanie výsledkov vyhľadávania.

Tvorba operátorov je jednoduchá. Kombinujete podľa potreby nasledovné operátory.

operátor1:vyhľadávaný_výraz_A operátor2:vyhľadávaný_výraz_B

Základné operátory

Spresnenie vyhľadávania je možné realizovať už aj za použitia základných operátorov. Pre zrealizovanie dodatočnej filtrácie výsledkov vám postačí ich naozaj základná kombinácia.

operátor funkcia príklad
“ ” presná zhoda “hľadaný výraz”
* akékoľvek slovo (wildcard) elon musk * twitter
vylúčenie elon musk -twitter
$ / € cena ipad $200 / ipad €200
.. rozsah hodnoty alebo dátumu ipad €200..€400 / ipad 2021..2022
OR / | kombinácie second hand | použité „knihy“
# hashtag #piestany site:twitter.com

Presná zhoda výrazu

Operátor Príklad:
“ ” “related:dennikn.sk”

Hľadanie presného výrazu na webe za pomoci umiestnenia do úvodzoviek. Úvodzovky priraďujú k hľadanému výrazu prioritu. Inak povedané: zameriavajú sa presne na daný hľadaný výraz v zátvorkách.

Popis: Zadaný operátor hľadá explicitne celý termín “related:dennikn.sk” a teda v tomto príklade samotný operátor. Pozor nemýliť si s príkazom related:nazovdomeny.sk (bez úvodzoviek). Ten hľadá súvisiace a príbuzné domény k uvedenej doméne v príkaze. Takýmto spôsobom môžete vyhľadávať aj kúsky samotného kódu, respektíve premení hľadaný príkaz, kód na slovné spojenie.
Výsledok: Nájdete takto lukratívnu a rezidentnú zmienku o Denníku N, na oficiálnom webe Google Support. Neprekáža, že sa z textu nelinkuje, zmienka z tak autoratívneho webu má svoju váhu pre podporu brandového slovného spojenia.

Akékoľvek slovo

Operátor Príklad:
* elon musk * twitter

Hľadanie akéhokoľvek slova v použitom slovnom spojení. Inými slovami jeho doplnenie medzi použité slová. Operátor je nazývaný aj ako wildcard.

Popis: Uvedený operátor dopĺňa a hľadá akékoľvek slovné spojenie medzi vyhľadávanými slovnými spojeniami.
Výsledok: Poskytuje výsledky pri akých možných témach bolo meno Elon Musk a slovnom spojení Twitter zmienené a tak dokáže odhaliť do hĺbky spracovanie tejto témy webovými stránkami, médiami, atď.

Vylúčenie

Operátor Príklad:
elon musk -twitter

Odstránenie slovného spojenia alebo iného operátora z výsledkov.

Popis: Použitie operátora je jednoduché. Dbajte aby medzi operátorom a výrazom nebola medzera. Operátor je možné použiť aj pre vyradenie domény alebo TLD domény z výsledkov napr. -twitter.com alebo “recept na halušky” -site:.sk -site:.cz pre vyradenie SK a CZ domén a hľadanie receptu na zahraničných weboch.
Výsledok: Za použitia operátoru docielite vyradenie aktuálneho buzzwordu twitter s ktorým je osoba Elon Musk aktuálne a prednostne spájaná a tak sa dozviete zmienky o iných projektoch na ktorých sa podiela.

Cena

Operátor Príklad:
$ alebo € ipad $200

Hľadanie konkrétnej ceny vo vopred definovanej mene.

Popis: Hľadaný operátor definuje (cenu) menu v ktorej hľadáte uvedený produkt.
Výsledok: Operátor poskytne ponuku webov ako Ebay a Amazon s uvedeným produktom, ale nie je dokonalý bez použitia vylučovacieho operátora, ktorý pomôže odstrániť weby s koncovkou SK. Celé znenie operátora v ideálnom príklade by bolo: ipad $200 -.sk

Rozsah číselnej hodnoty alebo dátumu

Operátor Príklad:
.. site:ifocus.sk 2018..2020

Definujete tak rozsah ceny alebo dátumu.

Popis: Operátor pri kombinácii s webovým sídlom zverejní vo výsledkoch podstránky, ktoré obsahujú dátum zverejnenia a korešpondujú s uvedeným rozsahom dátumov.
Výsledok: Poskytne tak výsledky, ktoré uverejnia v približne chronologickom poradí zverejnené, v tomto prípade historicky publikované podstránky.

Kombinácie

Operátor Príklad:
OR alebo | second hand | použité “knihy”

Použitie operátorov pre docielenie variability hľadania.

Popis: Konkrétny operátor je vhodné použiť v kombinácii s hľadanými výrazmi alebo s inými základnými operátormi.
Výsledok: Výsledky vo vyhľadávači ponúkajú webstránky zmieňujúce sa o oboch výrazoch na ich celom obsahu s dôrazom na slovo “knihy”.

Hashtag

Operátor Príklad:
# #piestany site:twitter.com

Vyhľadávanie konkrétneho hashtagu, konkrétnej stránky v indexovanej stránke

Popis: Operátor podmieňuje prednostné zahrnutie postov zo sociálnej siete Twitter.com, ktoré používajú hashtag #piestany a sú indexované vo vyhľadávači Google.sk
Výsledok: Výsledky ponúkajú všetky indexované posty sociálnej siete Twitter s použitím uvedeného hastagu. Výsledky nie sú úplne čisté a pre presné využitie je vhodné použiť s presnou zhodou a tak celý operátor znie: “#piestany” site:twitter.com.

Pokročilé operátory

Uvedené operátory pomáhajú definovať informácie viazané hlavne ku konkrétnemu webovému sídlu. V kombinácii so základnými operátormi dokážu veľmi efektívne vyfiltrovať výsledky k žiadanému výsledku.

operátor funkcia príklad
site: konkrétny web site:wikipedia.org
related: príbuzný web related:ifocus.sk
cache: dátum a čas indexácie (cachovania) cache:apple.com
define: definícia slovného výrazu define:ppc
imagesize: presná veľkosť obrázka imagesize:500×400 elon musk
inurl:/allinurl: hľadanie v ur adrese inurl:admin / allinurl:blog seo
intitle:/allintitle: hľadanie v titulke webu intitle:služby / allintitle:kontaktný formulár
intext:/allintext: hľadanie v texte webu intext:google ads / allintext:google ads skripty
inanchor:/allinanchor: hľadanie odkazu inanchor:návody / allinanchor:free pdf books
link: linkovanie na zdroj link:gorila.sk
filetype: / ext: súbor (typ súboru, extension) site:volkswagen.sk filetype:pdf

Konkrétny web

Operátor Príklad:
site: site:alza.sk “zľava”

Tento operátor prehľadáva výhradne na zvolenom webovom sídle. Dá sa efektívne skombinovať aj s iným operátorom.

Popis: Vyhľadávanie vo všetkých indexovaných podstránkach domény Alza.sk so zmienkou slovného výrazu “zľava” kdekoľvek na podstránke.
Výsledok: Výsledok vyhľadávania poskytne všetky dostupné zľavy bez percentuálneho alebo inak číselného obmedzenia. Operátor je možné použiť aj na filtrovanie výhradne napríklad slovenských domén s použitím presnej zhody.

Operátor site:.sk “príklad slova” hľadanie konkrétneho výrazu len v slovenských (SK) doménach. Vyradí tak iné, zahraničné domény, ktoré môžu “presakovať” do výsledkov Google.sk ako COM, AT, HU, CZ a podobne.

Operátor býva často použitý aj na orientačnú informáciu o počte indexovaných podstránok v Google a teda site:nazovdomeny.sk, kde pod input poľom zobrazí informáciu “About 1234 results”.

Príbuzný web

Operátor Príklad:
related: related:bbc.co.uk

Hľadanie príbuzných a inak súvisiacich domén k uvedenej doméne.

Popis: Vyhľadanie súvisiacich domén indexovaných vo vyhľadávači. Weby sú definované istou formou “tématickej príbuznosti”, ktorá ich môže radiť do podobnej skupiny pri zadaní vybraného webového sídla.
Výsledok: Zvolený príklad ponúka iné súvisiace webové sídla. V tomto prípade ponúka dostatočný počet výsledkov, keďže má dostatok dát, ktoré tento operátor vyžaduje. Pri použití v Google.sk častokrát neponúka príliš obstojné výsledky – nemá dostatok dát.

Operátor sa dá použiť aj na dohľadanie linkbuildingových príležitostí a teda webov na získanie spätného odkazu, keďže vráti do výsledkov vyhľadávania tématicky príbuzné weby.

Dátum a čas indexácie (cache)

Operátor Príklad:
cache: cache:apple.com

Zobrazenie presného času a dátumu kedy bol web zahrnutý do indexu Google (cache)

Popis: Zobrazenie údajov o poslednej snímke ktorú zrealizoval Google bot o webe v podobe posledného dátumu a času s možnosťou náhľadu plnej verzie webu, jeho iba textovej podoby alebo zdrojového kódu.
Výsledok: Dozviete sa tak presný dátum a čas indexácie. Od realizácie snímky sa pochopiteľne web mohol zmeniť a prejsť aktualizáciou.

Definícia výrazu

Operátor Príklad:
define: define:ppc

Popis: Identifikácia významu hľadaného výrazu PPC.
Výsledok: Výsledok je definícia výrazu zobrazená z webu s najlepšie popísaným významom slova. Obdobný výsledok je možné získať aj po zadaní výrazu: PPC meaning.

Presná veľkosť obrázku

Operátor Príklad:
imagesize: imagesize:500×500 “spiderman”

Presná definícia rozmeru hľadaného obrázku

Popis: Vyhľadanie obrázku o rozmere 500 pixelov na 500 pixelov pre slovo “spiderman”.
Výsledok: Zobrazenie obrázkov, ktoré zodpovedajú uvedenému rozmeru a slovnému spojeniu.

Hľadanie v URL

Operátor Príklad:
inurl:/allinurl: inurl:login / allinurl:blog python

Zobrazenie hľadaného výrazu v URL štruktúre alebo celého viacslovného výrazu v URL.

Popis: Hľadanie jedného výrazu v adrese webstránok alebo viacerých výrazov v URL adrese.
Výsledok: Výsledkom sú všetky indexované login stránky webových sídiel alebo blogy ktoré majú v URL zmienené slovo blog a python. Operátor môže poslúžiť aj na auditovanie HTTPS pripojenia. S použitím ďalšieho operátora site:cewe.sk -inurl:https identifikujeme napríklad, ktoré stránky sú ešte nezabezpečené ale zaindexované.

Hľadanie v titulke webu

Operátor Príklad:
intitle:/allintitle: intitle:kontakt / allintitle:currency converter

Zobrazenie hľadaného výrazu v titulke webu alebo celého viacslovného výrazu v titulke.

Popis: Identifikácia zaindexovaných stránok s titulkou kontakt alebo obsahujúcich slovné spojenie currency converter.
Výsledok: Výsledkom sú stránky obsahujúce titulku s textom kontakt. Stránky, ktoré sa venujú “konvertoru mien” sú korektne zobrazené vo výsledkoch po použití horeuvedeného operátora.

Hľadanie v texte webu

Operátor Príklad:
intext:/allintext: intext:chatgpt / allintext:chatgpt errors

Zobrazenie hľadaného výrazu v texte webu alebo celého viacslovného výrazu v texte.

Popis: Hľadanie v texte webu informácie o chat gpt-3 a hľadanie zmienok o chybách chat gpt-3
Výsledok: Výsledky sú popisné a relatívne presné.

Hľadanie odkazu

Operátor Príklad:
inanchor:/allinanchor: inanchor:návody / allinanchor:free pdf books

Popis: Zahrnie do výsledkov vyhľadávania webové stránky, na ktoré smerujú odkazy z iných stránok obsahujúcich v linkovanom texte výraz zadaný hneď za operátorom.
Výsledok: Výsledky sú popisné a relatívne presné.

Linkovanie na web

Operátor Príklad:
link: link:gorila.sk

Vyhľadanie domén odkazujúcich na konkrétnu webstránku

Popis: Identifikácia domén ktoré linkujú na eshop s knihami Gorila.sk
Výsledok: Výsledok je zoznam domén, ktoré linkujú na spomenutý eshop.

Typ súboru

Operátor Príklad:
filetype: alebo ext: site:ford.com filetype:pdf

Vyhľadanie konkrétneho typu súboru

Popis: Vyhľadanie pdf súboru na doméne značky Ford
Výsledok: Výsledky sú pdf dokumentácie uložené na doméne Ford.com

Google dorks príklady

Teraz si uvedieme 5 praktických príkladov ako použiť Google dorks pre dôslednú kontrolu nastavenia indexácie nedávno alebo dlhšie spusteného webu. Skontrolovať tak jeho spracovania obsahu webu Google botom.

Je pravdou, že veľa opensource CMS riešení už pokrýva základné blokovanie indexácie pomerne spoľahlivo. Často krát však pri zmene správcov webu môže dôsť k neevidovaným zmenám. Problém môže nastať aj pri použití custom CMS (napríklad v PHP programovacom jazyku), alebo nedostatočným serverovým nastavením.

Kontrola admin a login

Kontrola či nedošlo k indexácii login alebo admin sekcie spusteného webu na custom CMS riešení.

site:*.vasadomena.sk inurl:login filetype:php

Kontrola WordPressu

Používaním neoverených a neauktualizovaných pluginov sa na webe môže prihodiť dostupnosť admin sekcie. Skontrolujte nedostupnosť vašeho admin rozhrania na WordPress webe v prípade ak ste jeho defaultné znenie wp-admin už dávno nezmenili.

Problém sa týka aj iných neaktualizovaných opensource riešení. Google dork si upravte podľa adresárovej štruktúry konkrétneho CMS.

site:vasadomena.sk intitle:"Index of" wp-admin
site:vasadomena.sk inurl:/wp-admin/admin.php intitle:"Log In"
site:vasadomena.sk inurl:/wp/wp-admin/

Kontrola nechcených subdomén

Na FTP a v DNS zápisoch máte možno trošku neporiadok. Určite však nechcete aby sa vám v Google indexe zobrazovali subdoménové adresáre? Je na čase to preveriť.

site:*.vasadomena.sk

Orientačná kontrola indexácie jazykových verzií webu

Spustili ste svoj web v rozličných jazykových mutáciách? Potrebujete však aspoň orientačne skontrolovať či došlo k indexácii.

site:vasadomena.sk inurl:en

Dostupnosť dokumentov

Svoj firemný web používate ako úložisko dokumentov vo formáte PDF. Sú však na interné použitie. Čas od času pošlete link na tieto súbory svojmu obchodnému partnerovi. Áno, aj v čase uvedomelej bezpečnosti sa dejú nechcené indexácie takýchto súborov.

site:*.vasadomena.sk ext:pdf

Efektivita pri vyhľadávaní

V návode sme obsiahli najdôležitejšie operátory, ktoré Vás posunú k žiadaným výsledkom vo vyhľadávaní. Spresníte tak výsledky a odfiltrujete nepodstatné weby z výsledkov. Dodatočný výber Google operátorov s popisom funkcie a príkladom použitia nájdete na Moz.com a zoznam 42 pokročilých operátorov na Ahrefs.com.

Autor: Stan
Celým menom sa volám Stanislav Kukučka. V iFOCUS sa venujem SEO a PPC. Okrem iného sa venujem technológiám crawlingu a scrapingu a dodatočnému spracovaniu dát cez Python. V obľube mám aj vývoj webov cez alternatívne SSG (Static site generators) a ich zrýchlovanie.