Zaawansowane techniki wyszukiwania w Google i Bing

0 napisany przez Tomasz Podolski, 03 lipca 2018

Ostatnimi czasy na blogu ahrefs ukazał się artykuł dotyczący zaawansowanych operatorów wyszukiwania, co skłoniło mnie do odświeżenia nieco tematu. W sumie dla każdego specjalisty SEO operatory wyszukiwania to chleb powszedni, bo je zna lub powinien znać na pamięć jak tabliczkę mnożenia.

Wielu seowców i marketerów internetowych szczególnie z młodszej generacji nigdy o nich nie słyszało i często dziwi się – jak takie rzeczy można zawęzić i wyczytać wprost z wyszukiwarki? Często również podczas tworzenia audytów czy już później na etapie przeprowadzania optymalizacji właściciel witryny pyta: skąd o tym wiecie, przecież o tym wiem tylko ja… i mój informatyk. Otóż okazuje się, że pazerne roboty Google indeksują wszystko, czego im się nie zabroni 😊 Artykuł ma na celu edukację zarówno młodych SEOwców, jak i właścicieli witryn, tak by w wynikach wyszukiwania znajdowało się to co powinno a nie dosłownie WSZYSTKO.

Dlaczego to takie ważne?

Na początku chciałbym podać kilka przykładów:

1. Publiczny backup WordPressa.

Wystarczy wpisać sobie w Google inurl:wp-config-backup.txt i wyskoczą strony, które w w wynikach wyszukiwania zawierają strony, które PUBLICZNIE pokazują nazwę bazy danych, bazę danych, hasło do bazy danych, wszystkie „salty” itd. Bardziej zaawansowani użytkownicy będą wiedzieć jakie niesie to za sobą konsekwencje, szczególnie jeżeli chodzi o względy bezpieczeństwa.

2.Publiczny dostęp do folderów na Google Drive.

Wystarczy wpisać w Google inurl:”/drive/folders/” site:drive.google.com i wyskoczą foldery na Google Drive, które przeglądnąć może KAŻDY. Modyfikując nieco zapytanie można poszukać np. plików zawierających hasła inurl:”/drive/folders/” site:drive.google.com pass. W analogiczny sposób można znaleźć też np. listy pracowników, bazy danych klientów itd.

3. Subdomeny głównej domeny hostingowej.

W bardzo łatwy sposób można sobie przejrzeć przynajmniej część klientów firm hostingowych. Wystarczy wpisać site:*.home.pl czy site:*.nazwa.pl – w subdomenach home.pl i nazwa.pl widać firmy, witryny, organizacje, które korzystają z usług hostingodawcy. Wynika to z faktu, że zakładając konto na danym hostingu najczęściej z nazwy użytkownika tworzona jest subdomena, która jest później przekierowywana na właściwą domenę. Wystarczyło by katalog z subdomeną domyślnie zrobić jako private i zwracałby kod 403 czyli forbiden. Treści nie indeksowałyby się, przez co dostęp do takich informacji byłby niemożliwy.

Tego typu przykłady można by mnożyć w nieskończoność. Publicznie dostępne bazy danych, czasami nawet całe systemy CRM, które indeksują się w wynikach wyszukiwania itd. Są to na tyle wrażliwe dane, że powinny być zabezpieczone, a robot indeksujący Google nie powinien mieć do tych zasobów jakiegokolwiek dostępu.

Popularne operatory wyszukiwania

Nie ma sensu wypisywania wszystkich operatorów wyszukiwania, bo jak komuś będzie na tym zależało w samym supporcie Google są opisane wszystkie.

Według mnie najważniejsze i najbardziej przydatne na co dzień znajdują się w poniższym zestawieniu.

1. –

Tak operator „myślnik” albo jak to niektórzy mówią „minus” pozwala na wykluczanie z wyników wyszukiwania w składanym zapytaniu wybranych słów. Np. wpisując w Google kredyt -hipoteczny

Uzyskamy wyniki wyszukiwania dla wszystkich kredytów które nie są kredytami hipotecznymi.

2. „”

Fraza umieszczona w cudzysłowie zwraca dokładny wynik wyszukiwania zawierający daną frazę. Jest to przydatne jeżeli szukamy np. konkretnego modelu danego produktu np. „Ekspres KRUPS Evidence EA8908”. W wynikach wyszukiwania pojawią się strony, które zawierają jedynie ten produkt. Osobiście korzystam z tego operatora codziennie 😊

3. site:

Operator został już wykorzystany w 2 i 3 przykładzie kilka akapitów wyżej – site:drive.google.com zwraca on wszystkie zaindeksowane adresy URL w subdomenie drive.google.com. Głownie wykorzystuje się go do sprawdzania rozmiaru strony, szukania zaindeksowanych subdomen, katalogów itd. Jako ciekawostkę powiem że można w ten sposób sprawdzić również domeny najwyższego poziomu czyli np. site:.pl czy site:.com.

Wpisanie samego operatora site: pokaże – no właśnie jak myślicie co pokaże 😊?

4. Inurl:

Jest to znacznik, który również został już wykorzystany w 1 i 2 przykładzie powyżej. Zwraca wyniki wyszukiwania zawierające ciąg słowa kluczowe w adresie URL. Ważne jest to, że przy korzystaniu z tego operatora trzeba pamiętać o nie stosowaniu spacji jeżeli szukamy konkretnego wyrażenia jak w przykładzie 1. W przypadku kiedy łączymy operator inurl: z innymi warto zastosować cudzysłów.

5. ext:

Pozwala na wyszukiwanie organiczne plików z konkretnymi rozszerzeniami np. ext:pdf pozwala na wyszukiwanie samych plików PDF. Można go zastosowań przy wyszukiwaniu wzorów dokumentów itd.

6. *

Często zapominamy o tym znaczniku, a pozwala na zastąpienie dowolnego słowa, przydaje się szczególnie przy tworzeniu zaawansowanych zapytań i wyszukiwaniu subdomen np. site:*.onet.pl

7. Info:

Zwraca informacje o adresie URL o konkretnej stronie. Np. info:https://www.4people.pl/ lub https://www.4people.pl/nasi-klienci Najczęściej wykorzystywany jest do sprawdzania czy dana strona znajduje się w indeksie wyszukiwarki. Szczególnie przydatny przy sprawdzaniu po wprowadzanych zmianach np. title czy description – czy wyszukiwarka przeindeksowała zmiany.

8. Cache:

Operator cache wyświetla stronę w wersji ostatnio pobranej przez robota. Jest to kopia strony, którą przechowuje Google. Warto czasem sprawdzić kiedy ostatnio robot był na stronie i z jaką częstotliwością ją odwiedza. Dla pozycjonerów ma również inną wartość – mianowicie po umieszczeniu linka do pozycjonowanej witryny można sprawdzić sobie czy taki link został już odnaleziony przez robota sprawdzając cache takiej witryny.

9. IP:

Jest to operator wyszukiwarki bing. Google niestety nie obsługuje tego operatora. Pozwala on na sprawdzenie witryn, które „stoją” na podanym adresie IP. Np. ip:185.204.217.248 adres hostingu hekko.pl pokazuje również inne domeny znajdujące się na tym adresie IP. Jest to szczególnie przydatne jak sprawdzamy otoczenie swojej witryny na serwerze. Na tzw. shared hostingach jeden adres IP dzielony jest przez wiele stron, czasem może się okazać, że podczas pozycjonowania witryny nie reaguje ona na nic – optymalizację, linki itd. Warto wtedy sprawdzić czy adres IP, na którym się znajduje, nie jest współdzielony z tematykami bardzo nie lubianymi przez Google, jak np. pornografia czy hazard. Zmiana IP w takich sytuacjach bywa zbawienna i strona nagle zaczyna piąć się w górę.

Według mnie to lista najbardziej przydatnych operatorów, z których praktycznie codziennie korzystam przy swojej pracy. Oczywiście składając zapytania do wyszukiwarki operatory można łączyć i tworzyć bardziej zaawansowane zapytania do wyszukiwarki, jak np. w przykładzie 2. Należy jednak pamiętać, że nie są to typowe zapytania i od czasu do czasu może wyskoczyć captcha 😊

Podsumowanie

W podsumowaniu chciałbym zwrócić uwagę na rzecz najważniejszą, mianowicie: BEZPIECZEŃSTWO. Wykorzystywanie zaawansowanych operatorów wyszukiwania może Wam pomóc w uniknięciu sytuacji z podanych przykładów, czy też zlokalizować potencjalne błędy jak np. indeksowanie subdomen np. CRM’a 😊 Moim skromnym zdaniem każdy bardziej świadomy użytkownik internetu powinien znać przynajmniej kilka takich operatorów, bo znacznie ułatwiają codzienne korzystanie z wyszukiwarki. Wyszukiwanie konkretnego typu produktów czy filtrowanie wyników wyszukiwania za pomocą operatora – (minus) o niechciane słowa kluczowe w znacznym stopniu może zaoszczędzić czas.

Jeżeli artykuł się spodobał to prosimy ładnie o łapki w górę. Jeżeli chcielibyście żeby w moich kolejnych artykułach było poruszane więcej takich „technicznych” tematów to podzielcie się tym w komentarzach.

O autorze:

Tomasz Podolski

Jako Manager SEO w 4people odpowiedzialny jest za szeroko pojęte SEO oraz pozycjonowanie. Za każdym razem podchodzi kompleksowo do marketingu internetowego. Co przez to należy rozumieć? Wykorzystuje wszystkie znane mu techniki, by klient zawsze miał najlepsze efekty.

Komentarze