Google utrudnia sprawdzanie zaindeksowania podstron.

Dopiero dziś zauważyłem te zmiany – moim zdaniem weszły w życie nie tak dawno temu. Dziś Google inaczej zwraca parametr site: niż wcześniej – mniej dokładnie. Jeśli w ogóle można tu mówić o jakiejkolwiek dokładności. Stąd też problemy z określeniem, czy dana strona jest w indeksie czy jej nie ma. Ilość podstron też już nie tak łatwo określić.

Będzie na przykładzie strony http://i4a.pl (reguła sprawdzana też na innych stronach).

Jak było wcześniej

Sprawdzanie zaindeksowania domeny było niezwykle banalne. Komenda site:http://i4a.pl zwracała ilość zaindeksowanych stron tej domeny (wraz z subdomenami oczywiście). Jak najbardziej była to ilość przybliżona – bo wahnięcia były czasem spore.

Sprawdzanie zaindeksowania podstrony było również niezwykle proste. Wystarczyło wpisać site:http://i4a.pl/?p=donlinkage by Google sprawdziło w swoich zasobach, czy dokładnie ta podstrona jest w indeksie. Jeśli była, po prostu wyświetlał się jeden, dokładnie ten wynik w wynikach wyszukiwania.

Jak jest teraz

Bardzo źle, żeby nie napisać brzydziej.
Sprawdzanie zaindeksowania domeny co prawda jest nadal banalnie proste jak wcześniej. Zmiany są jednak w przypadku zaglądania głębiej do domeny.

Przykład:
site:http://i4a.pl/?p=donlinkage – wiadomo jaki był kiedyś wynik takiego zapytania w przypadku zaindeksowania danej podstrony. A dziś… otrzymujemy aż 83 wyniki (występują dodatkowo wahnięcia nawet 100%)! Screen:
Lipnie to wygląda
Tak więc zadanie sprawdzenia zaindeksowania podstrony jest mocno utrudnione (trzeba szukać po wynikach, a adres może się znaleźć na samym końcu w przypadku mało znaczącej podstrony).

Ale to nie wszystko 🙂 Jest gorzej niż to wygląda. Sprawdźmy, czy mamy zaindeksowaną stronę:
site:http://i4a.pl/?p=googletogoogle (takiej strony nie ma, więc powinno dać 0 wyników). A co daje? Oto screen:
Czarna dziura...
Podstrony takiej nie ma w indeksie (wcale takiej strony nie ma), a dostaliśmy dokładnie to samo, co w przypadku zapytania http://i4a.pl/?p=donlinkage. Bez względu na to, co wpiszesz zmiast „donlinkage” – wyjdzie to samo!

Wyjaśnienie

Przy komendzie site: Google przestało przejmować się tym, co jest po znaku ? w adresie. Zmienne GET w tym przypadku Googla nie interesują. Na szczęście tam, gdzie jest zastosowany mod_rewrite wszystko zostaje po staremu. Najogólniej rzecz biorąc nazwałbym to tak, że Google ogranicza się do wyszukiwania danego pliku (nie zważa na parametry GET). Czy jest to http://i4a.pl/?p=donlinkage czy http://i4a.pl/?p=googletogoogle – wciąż wskazujemy na ten sam fizyczny plik. Na szczęście mod_rewrite rozwiązuje ten problem.

okazwłoka

Co jest grane?

5 thoughts on “Google utrudnia sprawdzanie zaindeksowania podstron.

  • Grudzień 17, 2014 at 4:00 pm
    Permalink

    Czyli pozostaje info: albo inurl: dla adresów z „GETami”. Ewentualnie cache:.

  • Grudzień 18, 2014 at 11:50 am
    Permalink

    No to Google nam serwuje w ty roku same ciekawe rozwiązania, czasami mam już ich dość. No ale ktoś od nich ma jakąś wizje i ją realizują, szkoda że tak bardzo utrudniają nam życie, i zamiast dostarczać jakościowych wyników to nie raz spotkam się ze spamem. No ale to przecież nie ich wina…

  • Grudzień 23, 2014 at 7:55 pm
    Permalink

    Google w tym roku zamieszało bardzo, chyba największe zmiany były właśnie w tym i zeszłym 2013 roku. Ciekawe co nam przyniesie 2015? 🙂

  • Grudzień 29, 2014 at 3:17 pm
    Permalink

    Tak ja tez zauważyłem to, że nijak ma się to ostatnio do rzeczywistych wyników. Myślałem jednak, że to jakieś chwilowe zawirowania związane z jakąś aktualizacją algo, jednak trwa to już dość długi okres czasu. Ja to zauważyłem gdzieś jeszcze w Październiku 🙂

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Title
Caption
File name
Size
Alignment
Link to
  Open new windows
  Rel nofollow