Wczoraj, to jest 14 lutego 2020 Google wprowadziło zmiany w źródle wyników wyszukiwania. Chodzi dokładnie o strukturę html w przypadku informacji o ilości znalezionych wyników (np. „Około 100 wyników (0,36 s)”).
Od strony użytkownika nic się nie zmienia, wszystko wyświetlane jest po staremu. Jednak problemy mogą mieć wszystkie systemy monitorujące site czy zindeksowanie. Wiadomo nie od dziś, że Google nie posiada API, a co za tym idzie wszystkie systemy monitorujące (w tym największe typu SemStorm.pl) korzystają z pobierania wyników poprzez standardowy interfejs wyszukiwarki. No i właśnie te systemy mogą mieć problem, dopóki nie zmienią metody pobierania ilości wyników.
Dotychczas wystarczyło pobrać zawartość div o id „resultStats”, przefiltrować i gotowe. Regułka xPath wyglądała prosto: „//div[@id = 'resultStats’]”
Teraz źródło wygląda tak:
Regułka xPath wygląda teraz następująco:
„//div[@id=’extabar’]/div/div/div/div/text()”
Zauważyłeś już te zmiany? A może Twój system jest odporny na wprowadzone wczoraj zmiany?
Ok, dzięki 🙂 Mega fajne spostrzeżenie, sprawdzę jak u mnie to wygląda 🙂
Faktycznie, dzięki 🙂 Na szczęście monitoring mam outsourcowany i się nie przejmuje drobnymi zmianami w danych SERP.
Prawdziwą zmianą była by rezygnacja z tradycyjnych stron wyników wyszukiwania na rzecz płynnego doczytywania kolejnych danych (jak na FB), ciekawe czy w Google zdecydują się na takie podejście.