Prace nad wyszukiwarką trwają już od dłuższego czasu, bo od 2009 roku. Do naszego użytku „Nekst” (bo tak nazywa się projekt polskiej wyszukiwarki) trafi już w czerwcu. Ma zawierać wszystkie dokumenty w języku polskim, choć początkowo „jedynie” połowę. Projekt o wartość niemal 15 mln zł finansowany jest z Programu Operacyjnego Innowacyjna Gospodarka.
Nekst nie będzie wyszukiwał jedynie słowa kluczowe, ale będzie analizował źródła pod kątem istotniejszych wyrażeń. Oznacza to, że jeśli internauta zapyta o opony, wyszukiwarka dopyta czy chodzi o opony samochodowe czy mózgowe. Będzie mogła zaserwować odpowiednie wyniki poprzez analizę kontekstu danej strony odróżniając stony motoryzacyjne od tych związanych ze zdrowiem.
Do czerwca 2014 ma być zeskanowanych około 500 milionów polskich stron i dokumentów. Właśnie wtedy ma trafić do użytkownika (naukowcy pracujący nad wyszukiwarką szacują, że wszystkich polskich stron i dokumentów jest około miliarda). Nad projektem pracuje 20 osób, a niektóre zadania są zlecane na zewnątrz. Do działania wyszukiwarki będzie trzeba utrzymać między innymi 100 serwerów.
„Wyszukiwarka będzie dobrym rozwiązaniem dla posługujących się językiem polskim internautów, którzy poszukują w sieci konkretnych informacji i nie chcą przebijać się przez morze linków, uszeregowanych głównie według ich popularności wśród internautów i dzięki zabiegom specjalistów od pozycjonowania stron w internecie.”
Źródło
Dodatkowo Nekst ma mieć wiele rozwiązań, między innymi:
– rozpoznawanie wydźwięku emocjonalnego danej wypowiedzi. Wyszukiwarka będzie rozpoznawała, czy o danym zjawisku mówi się w pozytywny czy w negatywny sposób
– rozpoznawanie plagiatów (nawet w przypadku, gdy zamieniony zostanie szyk, dodane zostaną wyrazy, lub słowa zastąpione zostaną synonimami)
– wyszukiwarka będzie mogła rozpoznawać, co jest na ilustracjach
– zwracanie linków do polskich stron na zapytania w języku angielskim i niemieckim
Stąd, jeśli Twoje strony nawiedza NextBot – nie blokuj go 😀 Możesz przyczynić się dzięki temu do zbudowania większej bazy tej polskiej wyszukiwarki. A jaka będzie w rzeczywistości? Przekonamy się pewnie w najbliższym czasie…
Więcej o projekcie znajdziesz na stronie http://nekst.ipipan.waw.pl/. Wyszukiwarka będzie dostępna pod adresem http://nekst.pl/.
Czekam ale rynek dla nowych wyszukiwarek jest bardzo trudny.
Ciekawa innowacja, chociaż z opisu nie wydaje mi się, żeby ta wyszukiwarka odniosła komercyjny sukces. Mimo to mam nadzieję, że pomoże przynajmniej pewnej grupie osób.
Fajnie, bierzesz w tym może udział? Kiedyś nam na PWRze ktoś nawet o tym coś wspominał. Mam tylko niestety obawę, że tak jak wiele projektów akademickich jego głównym celem było wyciągnięcie funduszy i bardziej traktowanie tego jako projekt badawczy do wykorzystania przede wszystkim w kontekście nauki, a nie np. rozrywki (z tego co pamiętam, to tutaj też duży nacisk kładziony jest na wyszukiwanie w dokumentach typu pdf, a nie tylko htmlkach).
Niestety jeśli nie ma ciśnienia na zwrot inwestycji, modelu biznesowego i marketingowego (a widząc tę stronę projektu to na 90% nie ma, szczególnie jak widzę większość prowadzących, którzy mnie uczyli i niestety biznesowego zmysłu raczej nie mają), projekt dla zwykłego Kowalskiego będzie tylko ciekawostką.
Jestem ciekaw czy z wyszukiwarki będzie się dało logicznie działać. Życzę powodzenia 🙂
No i super, jak by się to rozwinęło w coś większego, to mogłoby być ciekawie na naszym rodzimym rynku.
Jestem niezwykle ciekawy to co pokaże nam się nowego w tym imponującym przedsięwzięciu. Czy ktoś wie, dokładnie kiedy nowa wyszukiwarka będzie aktywna?
Obawiam się, że będzie to tylko kolejna internetowa ciekawostka, bez realnego przełożenia na rynek, w tym wypadku rynek wyszukiwarek. Tym niemniej projektowi życzę powodzenia, zawsze to jakaś alternatywa dla wielkiego G 🙂
Oby tylko Nekst nie indeksował jak NetSprint, bo prędzej będzie blokowany niż dopuszczony do strony.
Nekst indeksuje już dawno – nie widziałem żeby ludzie się skarżyli na nekstbota.
Skoro na razie brak o nieposkromionym głodzie = zbyt intensywnym idenskowaniu danej strony to super.
Pozostaje trzymać kciuki za rodzimy projekt!
Nekst jako fragment treści strony podaje chyba pierwszą treść na jaką natrafi na stronie. W naszych warunkach jest to bardzo często informacja o cookies, co średnio zachęca do odwiedzenia strony.