Polska wyszukiwarka internetowa dostępna już w czerwcu!

  • 30 maja, 2014
  • 12

Prace nad wyszukiwarką trwają już od dłuższego czasu, bo od 2009 roku. Do naszego użytku „Nekst” (bo tak nazywa się projekt polskiej wyszukiwarki) trafi już w czerwcu. Ma zawierać wszystkie dokumenty w języku polskim, choć początkowo „jedynie” połowę. Projekt o wartość niemal 15 mln zł finansowany jest z Programu Operacyjnego Innowacyjna Gospodarka.

Nekst nie będzie wyszukiwał jedynie słowa kluczowe, ale będzie analizował źródła pod kątem istotniejszych wyrażeń. Oznacza to, że jeśli internauta zapyta o opony, wyszukiwarka dopyta czy chodzi o opony samochodowe czy mózgowe. Będzie mogła zaserwować odpowiednie wyniki poprzez analizę kontekstu danej strony odróżniając stony motoryzacyjne od tych związanych ze zdrowiem.

Do czerwca 2014 ma być zeskanowanych około 500 milionów polskich stron i dokumentów. Właśnie wtedy ma trafić do użytkownika (naukowcy pracujący nad wyszukiwarką szacują, że wszystkich polskich stron i dokumentów jest około miliarda). Nad projektem pracuje 20 osób, a niektóre zadania są zlecane na zewnątrz. Do działania wyszukiwarki będzie trzeba utrzymać między innymi 100 serwerów.

„Wyszukiwarka będzie dobrym rozwiązaniem dla posługujących się językiem polskim internautów, którzy poszukują w sieci konkretnych informacji i nie chcą przebijać się przez morze linków, uszeregowanych głównie według ich popularności wśród internautów i dzięki zabiegom specjalistów od pozycjonowania stron w internecie.”
Źródło

Dodatkowo Nekst ma mieć wiele rozwiązań, między innymi:
– rozpoznawanie wydźwięku emocjonalnego danej wypowiedzi. Wyszukiwarka będzie rozpoznawała, czy o danym zjawisku mówi się w pozytywny czy w negatywny sposób
– rozpoznawanie plagiatów (nawet w przypadku, gdy zamieniony zostanie szyk, dodane zostaną wyrazy, lub słowa zastąpione zostaną synonimami)
– wyszukiwarka będzie mogła rozpoznawać, co jest na ilustracjach
– zwracanie linków do polskich stron na zapytania w języku angielskim i niemieckim

Stąd, jeśli Twoje strony nawiedza NextBot – nie blokuj go 😀 Możesz przyczynić się dzięki temu do zbudowania większej bazy tej polskiej wyszukiwarki. A jaka będzie w rzeczywistości? Przekonamy się pewnie w najbliższym czasie…

Więcej o projekcie znajdziesz na stronie http://nekst.ipipan.waw.pl/. Wyszukiwarka będzie dostępna pod adresem http://nekst.pl/.

Title
Caption
File name
Size
Alignment
Link to
  Open new windows
  Rel nofollow