Seznam.cz spustil nový fulltext
Patrně dnes po poledni uvedl Seznam.cz do provozu novou podobu fulltextového vyhledávání. Jak je psáno již v jiné zprávičce, změna spočívá ve způsobu uložení slov v indexu hledání.
Dříve jsme měli v databázi uložená tzv. „lemmata“ – tj. základní tvar každého zaindexovaného slova. Výhodou bylo jednodušší vyhodnocování dotazů, protože se pro každé slovo hledalo jedno lemma a ne množství různých tvarů. Toto byla paradoxně i největší nevýhoda – nebylo možné rozlišovat tvary jednoho slova, což se zvláště negativně projevovalo u slov jejichž některý tvar kolidoval s jiným dotazem.
Nové zpracování oproti tomu ukládá do databáze všechna slova v takovém tvaru, tak jak se přesně vyskytují na stránce a následně pak rozšiřuje slova dotazu o možné tvary. Vyhodnocení je o něco náročnější, ale umožňuje řídit jak se které slovo má přesně vyhledat.
Cílem tedy byla změna technologie, jejím vedlejším efektem je ale i v některých případech poměrně podstatné ovlivnění výsledků hledání. Podle převládajících reakcí uživatelů jde o změnu k lepšímu.
Spuštení nové verze se oproti původně uvedenému termínu trochu opozdilo, ten poslední zní na dnešní podvečer, konkrétně tedy na 16.9.2010 – 18:00. V tuto chvíli je ještě možné pozorovat velké výkyvy ve výsledcích obvyklé v minulých dnech, zdá se ale, že již nejde o změnu pozic, ale spíš o obnovu databáze (novější weby občas ve výsledcích chybí).
Aktualizováno 14:45: Výsledky se zdají být stabilní a nový fulltext v provozu.
Autor: Luboš Kudláček
Provozovatel Netzinu, autor knihy o WordPressu, publicista, blogger. Více na LubosKudlacek.cz