Unikátní obsah a duplicita na webu
Především o duplicitě textů na webu.
Jaký obsah je hodnotnější? Záleží na datu zveřejnění? Nebo na rancích? A mají zloději obsahu šanci?
Napřed malé zamyšlení…
Originalita webu nespočívá jen v jeho textovém obsahu. Jde mimo jiné o strukturu stránek a bloků. V případě webu, kde se na první stránce zobrazují úryvky posledních článků, potom také o originalitu této směsi a jejího zaměření.
Má fantazie pracovala na plné obrátky. Rozhodnut napsat co největší nesmysl, který by byl naprosto unikátní v celosvětové síti Internet, pomýšlel jsem na syndrom šedivých opic. Nakonec jsem ale nápad vzdal.
Netzin by byl stoprocentně první ve všech vyhledávačích na frázi šedivé opice, ale neznamenalo by to žádný skutečný přínos. Nebo ano? Můžeme polemizovat nad hodnotou takového webu pro vyhledávače. Má naprosto unikátní obsah, o syndromu šedivých opic byste se nikde jinde nic nedozvěděli, není to agregátor, obsah není duplicitní. Nedělal jsem ale žádné testy, kterými bych to prokázal. Měl jsem sice nějaké pár let staré blogy, kterými jsem chtěl tohle otestovat, ale nedostal jsem se k tomu, aby na ně alespoň jednou odkázal.
Který obsah u vyhledávačů zvítězí?
Ale k věci.
Chystal jsem se napsat článek, který by odsoudil duplicitu. Sesbíral jsem nějaké materiály, přečetl si co o tom píše Dušan Janovský (Seznam) a nakonec vyzkoušel konkrétní případ.
Na Netzin jsem nakopíroval tři články, rozhovory s lidmi, které jsem již před několika měsíci publikoval na webu jiném. Tento jiný web má GTPR 4 a SR 60, o těch článcích Google i Seznam ví, jsou v jejich indexech. Člověk by si pomyslel, že když z takového webu něco ukradnete, nebudete mít úspěch.
Jaké ale bylo mé překvapení, když Google ve snaze nabízet uživatelům co nejnovější obsah umístil kopie nad originál. Google nezajímá, jestli byl obsah třeba ukraden. Google prokazuje službu svým uživatelům a nabízí to nejnovější. Autor textu má smůlu.
Seznam je na tom trochu jinak. Ten totiž pro jistotu nové články zatím nenabízí, ví však o rubrice „rozhovory“ na obou webech. Tedy, v jednom případě je všechno v pořádku. Na prvním místě článek ze starého webu, na místě druhém série článků s rozhovory na Netzinu.
Ve druhém případě Seznam neindexuje ani původní článek, ví o rubrikách a tu na Netzinu nabízí první! Zloděj je tedy pro něj opět důležitější.
Zloděj (znovu zopakuju) je totiž záležitostí morálky a zákonů, jimiž se vyhledávač nemusí řídit. Vyhledávač hodnotí nějakou autoritu a „sílu“ webu.
Vezmu modelový příklad: Nějaký vědec napíše fakt zajímavý obsah, který umístí na svůj skromným způsobem zhotovený webík. Někdo jiný se starším webem mu okamžitě obsah odcizí a publikuje. Předpokládám, že Google vzhledem ke své rychlosti bude o původním obsahu vědět, jak ale ukazuju výše, nebude to moc znamenat. Seznam ten nový vědcův web možná ani nestihne zaindexovat (záleží na době, za jakou bude obsah zcizen). Ten velký web bude každopádně vyhledávači nabízen ve svých výsledcích na vyšších pozicích.
Otázkou zůstává (nedokážu na ni zatím odpovědět), jak bude situace vypadat po delší době. Za předpokladu, že vyhledávač věděl o původním obsahu dříve, měl by ho možná po nějaké době posunout zpátky na vyšší pozici. Jde přece o originál a i novější verze už bude vlastně stará. To je jedna možnost.
Může se ale také stát (možnost druhá), že vyhledávače tímto způsobem nerozlišují a novější obsah bude pořád novější a tudíž důležitější. Nějakou souhrou podmínek hodnocení konkrétních stránek se může dokonce po nějakém čase stát, že starší obsah (přestože originál) bude z indexu odstraněn jakožto duplicita.
Když už jsem zmínil Dušana Janovského, ocituju kus toho, co píše na své stránce o kanonizaci:
Když se něco takového objeví v rámci jedné domény, jsou vyhledávače benevolentnější a občas to kanonizují. Když je taková duplicita napříč různými doménami, tak je trochu zle, pak jedna z těchto stránek vypadne (většinou vypadne ta mladší nebo méně odkazovaná — problém je, když je mladší stránka odkazovanější, pak těžko říct).
A potom ještě na stránce o duplicitě a podobnosti (doporučuji přečíst):
Zbývá ještě zodpovědět častý dotaz, jak se vyhledávač rozhodne, která z těch podobných nebo duplicitních stránek je ta pravá, která patří do databáze, do indexu a do výsledků vyhledávání. Obecná odpověď neexistuje, ale v naprosté většině případů vyhrává starší obsah na stránce, která má vysoký rank (vede na ni hodně odkazů).
Pokud se rozhodnete budovat duplicitu (krást), můžete tedy uspět, když seženete dostatek zpětných odkazů. Z dlouhodobého hlediska bych na to nesázel, protože autor zcizeného obsahu se třeba bude chtít bránit a pokud neuspěje u vyhledávače, může uspět u Policie…
Závěr
Seznam v tomto konkrétním případě sám pro sebe omlouvám, protože je prostě pomalejší. Google ale podle mě přehnaně vyzdvihuje nové věci a jako autorovi se mi to nelíbí. Není všechno lepší, co je novější. A není lepším autorem ten, kdo si sežene víc zpětných odkazů.
Autor: Luboš Kudláček
Provozovatel Netzinu, autor knihy o WordPressu, publicista, blogger. Více na LubosKudlacek.cz