Potrestá nás Google?

Tak mě napadlo, kdy začne Google považovat odkazy automaticky generované publikačními systémy pro blogování za spam?

Pokud sledujete diskuse, na kterých se vyjadřují ti z druhé strany (neblogující), tak se tam často objevuje názor o zaplevelování výsledků vyhledávání nerelevantními odkazy na blogy. Uznávám, že je na tom často dost pravdy. Pokud míra znechucení běžných hledajících přeroste určitou míru hrozí, že autoři vyhledávačů přistoupí k restrikcím. A na prvním místě možná sáhnou k potrestání blogů, které nabízí automaticky generované seznamy refererů nebo výstupy trackbacku.

Aby nedošlo k omylu, tak bych rád zopakoval svůj názor na úspěchy blogerů v obsazování čelních příček ve výsledcích vyhledávání (řečeno slovy představitelů minulého režimu). Nelze nic namítat, že čelní pozice jsou získány především:

  • Častým a přirozeným odkazováním.
  • Častým publikováním nových spotů.
  • Dobře napsaným kódem.
  • Používáním klíčových slov na správných místech.
  • Odkazováním z on-line RSS čteček a dalších služeb spojených s weblogy.

Co ale brání tomu, aby podobné (podle mě čestné) postupy užívali i ostatní? Brání jim v tom snad blogeři? Brání si především sami.

Změna rozložení hledaných výrazů

Každého autora nebo provozovatele webu by měly zajímat výrazy, které přivedly návštěvníky z vyhledávačů (viz SEO FAQ). Je to důležitý ukazatel toho, jak je web optimalizovaný na dané výrazy. Samotnou hodnotu počtu příchozích na daný výraz nelze brát v potaz bezhlavě. Problém je především v tom, že nevíte, kolik lidí vlastně daný výraz vůbec hledá.

Protože byl před pár týdny spuštěn nový fulltext Seznamu, snažím se vysledovat, jak se tato skutečnost projevuje na mém webu. Vedle mnoha jiných změn, se vyrovnala špička pořadí hledaných slovních spojení (výrazů, které zadali lidé do vyhledávače a pak zvolili odkaz na můj web). Více napoví graf:

Srovnání poměru 10 nejhledanějších výrazů za rok 2004 a duben 2005.

Hledané výrazy 2004 vs. duben 2005

Z grafu je zřejmé, že rok 2004 měl jednoho výrazného favorita (ten je mimochodem v dubnové statistice na 2. místě) a všechny ostatní výrazy byly pod úrovní aktuálních dubnových výrazů na stejné příčce. Podobné výsledky dostanu, když srovnám letošní duben s loňským.

Jedno z možných vysvětlení nárůstu hledaných výrazů na špičce pořadí je právě nový fulltext Seznamu. Ten starý byl spíš interním vyhledávačem katalogu než pravým fultextem. Seznam i tak přiváděl na můj web kolem 40 % návštěvníků, kteří přišli z vyhledávačů (Google mírně zaostával). Protože ale nebylo možné nacpat do popisky v katalogu Seznamu všechna klíčová slova, tak mnoho návštěvníků šlo jinam. Bity byly weby s pestrou skladbou obsahu, u kterých platilo co stránka to jiná klíčová slova. Teď to vypadá mnohem lépe.

Jaké máte zkušenosti s novým fulltextem Seznamu? Změnil se nějak poměr návštěvníků, kteří přichází z vyhledávačů? Přivádí k Vám Seznam více lidí?

Souvislosti

Seznam FAQ

Nové vyhledávání na Seznamu samozřejmě přináší řadu otázek. Abyste se nemuseli ptát stejně, jako se ptají jiní, podívejte se na oficiální stránky:

Aktualizace:Weblogy.cz jsem se dostal k odkazu na spot FAQ k novému fulltextu, jak přidat do fulltexu stránku a jak reportovat SEO spam, který Ivo Lukačovič vydal pár minut před publikováním tohoto spotu.

Co všechno se hledá

Lidé jsou vynalézaví a když hledají, tak používají nejrůznější taktiky. Čas od času je zajímavé se podívat do serverového logu, jaké výrazy přivádí návštěvníky na váš web. Já v položce Slovní spojení použité ve vyhledávači dneska našel třeba toto:

slavný astronom 16.století který přispěl k příchodu tychona brahe a studoval ve wittnberku byl profesorem hvězdářství a matematiky na univerzitě v lauingen

Jedna čárka do kolonky 23 slov ve vyhledávacím výrazu.

Interní vyhledávač

Vyhledávání na vlastním webu bez podpory skriptování na straně serveru může být docela oříšek. Oříšek se stává ořechem, když má být takové vyhledávání zdarma.

(Ne)web nebo CD

Abych Vás uvedl do obrazu, tak budu trochu konkrétnější. Představte si „web“, který:

  • neběží na webovém serveru – je to sada statických stránek (klidně může být třeba na CD),
  • není dostupné skriptování na straně serveru a databázový server – je potřeba se spolehnout jen na prohlížeč a statické soubory.

A k tomu si přidejte ještě tyto požadavky:

  • indexování by mělo být spustitelné opakovaně a automaticky (třeba prostředky Windows),
  • plná podpora češtiny (windows-1250, iso-8859) – není příjemné, když nejde hledat slova obsahující třeba ř,
  • podpora standardů – není dobré, když vyhledávání nefunguje třeba ve Firefoxu.

Když vyjdu z toho, co jsem napsal, tak nepřichází v úvahu:

  • Google a spol. – CD nebo uzavřený intranet vyhledávače nepřečtou a internet nemusí být dostupný.
  • Atomz a spol. – to je samozřejmě totéž, co jsem psal v předchozím bodě.

No a aby toho nebylo dost, tak z kola ven jdou řešení na bázi Linuxu a všeho mimo svět Windows.

Zoom Search Engine

Až dosud jsem ke své spokojenosti používat starou verzi Zoom Search Engine (1.7.0). Celé to funguje tak, že potřebujete jedno exečko, kterému nastavíte parametry v ini souboru (jde spustit třeba baťákem z windowsího plánovače). Pak je tam ještě JavaScript, který se volá z formuláře na stránce (

), a který se prohrabe 4 dat soubory vzniklými při indexaci a vrátí stránku s výsledky.

Všechno šlapalo jak hodinky až do doby, než jsem začal instalovat ve firmě Firefox. Ten totiž (spolu s Operou) nezobrazí stránku s výsledky, ale jen čeká a ukazuje prázdnou stránku. A teď nevím, jestli jsem nepřehlédl nějaké nastavení ve Firefoxu/Opeře nebo jestli je chyba v Zoomu nebo ve formuláři na intranetové stránce.

Co je k mání

Dnes jsem se díval na Search Engine Builder Standard, který ale není zdarma. To by samozřejmě nebyl tak zásadní problém, ale přece jenom je pouhých 20 indexovaných stránek ve zkušební verzi zoufale málo na seriózní otestování. Nabízí se taky nová verze Zoom Search Engine.

Doporučíte mi nějaké vhodné řešení? Jaké máte zkušenosti s podobným problémem? Nechám si poradit.