Interní vyhledávač

Vyhledávání na vlastním webu bez podpory skriptování na straně serveru může být docela oříšek. Oříšek se stává ořechem, když má být takové vyhledávání zdarma.

(Ne)web nebo CD

Abych Vás uvedl do obrazu, tak budu trochu konkrétnější. Představte si „web“, který:

  • neběží na webovém serveru – je to sada statických stránek (klidně může být třeba na CD),
  • není dostupné skriptování na straně serveru a databázový server – je potřeba se spolehnout jen na prohlížeč a statické soubory.

A k tomu si přidejte ještě tyto požadavky:

  • indexování by mělo být spustitelné opakovaně a automaticky (třeba prostředky Windows),
  • plná podpora češtiny (windows-1250, iso-8859) – není příjemné, když nejde hledat slova obsahující třeba ř,
  • podpora standardů – není dobré, když vyhledávání nefunguje třeba ve Firefoxu.

Když vyjdu z toho, co jsem napsal, tak nepřichází v úvahu:

  • Google a spol. – CD nebo uzavřený intranet vyhledávače nepřečtou a internet nemusí být dostupný.
  • Atomz a spol. – to je samozřejmě totéž, co jsem psal v předchozím bodě.

No a aby toho nebylo dost, tak z kola ven jdou řešení na bázi Linuxu a všeho mimo svět Windows.

Zoom Search Engine

Až dosud jsem ke své spokojenosti používat starou verzi Zoom Search Engine (1.7.0). Celé to funguje tak, že potřebujete jedno exečko, kterému nastavíte parametry v ini souboru (jde spustit třeba baťákem z windowsího plánovače). Pak je tam ještě JavaScript, který se volá z formuláře na stránce (

), a který se prohrabe 4 dat soubory vzniklými při indexaci a vrátí stránku s výsledky.

Všechno šlapalo jak hodinky až do doby, než jsem začal instalovat ve firmě Firefox. Ten totiž (spolu s Operou) nezobrazí stránku s výsledky, ale jen čeká a ukazuje prázdnou stránku. A teď nevím, jestli jsem nepřehlédl nějaké nastavení ve Firefoxu/Opeře nebo jestli je chyba v Zoomu nebo ve formuláři na intranetové stránce.

Co je k mání

Dnes jsem se díval na Search Engine Builder Standard, který ale není zdarma. To by samozřejmě nebyl tak zásadní problém, ale přece jenom je pouhých 20 indexovaných stránek ve zkušební verzi zoufale málo na seriózní otestování. Nabízí se taky nová verze Zoom Search Engine.

Doporučíte mi nějaké vhodné řešení? Jaké máte zkušenosti s podobným problémem? Nechám si poradit.

Bude to Textpattern?

Ranní ptáče dál doskáče (a víc sežere a dřív zdechne, praví klasik). Ráno jsem vyskočil rovnýma nohama z postele a vyzkoušel jsem nainstalovat Textpattern. Instalace proběhla bez problémů (tak jak všechny mé předešlé instalace různých CMS). Přihlásil jsem se do administrace a bác ho:

Warning: article_edit(): Unable to access /DISK2/WWW/converter.cz/blog/txp/textpattern/lib/classTextile.php in /DISK2/WWW/converter.cz/blog/txp/textpattern/include/txp_article.php on line 274Warning: article_edit(/DISK2/WWW/converter.cz/blog/txp/textpattern/lib/classTextile.php): failed to open stream: No such file or directory in /DISK2/WWW/converter.cz/blog/txp/textpattern/include/txp_article.php on line 274Warning: article_edit(): Failed opening \’/DISK2/WWW/converter.cz/blog/txp/textpattern/lib/classTextile.php\‘ for inclusion (include_path=\‘.\‘) in /DISK2/WWW/converter.cz/blog/txp/textpattern/include/txp_article.php on line 274Fatal error: Cannot instantiate non-existent class: textile in /DISK2/WWW/converter.cz/blog/txp/textpattern/include/txp_article.php on line 275

Textpattern umí importovat z b2. Je čistě ze zvědavosti jsem spustil migrační proceduru a následovaly další chyby, které opět odkazují na ./lib/classTextile.php. Tak se asi zase uklidním a na nějakou dobu se vrátím k odmazávání spamu.

Přechod na nový CMS?

Přechod na nový publikační systém je riskantní záležitost. Zvlášť, když máte několik set položek v databázi starého systému. Tento týden tohle martýrium zažívám na vlastní kůži.

Mám rád věci, které fungují. Svůj stávající publikační systém b2 mám velmi dobře zabydlený. Upravil jsem si šablony a rozšířil jsem jej o několik užitečných funkcí. Nebýt komentářového spamu, tak jsem spokojený. A právě komentářový spam urychlil mé rozhodnutí přejít na nový CMS.

Jaký CMS zvolit

Hlavním požadavkem na nový CMS byla jeho schopnost bezproblémové migrace dat z b2. Systémů, které to umí je několik. Jako nejvýhodnější se mi jevilo využít následníků b2. V podstatě jsem volil mezi systémy WordPress a b2evolution. Spíš srdce rozhodlo o tom, že volba padla na WordPress.

Jak už jsem napsal, tak import z b2 umí i jiné systémy (já se díval na BLOG:CMS, ale první dojem ve mně nevzbudil chuť na něj přejít). Jaké peripetie jsem tento týden vlastně prožil?

WordPress

WordPress je oficiální nástupce systému b2. Od začátku byl mým favoritem. Hlavní důvody byly:

  • deklarace snadné instalace a snadného přechodu z b2,
  • antispam,
  • verze vyšší než 1,
  • oficialita prohlášení o nástupnictví,
  • šedá se mi líbí.

Nelenil jsem a stáhl aktuální stabilní verzi 1.2.2. Přes víkend jsem se začetl do dokumentace (sic!), podíval se na strukturu systému, začetl se do fóra a začal jsem chystat šablony. Překlopení jsem plánoval na první únorový víkend. Další atak spamerů mé konání urychlil.

A teď začíná kalvárie s WordPress. Lehce jsem zneklidněl, když jsem našel několik různých trablšůtingů na problémy s migrací. Vybral jsem si postup přímo od zdroje a jal se instalovat. Samozřejmě jsem zazálohoval databázi (resp. jsem vytvořil novou databázi jako kopii b2 produkční databáze. A pak následovala instalace WordPressu. Vše proběhlo velmi hladce. Nový uživatel se nemusí ničeho bát. Já se ale pokoušel importovat data z b2 snad deseti způsoby. Nic se nezadařilo.

Pak jsem na to šel od lesa. Překopíroval jsem databázi do nové. Do instalace WordPress jsem vložil upravený soubor b2config.php (nikde v souborech WordPress jsem nenašel, odkud že se má kopírovat – tak pro sichr). Upravil jsem wp-config.php ($table_prefix). A jel jsem podle tohoto návodu. Vše prošlo hladce. Přidal jsem upravený soubor index.php, nastavil češtinu. Vše se zdá OK (jenom kategorie se jaksi nepřenesly).

Potěšen tímto grandiózním úspěchem jsem se pustil do sepsání prvního spotu na téma, jak jsem změnil CMS. Dávám Write, píšu spot (ach ty rozšířené možnosti editace) a dávám Publish. Přeskakuji na stránku conBLOGu a dávám refresh. Nic se nezměnilo. Auvajs. Jdu zpátky do administrace. Dívám se na stránku Edit. Žádná nová položka. Spot je v propadlišti dějin. Auvajs, auvajs. Že by nějaký problém v konfiguraci? Špatně zadané časové pásmo? Nevím. Hledám, pátrám, dotaz do fóra dávám. Vše marné. Asi ten import nedopadl jak měl. b2evolution to prý umí líp.

b2evolution

b2evolution je taky potomek starého b2. Zlý jazykové by mohli říct, že je to levoboček. Ale instalace a import dat proběhla bez problémů. b2evolution při importu z b2 nabídne formulář, kam se zadají parametry stávající databáze b2 a data se přesypou do nových tabulek. Původní tabulky zůstanou netknuty. Tak se taky stalo.

Ráno jsem ještě narychlo nasadil defaultní index.php. A nastaly problémy s češtinou (z racionálních důvodů používám windows-1250). Nejdřív nebyla dobře zobrazena celá stránka. Zásah do šablony situaci napravil. Titulka je na první pohled zobrazena dobře. Teď ještě zkouška komentářů. Ouha. Komentáře si neporadí s některými českými znaky. A jak tak roluju na starší namigrované spoty, tak jsou tam některé české znaky taky domršené. Posuďte sami (omlouvám se, ale na komentáře v b2evolution se nedostanete – hází to na b2) a jestli můžete, tak poraďte.

b2

Dva neúspěchy (možná způsobené chvatným přechodem na nové systémy, možná mou lamovitostí, možná i těmi systémy) mě donutili srazit paty a pokorně přepnout zpět na b2. Spam nespam. Starý CMS nestarý CMS. Výsledek snažení je návrat k b2 a nepořádek v adresáři na FTP. Asi to budu muset vydýchat a znovu začnu o víkendu.