Co je RSS

Dave Winer spustil minulý týden blog Really Simple Syndication. Web je určen pro netechnické uživatele, kteří chtějí proniknout do tajů RSS 2.0. Dave mj. píše:

Chtěl jsem spustit web, kde lidé z RSS uživatelské komunity mohou odpovědět na otázky, které pomohou nováčkům rozlousknout problém co dělat s RSS kanálem bez nutnosti mít doktorát z XML.

Ve druhém spotu RSS is… Dave píše, co všechno může mj. být vlastně to RSS:

  1. Formát.
  2. Nástroj pro správu obsahu, který vytváří formát.
  3. Agregátory a čtečky, pomocí kterých je možné číst RSS.
  4. Vyhledávače a nástroje, které křoupají informace a myšlenky.
  5. Služby z technologických firem jako jsou Microsoft a Apple.
  6. Významné publikace (média, vydavatelé), které publikují své novinky a názory v RSS.
  7. Mnoho tisíc weblogů viruálně pokrývajících každou stránku života na této planetě.
  8. Ohromné a rostoucí společenství myslitelů, spisovatelů, učitelů…

Souvislosti

Co ovlivňuje weblogy?

Co ovlivňuje weblogy? se ptá ve své glose na Lupě Mirek Zeman. Mirek se snaží přijít na to kam nejčastěji odkazují domácí weblogy.

V souvislosti s článkem mě napadlo rčení jak se do lesa volá, tak se z lesa pařez. Když noviny ignorují blogy, proč by blogy měly reflektovat klasická média? Vím, že je to vztah Goliáše a Davida, ale přece jenom.

Odpovíte Mirkovi na jeho otázku? V diskuzi zatím, až na jedinou odpověď, nic nezjistíte.

Puffin prohledá disk

Už pár dní je známá informace, že Google asi rok připravuje pod kódovým názvem Puffin nástroj na vyhledávání informací na lokálním disku, síťových discích i internetu.

Vyhledávání, které je součástí MS Windows, je pro potřeby běžných uživatelů nedostatečné. Název souboru si pamatuje málokdo. O hvězdičkové konvenci neví skoro nikdo. Jaká je velikost souboru? Chachacha. Normální uživatel většinou potřebuje prohledávat wordovské a excelovské soubory. Dostupné pokročilejší nástroje na vyhledávání, které umí hledat text uvnitř souborů, neuspějí. Navíc jsou klasické prostředky velmi pomalé.

Naproti tomu Google (a jiné internetové vyhledávače) zvládají to, o čem se může desktopovým nástrojům jenom zdát. Jsou pekelně rychlé, umí prohledávat obsah mnhoha typů nejrozšířenějších souborů. Od prostých textových, přes (X)HTML, DOC, XLS, PPT, RTF až po PDF nebo PS. Navíc umí různé vyhledávací kejkle (vyhledávání přesného výrazu, výskytu slov v dokumentech, podobných slov atd.). Dokumenty umí řadit tak, aby byl výsledek vyhledávání co nejlepší pro uživatele. V připravovaném vyhledávači pro lokální disky od Google nebude pochopitelně možné nasadit všechny funkce známé z webu, ale i tak to může být velmi zajímavé.

Docela by mě zajímalo, jak nakonec bude Puffin pracovat. Je pravděpodobné, že bude postupně indexovat dokumenty na discích. Výsledky bude ukládat do vlastní databáze. Výsledky pak budou rychle dostupné uživateli. Indexace je časově náročná a tak je logické, že bude využita doba, kdy je počítač nevyužitý (při zapnutém šetřiči obrazovky, při neklepání do klávesnice a nejezdění myši apod.). Dovedu si také představit, že bude Puffin lovit zapisování souborů na disk a ukládáné soubory zařadí na začátek fronty indexace.

Puffin by měl být zdarma. Trochu může vadit, že bude do výsledků vyhledávání doplňovat (asi) textovou reklamu. Třeba bude existovat nějaká placená verze nebo někdo napíše nějakou neoficiální verzi.

Google se vydává do teritoria Microsoftu. Připomínám, že Longhorn nová neustále odkládaná verze Windows, bude obsahovat výrazně vylepšené vyhledávání. Proto Google asi dá Puffin k dispozici brzo. Zajímavé bude sledovat, jak se budou tvářit představitelé Microsoftu, až se v menu Hledat objeví položka doplněná Googlem.

Co na to odborníci

Včera mi na pár otázek odpovídal Michal Illich (Jak velké je Jyxo). Dnes přidávám poslední Michalovu odpověď na otázku

Jaký je Váš názor na krok Google (vyhledávání informací na desktopu).

Desktopových vyhledávačů existuje už více a pokud vím, tak moc úspěšné nejsou. Když k tomu Google propůjčí své jméno a bude to dávat zdarma, tak se to ale jistě rozšíří. V budoucnu bude desktopové vyhledávání naprostou samozřejmostí – bude na každém počítači. Obávám se ale, že v tomhle zvítězí Microsoft – tady se nedají ty produkty příliš odlišit kvalitou, takže uživatel nebude cítit potřebu měnit to, co mu bude dodáno s operačním systémem.

Co si o projektu Google myslíte vy? Jakou zvolí Google taktiku? Bude nakonec se svým řešením úspěšný? Jak vyhledáváte informace na discích?

Souvislosti

Jak velké je Jyxo?

Vyhledávače jsou nástroje veskrze užitečné. Zajímavé je nahlédnout do jejich zákulisí. V souvislosti s připravovaným spotem jsem se zeptal Michala Illicha na pár otázek týkajících se vyhledávače Jyxo.

Jaký je zhruba poměr mezi velikostí souborů zaindexovaných stránek, velikostí textů na nich umístěných a velikostí databáze v Jyxu?

Líší se to podle typy souboru: u HTML stránek víceméně platí, že jsou tak třikrát větší než výsledná textová informace, která je používaná pro vyhledávání. U PDF a Wordu je ten poměr mnohem větší. U čistého textu (text/plain) je to samozřejmě přibližně 1:1.

Jaká je velikost databází Jyxa?

U té největší databáze – s českými stránkami – je to 300 GB (po jakési jednoduché kompresi).

Skrytí poslouchaného textu

Skrýt či neskrýt? O to tu běží. Teda vlastně neběží. David Špinar ve spotu Zneviditelnění obsahu v CSS a problém hlasových čteček odkazuje na množství článků, které popisují způsob skrývání textu v grafických prohlížečích pomocí CSS a to, jak tyto skryté texty interpretují hlasové čtečky. Použití display: none nebo visibility:hidden nemusí být to pravé ořechové.

Jak tedy správně schovávat obsah? Tak na tuto otázku najdete ve zmíněném spotu odpověď taky. David nabízí dvě možnosti:

  • Metoda pomocí vlastnosti text-indent se zápornou hodnotou.
  • Metoda absolutně pozicovaného prvku vysunutého mimo obrazovku.

Takový fulltext si strčte někam

Při hledání zdroje ke spotu Vypněte televize! Blogujte! jsem se pokusil použít fulltextové hledání na MF Dnes. Se zlou jsem se ale potázal.

Podle textu zprávy, která na mě vybafla po zadání dotazu, se nejedná o žádnou novinku. Protože jsem na MF Dnes už dlouho nehledal zůstal jsem chvíli civět na obrazovku v němém úžasu. Po odklepnutí dotazu totiž naskočila stránka s výzvou pro neregistrované uživatele. MF chce po uživatelích, aby se registrovali kvůli vyhledávání. No to snad ne! Místo toho, aby šli návštěvníkovi na ruku, tak před něj kladou překážku jako hrom. Řečmi o rozšířených možnostech a jednodušší registraci moc lidí neosloví. Autor NEWTON IT by se měl za takový postup stydět. I když to možná napadlo nějakého jiného borce. Opravdu nevím a pátrat po tom by byla ztráta času.

Pochopitelně jsem se nikam neregistroval, i když Mailinator by mi zase pomohl. Ale proč bych to dělal?. A proč by to dělaly ty tisíce dalších otrávených návštěvníků?

Vypněte televize! Blogujte!

Tímhle důrazným zvoláním oslovila publicistka Kateřina Jonášová ve středu 18. 5. 2004 na 6. straně čtenáře deníku MF Dnes (rubrika Svět médií). Článek Vypněte televize! Blogujte! neobsahuje nic nového, co by zkušený bloger neznal. Proto ho ale nespotuji. Důležité je, že se o blogování postupně začínají zajímat také klasická, v tomto případě papírová, média. No a taky se mi zdá, že článek unikl A. Javůrkovi.

Návštěvníci nám nerozumí

Mí Pražané mi rozumějí, prohlásil prý Wolfgang Amadeus Mozart. Měl k tomu jistě dobrý důvod. Hudba je univerzální vyjadřovací prostředek a Mozart byl génius. Autor webu to má určitě těžší. Přinejmenším totiž není žádný génius.

Každý autor by měl znát cílovou skupinu, pro kterou tvoří. Té musí přizpůsobit formu a hlavně obsah sdělení. Jinak nemůže očekávat úspěch. Na webu navíc těžko zajistíte, aby na vaše stránky přišel člověk, který nepatří do cílové skupiny, pro kterou jste stránky vytvořili. V tomhle to měl Mozart jednodušší. Do Stavovského asi nešel kdejaký hej nebo počkej.

Příklady táhnou

Jako příklad uvedu stránku, ze které uživatelé stahují komprimované instalace jedné aplikace. Na poměrně jednoduché stránce se nachází tento text:

Nejprve musíte stáhnout soubor s instalačním balíkem. Po stažení souboru archívu přejděte do složky na Vašem počítači, kam jste soubor uložili a rozbalte jej.

  • Spusťte instalační program, který Vás provede zbytkem instalace.
  • Pokud se jedná o upgrade, postupujte podle pokynů v přiložených textových souborech.

Aktuální verze

conVERTER 1.41

Download upgrade

conVERTER 1.40

Download instalace

Zkušený tvůrce webu najde v uvedeném textu hned několik chyb:

  • Neznámé pojmy – co je instalační balík, co je soubor archivu a co je download a upgrade?
  • Nejednotná terminologie – text odkazů v ukázce by měl odpovídat ostatním termínům na dané stránce a celém webu.
  • Chybějící informace – ne každý ví, že ve stavovém řádku je u odkazů zobrazován cíl odkazu, podle kterého lze poznat typ souboru. K odkazům je nanejvýš vhodné doplnit typ stahovaných souborů a jejich velikost.

Možná namítnete, že každý uživatel PC ví, co zmíněné pojmy znamenají. Ale nenechejte se mýlit. Zrovna včera jsem dostal e-mail, kde mě nešťastný uživatel žádá o pomoc (ptá ce střeba co mám stáhnout dříve: instalační balík nebo soubor archívu). A já se mu nedivím a ani si o něm nic špatného nemyslím. Nepatřím k těm, kteří by ze svých nedostatků vinili neznalé uživatele.

Trnitá je cesta k porozumění

Myslete především na ty, kteří na vaše stránky chodí. Nejedná se totiž jenom o členy cílové skupiny. Na stránky přichází i lidé, kteří nejsou znalostně na úrovni daných stránek. Pomozte jim třeba tak, že stránky budou:

  • Jednoduché – vyhýbejte se dlouhým a složitým větám. Jděte přímo k jádru věci.
  • Přehledné – volte přiměřený design stránek, text dělte do odstavců, používejte nadpisy.
  • Jednoznačné – používejte jednotné pojmy, podtrhávejte odkazy, nepodtrhávejte texty, které odkazy nejsou.
  • Srozumitelné – piště česky (kde je možné užít českého slova nepoužívejte slova cizí).

A je toho samozřejmě víc. Ale odměnou může být vědomí, že mí návštěvníci mi rozumějí.

Findability.org

Findability.org je web určený pro všechny, kteří chtějí, aby byl jejich web dobře nalezitelný (via Digital Web Magazine). Jeho autor Peter Morville o webu říká:

Všudypřítomná nalezitelnost ukazuje svět, ve kterém můžeme najít kohokoli nebo cokoli odkudkoli a kdykoli.

Na webu najdete množství zajímavých odkazů a návodů na vylepšení webu. Doporučuji k přečtení a ke studiu.