Ve při

Po nějaké době jsou domácí blogující opět ve při (nezaměňovat s vepři). Celou záležitost vyvolala zmínka o přednášce blogerů/našinců na vídeňském BlogTalk (Denisa Kera, Martin Kopta, Adam Javůrek, David Bureš). Následovala přestřelka mezi zúčastněnými a lidmi, kteří nerozlišili mezi pojmy prezentovat a reprezentovat.

Podle všeho Denisa prezentovala výsledky společného zkoumání domácí blogosféry (prý jsem v tom měl taky prsty). Do tohoto faktu se obul Filip Rožánek ve spotu Jen si tak trochu blognout…. Osobně nevidím nic zavrženíhodného na tom, že se dá vědecky zkoumat třeba i fenomén blogů (proč taky, když to sám dělám, že?). Nevidím taky nic špatného na tom, že je někdo bloger (protože bloguje). A ani se mi nezdá, že by někdo někoho reprezentoval (proboha, snad nejsem na nějakém seznamu agentů/blogerů).

Denisa Kera si tak trochu (dost) postěžovala na chování určitých lidí, které předcházelo a následovalo kolem zmíněné akce – Blogtalk a dozvuky. Svou odpověď přidal Martin Malý. Celkem se mi líbí přirovnání o lyžařích a výborech (ve smyslu ti výboři).

Na těchto přestřelkách mě nejvíc fascinuje, že nejvíc se hádají lidé, kteří jsou si vlastně nejvíc blízcí. Víc se štěkají blogeři mezi sebou než nepřátelé blogování a blogující. Víc se perou křesťani s muslimama (náboženství jsou si velmi podobná) než muslimové s hidnuisty (i když…). Bohužel ale i v této debatě mizí podstata problému. Problému? On vlastně ale podle mě žádný problém nikdy nebyl.

Souvislosti

Kolaps RSS?

Martin Kopta v článku Když se sdílení odkazů změní v útok DoS poukazuje na možnost nadměrného zahlcení webových serverů, ze kterých čtou RSS kanály (především) uživatelé desktopových RSS čteček. Martin cituje z článku RSS growing painsChad Dickerson:

Návaly požadavků na RSS mají veškeré charakteristiky distribuovaného útoku DoS, a to přestože požadavky jsou legální a v jednotlivosti malé, při strmém nárůstu požadavků v krátkém časovém úseku způsobují nepříjemnou zátěž serveru.

Máme se tedy bát kolapsu, který bude způsoben velkým množstvím opakovaných požadavků na RSS a Atom kanály? V úvahu je potřeba brát mnohé skutečnosti:

  • Velikost xml souboru RSS kanálu je zlomkem velikosti stránky, která se otevře po kliknutí na odkaz v RSS čtečce (docela by mě zajímala, jaká je průměrná klikatelnost na položky v RSS kanálu) – od určitého procenta je objem stahovaných stránek výraznější než je objem přenesených xml dat (v konečném důsledku pak může RSS linky šetřit).
  • Ne každý má ve čtečce nastavené automatické opakované stahování RSS kanálů (já osobně nemám refresh nastaven ani po spuštění čtečky ani automatický – vše řeším ručně). Pravdou je, že mnoho čteček mívá defaultně nastavený automatický opakovaný download a to na dost krátký interval. Autoři v budoucnu pravděpodobně toto změní, pokud na ně bude vyvinut tlak od uživatelů a potažmo i provozovatelů serverů.
  • Výkon serverů, propustnost internetu, velikost webových stránek a požadavky na stahované objemy dat (uzavřená smyčka) neustále rostou (a to nemluvím o virech, spamu a spol.). Podle mě existují větší žrouti výkonu, než je RSS (tím ale RSS riziko rozhodně nesnižuji).

Pod článkem mě zaujaly průběžné výsledky ankety o používaném typu RSS čtečky. Desktopové čtečky používá 85 % hlasujících.

Vyhledávač od BBC?

BBC prý zvažuje, že naskočí do řítícího se vlaku vyhledávání na internetu. Vyplývá to alespoň ze zprávy, kterou jsem zachytil via ABAKUS SEO Blog: BBC Eyes SearchMike McDonald.

Podle BBC je vyhledávání až příliš pod nadvládou Yankees. No uvidíme. Ještě abysme se dozvěděli, že něco lepšího měli (podle nejnovějších poznatků) už vědci v Sovětském svazu.

Nepřístupní všech zemí spojte se!

Pokud žehráte na nepřístupnost domácích webových stránek a myslíte si, jací že to jsou domácí webdesignéři nekňubové, zadržte. Nepřístupnost webových stránek je totiž, jak se zdá, úplně normální jev. Vyplývá to alespoň z těchto dvou zpráv (via Brainstorms and Raves):

Slovy klasika: tolik hrůzy, jako je v těchto dokumentech, nebylo ani ve smolných knihách středověku.

A comparative assessment…

První průzkum se zaměřil na evropské weby. Autoři vybrali z Open Directory Project několik britských, irských, německých a francouzských webů. Ty podrobily testu na způsobilost podle WCAG 1.0. Žádný (slovy žádný) testovaný web neuspěl v nejpřísnějším testu WCAG–AAA. Na stupni WCAG-AA pak pohořely všechny irské, německé a francouzské weby. Abych nebyl tak příkrý k hodnoceným webům, budu citovat:

94.0 percent of the Irish sites, 94.5 percent of the U.K. sites, 95.6 percent of the German sites and 98.6 percent of the French sites failed Bobby at the minimal accessibility level (WCAG–A).

Dobré, že? Největší problémy dělalo pravidlo o povinnosti uvádět alternativní texty ke všem obrázkům a problémy se zápisem rámců.

Výzkum se zaměřil také na validitu HTML dokumentů zkoumaných webů. Opět nechám promluvit, mými překladatelskými ústy, autory průzkumu:

Pouze 4 britské weby (méně než 0,2 %) a 6 německých webů (méně než 0,4 %) měly zcela validní HTML. Žádný irský ani francouzský web neměl zcela validní kód.

Dlužno podotknout, že většina webů pohořela na nepřítomnosti DTD. Ale nezůstalo jenom u toho. Chyby, které se vyskytovaly na více než polovině webů:

  • nedefinovaný atribut,
  • nepovolený element pro daný typ dokumentu,
  • ukončení neotevřeného elementu,
  • chybějící povinný atribut a
  • neukončený element.

Autoři průzkumu se domnívají, že za neutěšený stav může především neinformovanost tvůrců a špatné chápání významu přístupnosti. Lidově řečeno na to všichni prdí (pardon, nějak mi to ujelo – to bude tím horkem). Pravidlo napiš jednou, přečti kdekoli prostě ještě neplatí.

Assessing the accessibility of fifty US government Web pages

Druhý výzkum se zaměřil na americké vládní weby. Proč ne. Když někdo vyžaduje dodržování nějakých zásad, tak by je měl přece dodržovat nejprve sám (toliko naivní má úvaha). Jenom pro dokreslení:

  • 1 z 10 Američanů trpí nějakým těžkým postižením.
  • A bude to ještě horší: 1 z 8 dětí ve věku 6 – 14 let je na tom stejně.
  • Každý druhý Američan starší 65 let je těžce postižen.

Možná to jsou dobré argumenty pro tvorbu přístupných stránek. A jak dopadly US vládní a federální stránky. Taky nijak zvlášť slavně. Jen necelá čtvrtina získala 508 Approved v testu (přesto na nich bylo co zlepšovat). Jak říká autor průzkumu: zbývá udělat hromadu práce, aby se sen stal skutečností. Ani se neodvažuji myslet na to, jak by podobný test dopadl u nás. Zdravím, pane Mlynáři.

Weblogy CZ: Meta tagy

Další díl nepravidelného seriálu o domácích blozích jsem zaměřil na výskyt meta tagů (inspirace Whitespace). Docela mě zajímalo, jak blogeři obohacují své blogy o doplňující meta-informace.

Čelo žebříčku výskytů meta tagů vypadá takto:

  1. Content-Type – 90 % blogů obsahuje tento tag
  2. author – 52 %
  3. keywords – 50 %
  4. description – 48 %
  5. Cache-Control – 38 %

Celkem se na blozích, které byly ráno 20. 7. 2004 v padesátce nejnavštěvovanějších blogů na TOPlist, vyskytuje 40 různých meta tagů. Vedle již zmíněných meta značek stojí za pozornost snad ještě meta tagy Pragma, robots, Content-Language, copyright a Expires. Podařily se mi ale také některé exotické úlovky. Za mnohé můžu jmenovat třeba pics-label nebo page-topic.

Průměrně se na analyzovaných blozích vyskytuje 6,18 různých tagů (medián je 6). Pět blogů nemělo v kódu žádný meta tag. Dva blogy měly dokonce 17 meta tagů.

Velké, malé, malé malá, velké malá

V zápisu meta tagů nepanuje příliš velký řád. Nejčastější chyby by se daly shrnout do následujících 2 bodů:

Nedodržení velikosti písma
Normy předepisují, jak má být tag zapsán. Jak má být zapsán název tagu, jak jména atributů. Přesto jsem se setkal s variantami meta/META, name/NAME, pragma/Pragma/PRAGMA apod.
Duplicitní zápis meta tagu
V některých případech je možné zapsat meta tag stejné hodnoty daného atributu (např. při odlišení jazyka). Často se ale vyskytl případ, kdy byl meta tag zapsán opakovaně pro atribut stejné hodnoty, protože autor přehlédl, že už totéž zapsal o pár řádků výš.

Abych se přiznal, tam mi problematika velikosti písma hodnoty jména meta tagu není úplně jasná. Zatím jsem nenašel žádnou normu a jednotlivé zdroje se od sebe liší.

Meta tagy – co je co

Na závěr nabízím stručný přehled vybraných tagů meta.

Ještě před samotným popisem ale pár pravidel:

  • Meta tagy mají dva možné atributy:
    • http-equiv – zápis: – slouží jako náhrada za HTTP hlavičky generované webovým serverem (RFC1945 – HTTP/1.0 a RFC2068 – HTTP/1.1).
    • name – obecná informace.
  • Meta tagy se zapisují do sekce head (X)HTML dokumentu.
  • V případě XHTML souborů nezapomeňte uzavřít tag znakem /.
author
Obvykle jméno a příjmení autora stránky.
Cache-Control
Upravuje chování cache (ruku do ohně bych za to nedal). Může nabývat hodnot:

  • Public – může být cacheováno ve veřejných cache,
  • Private – může být cacheováno v soukromých cache,
  • no-cache – nemělo by být cacheováno,
  • no-store – může být cacheováno, ale ne archivováno.
Content-Language
Deklaruje jazyk dokumentu.
Content-Type
Typ dokumentu (obsahu) a kódování znaků. Příklady uvádí některé možnosti kódování češtiny.
apod.
copyright
Autorská práva k dokumentu.
DC.Title
Patří do rodiny Dublin Core elementů (dále např. také DC.Creator, DC.Language atd.). Další informace např. Expressing Dublin Core in HTML/XHTML meta and link elements.
description
Stručný popis obsahu stránky. Některé vyhledávače zobrazují obsah tohoto tagu ve výsledcích vyhledávání.
expires
Datum a čas, kdy by měl být obsah stránky považován za expirovaný (vypršený). Prohlížeč stránku znovu načítá až po uvedeném datu. Datum a čas musí být uvedeny v souladu s normou RFC822. Metoda není z mnoha důvodů stoprocentní (např. proto, že je hodnota uložena v cache prohlížeče ale ne už proxy serverů). Expires META Tag – obsahuje také generátor meta tagu expires.
generator
Aplikace, která daný dokument vytvořila. Tuto informaci často automaticky vkládají WYSIWYG HTML editory nebo CMS systémy.
geo.country
Rodina geo meta tagů. Určení zeměpisné polohy.
googlebot
Meta tag, který má ovlivňovat chování indexovacího robota vyhledávače Google. Remove Content from Google\’s Index.
ICBM
Určení zeměpisné polohy. Používá i tento weblog (hledejte odkaz GeoURL).
imagetoolbar
Ruší v IE plovoucí nástrojovou lištu, která se objevuje při pohybu myši nad některými obrázky.
keywords
Klíčová slova stránky. Pro externí vyhledávače nemá v současnosti prakticky význam. Může být ale užitečné např. pro interní vyhledávače nebo pro lepší orientaci autora webu.
MSSmartTagsPreventParsing
Pokud je uvedena hodnota TRUE, tak zabraňuje použití Microsoft Smart Tags na stránce. Další informace např. META name MSSmartTagsPreventParsing.
Pragma
Zabraňuje cacheování. Povolena je jediná hodnota no-cache.
rating
Hodnocení obsahu souboru. Více třeba na META name rating. Pokud vím, tak neexistuje jednotná norma na používání tohoto meta tagu. Doporučuje so používat pics-label.
reply-to
Kontaktní e-mail (dobrá potrava pro spamovací roboty).
revisit-after
Má říct indexovacímu robotu, jak často má indexovat stránku.
robots
Ovlivňuje chování indexovacích robotů na stránkách.
– roboti nebudou stránku indexovat, ale budou procházet odkazy na ní obsažené.
Problematiku je možné řešit také (lépe) pomocí souboru robots.txt.

Souvislosti

Jeseníkoš

Moje letošní letní dovolená už pomalu patří minulosti. Čtrnáct dní uteklo jako voda a zítra zase hurá(?) do práce. Další delší oddech bude až o vánocích. Po několika letech jsme vyrazili na opravdovou dovolenou, protože minulá léta patřila plně rekonstrukci našeho domečku. Letos jsme tedy konečně vyrazili mimo dům. Na týden se staly naším domovem Jeseníky.

Ubytování, strava a další služby byly na chatě Ovčárna na dobré úrovni. Když se zmíníme o počasí, tak sice obvykle sklízíme účast nad tím, jak špatné počasí nás postihlo. Teploty se pohybovaly kolem deseti stupňů. Praděd se skrýval v mlze nebo v mracích. Na turistické výpravy po okolí to ale bylo počasí jako dělané (já prostě letní parna nemám rád). V sobotu na hradě Sovinec už ale slunce peklo o stošest (akce Za čest a krále stála za návštěvu).

Tak mě při psaní tohoto spotu napadlo, že když čtu o dovolené ostatních aktivních internautů (blogeři včetně), tak se názory většinou pohybují u dvou extrémních názorů:

  • Je to překvapení, ale internet mi vůbec nechyběl.
  • Já bez toho internetu snad ani nemůžu být. Pořád jsem myslel na svůj počítač.

Pokud čekáte na to, ke kterému proudu se přidám, tak možná zklamu. Žádný e-absťák, ale ani úplné vymazání počítačů z mysli se nekonalo. Dokonce jsem v polském městě Nysa váhal, jestli nezajdu do internetové kavárny a spáchám jeden spot z ciziny.

A ještě na vysvětlenou. Když je tady Krakonoš, tak proč by nemohl existovat taky Jeseníkoš. Žádného jsme ale nepotkali. Možná někdy příště.

Bude Google přejmenován?

Kolize jmen firem nebo výrobků je poměrně častá věc. Dnes je velmi obtížné vymyslet název, který ještě neexistuje. Pokud se do střetu dostane výrobce lupínků s firmou prodávající kuličková ložiska, tak se o tom asi nikdo nedozví (navíc se právně často o žádný střet nejedná – firmy totiž působí v různých oblastech). Jiné kafe ale je, když se někdo pustí do křížku s nejvýznamnějším internetovým vyhledávaček. Google hrozí, že se bude muset přejmenovat. Název se totiž podobá dříve registrovanému jménu Googles.

Googles je dětský web. Jeho správce Stelor Productions Inc. tvrdí, že tu byl před Google. Google prý firmě Stelor Productions kazí kšeft. Celé mi to příjde takové podivné. Nedovedu si představit, jak Google ničí výrobce různobarevných potvor. Spíš jejich byznys bude kazit jejich vlastní web, ze kterého se mi načetla jenom levá navigace. Ostatní flashové opičárny mi (naštěstí) zůstaly skryty.

Tak mě napadá, že musí být docela terno vlastnit web nebo výrobek, který sice nikdo nezná a moc nekupuje, ale za pár neděl se stane proslulý díky práci někoho jiného. Pak stačí mít dostatečně silný žaludek a pustit se s gigantem do křížku. Třeba nějaký šikovný právník z obra vyrazí nějaký ten miliónek odškodného. A tohle bude asi případ Googles. Když na jejich kontě nepřistane pár melounů, tak se určitě touhle aférkou dobře zviditelní.

Souvislosti

XHTML validace skrze RSS

Ben Hammersley nabízí XHTML validaci stránek pomocí RSS (via Dan Cederholm). Do RSS čtečky stačí vložit nový kanál s adresou http://www.benhammersley.com/tools/validate.cgi?url= nasledovanou adresou stránky a výsledky validace dostanete do čtečky. Co chyba, to jedna položka ve čtečce. Vtipné a jednoduché.

Validujete při každé aktualizaci RSS kanálu validátoru. Pokud validátor nenajde chyby (a to vám ze srdce přeju), neuvidíte ve čtečce žádné nové řádky.

K dispozici je také zdrojový kód (Perl).

Souvislosti

Dovolená 2004

Za posledních pár dní se toho událo poměrně mnoho. Začala mi dovolená a začala pracovně. Plocha pro sluneční hodiny je nafajnovaná (stačí namalovat, vyznačit a připevnit gnomon). K tomu jsme přibrali také pár metrů plotu. Tři dny filcování vám vyženou myšlenky jak na práci, tak na internet a blogování. Do toho oslava mých narozenin. Prostě pohoda.

Už se těším na druhou polovinu dovolené. Doufám, že Jeseníky ukážou svou lepší tvář a nepotká nás nějaká lapálie.