Další díl nepravidelného seriálu o domácích blozích jsem zaměřil na výskyt meta tagů (inspirace Whitespace). Docela mě zajímalo, jak blogeři obohacují své blogy o doplňující meta-informace.

Čelo žebříčku výskytů meta tagů vypadá takto:

  1. Content-Type – 90 % blogů obsahuje tento tag
  2. author – 52 %
  3. keywords – 50 %
  4. description – 48 %
  5. Cache-Control – 38 %

Celkem se na blozích, které byly ráno 20. 7. 2004 v padesátce nejnavštěvovanějších blogů na TOPlist, vyskytuje 40 různých meta tagů. Vedle již zmíněných meta značek stojí za pozornost snad ještě meta tagy Pragma, robots, Content-Language, copyright a Expires. Podařily se mi ale také některé exotické úlovky. Za mnohé můžu jmenovat třeba pics-label nebo page-topic.

Průměrně se na analyzovaných blozích vyskytuje 6,18 různých tagů (medián je 6). Pět blogů nemělo v kódu žádný meta tag. Dva blogy měly dokonce 17 meta tagů.

Velké, malé, malé malá, velké malá

V zápisu meta tagů nepanuje příliš velký řád. Nejčastější chyby by se daly shrnout do následujících 2 bodů:

Nedodržení velikosti písma
Normy předepisují, jak má být tag zapsán. Jak má být zapsán název tagu, jak jména atributů. Přesto jsem se setkal s variantami meta/META, name/NAME, pragma/Pragma/PRAGMA apod.
Duplicitní zápis meta tagu
V některých případech je možné zapsat meta tag stejné hodnoty daného atributu (např. při odlišení jazyka). Často se ale vyskytl případ, kdy byl meta tag zapsán opakovaně pro atribut stejné hodnoty, protože autor přehlédl, že už totéž zapsal o pár řádků výš.

Abych se přiznal, tam mi problematika velikosti písma hodnoty jména meta tagu není úplně jasná. Zatím jsem nenašel žádnou normu a jednotlivé zdroje se od sebe liší.

Meta tagy – co je co

Na závěr nabízím stručný přehled vybraných tagů meta.

Ještě před samotným popisem ale pár pravidel:

  • Meta tagy mají dva možné atributy:
    • http-equiv – zápis: – slouží jako náhrada za HTTP hlavičky generované webovým serverem (RFC1945 – HTTP/1.0 a RFC2068 – HTTP/1.1).
    • name – obecná informace.
  • Meta tagy se zapisují do sekce head (X)HTML dokumentu.
  • V případě XHTML souborů nezapomeňte uzavřít tag znakem /.
author
Obvykle jméno a příjmení autora stránky.
Cache-Control
Upravuje chování cache (ruku do ohně bych za to nedal). Může nabývat hodnot:

  • Public – může být cacheováno ve veřejných cache,
  • Private – může být cacheováno v soukromých cache,
  • no-cache – nemělo by být cacheováno,
  • no-store – může být cacheováno, ale ne archivováno.
Content-Language
Deklaruje jazyk dokumentu.
Content-Type
Typ dokumentu (obsahu) a kódování znaků. Příklady uvádí některé možnosti kódování češtiny.
apod.
copyright
Autorská práva k dokumentu.
DC.Title
Patří do rodiny Dublin Core elementů (dále např. také DC.Creator, DC.Language atd.). Další informace např. Expressing Dublin Core in HTML/XHTML meta and link elements.
description
Stručný popis obsahu stránky. Některé vyhledávače zobrazují obsah tohoto tagu ve výsledcích vyhledávání.
expires
Datum a čas, kdy by měl být obsah stránky považován za expirovaný (vypršený). Prohlížeč stránku znovu načítá až po uvedeném datu. Datum a čas musí být uvedeny v souladu s normou RFC822. Metoda není z mnoha důvodů stoprocentní (např. proto, že je hodnota uložena v cache prohlížeče ale ne už proxy serverů). Expires META Tag – obsahuje také generátor meta tagu expires.
generator
Aplikace, která daný dokument vytvořila. Tuto informaci často automaticky vkládají WYSIWYG HTML editory nebo CMS systémy.
geo.country
Rodina geo meta tagů. Určení zeměpisné polohy.
googlebot
Meta tag, který má ovlivňovat chování indexovacího robota vyhledávače Google. Remove Content from Google\’s Index.
ICBM
Určení zeměpisné polohy. Používá i tento weblog (hledejte odkaz GeoURL).
imagetoolbar
Ruší v IE plovoucí nástrojovou lištu, která se objevuje při pohybu myši nad některými obrázky.
keywords
Klíčová slova stránky. Pro externí vyhledávače nemá v současnosti prakticky význam. Může být ale užitečné např. pro interní vyhledávače nebo pro lepší orientaci autora webu.
MSSmartTagsPreventParsing
Pokud je uvedena hodnota TRUE, tak zabraňuje použití Microsoft Smart Tags na stránce. Další informace např. META name MSSmartTagsPreventParsing.
Pragma
Zabraňuje cacheování. Povolena je jediná hodnota no-cache.
rating
Hodnocení obsahu souboru. Více třeba na META name rating. Pokud vím, tak neexistuje jednotná norma na používání tohoto meta tagu. Doporučuje so používat pics-label.
reply-to
Kontaktní e-mail (dobrá potrava pro spamovací roboty).
revisit-after
Má říct indexovacímu robotu, jak často má indexovat stránku.
robots
Ovlivňuje chování indexovacích robotů na stránkách.
– roboti nebudou stránku indexovat, ale budou procházet odkazy na ní obsažené.
Problematiku je možné řešit také (lépe) pomocí souboru robots.txt.

Souvislosti