Další díl nepravidelného seriálu o domácích blozích jsem zaměřil na výskyt meta tagů (inspirace Whitespace). Docela mě zajímalo, jak blogeři obohacují své blogy o doplňující meta-informace.
Čelo žebříčku výskytů meta tagů vypadá takto:
- Content-Type – 90 % blogů obsahuje tento tag
- author – 52 %
- keywords – 50 %
- description – 48 %
- Cache-Control – 38 %
Celkem se na blozích, které byly ráno 20. 7. 2004 v padesátce nejnavštěvovanějších blogů na TOPlist, vyskytuje 40 různých meta tagů. Vedle již zmíněných meta značek stojí za pozornost snad ještě meta tagy Pragma, robots, Content-Language, copyright a Expires. Podařily se mi ale také některé exotické úlovky. Za mnohé můžu jmenovat třeba pics-label nebo page-topic.
Průměrně se na analyzovaných blozích vyskytuje 6,18 různých tagů (medián je 6). Pět blogů nemělo v kódu žádný meta tag. Dva blogy měly dokonce 17 meta tagů.
Velké, malé, malé malá, velké malá
V zápisu meta tagů nepanuje příliš velký řád. Nejčastější chyby by se daly shrnout do následujících 2 bodů:
- Nedodržení velikosti písma
- Normy předepisují, jak má být tag zapsán. Jak má být zapsán název tagu, jak jména atributů. Přesto jsem se setkal s variantami meta/META, name/NAME, pragma/Pragma/PRAGMA apod.
- Duplicitní zápis meta tagu
- V některých případech je možné zapsat meta tag stejné hodnoty daného atributu (např. při odlišení jazyka). Často se ale vyskytl případ, kdy byl meta tag zapsán opakovaně pro atribut stejné hodnoty, protože autor přehlédl, že už totéž zapsal o pár řádků výš.
Abych se přiznal, tam mi problematika velikosti písma hodnoty jména meta tagu není úplně jasná. Zatím jsem nenašel žádnou normu a jednotlivé zdroje se od sebe liší.
Meta tagy – co je co
Na závěr nabízím stručný přehled vybraných tagů meta.
Ještě před samotným popisem ale pár pravidel:
- Meta tagy mají dva možné atributy:
- Meta tagy se zapisují do sekce
head
(X)HTML dokumentu. - V případě XHTML souborů nezapomeňte uzavřít tag znakem
/
.
- author
- Obvykle jméno a příjmení autora stránky.
- Cache-Control
- Upravuje chování cache (ruku do ohně bych za to nedal). Může nabývat hodnot:
- Public – může být cacheováno ve veřejných cache,
- Private – může být cacheováno v soukromých cache,
- no-cache – nemělo by být cacheováno,
- no-store – může být cacheováno, ale ne archivováno.
- Content-Language
- Deklaruje jazyk dokumentu.
- Content-Type
- Typ dokumentu (obsahu) a kódování znaků. Příklady uvádí některé možnosti kódování češtiny.
apod.
- copyright
- Autorská práva k dokumentu.
- DC.Title
- Patří do rodiny Dublin Core elementů (dále např. také DC.Creator, DC.Language atd.). Další informace např. Expressing Dublin Core in HTML/XHTML meta and link elements.
- description
- Stručný popis obsahu stránky. Některé vyhledávače zobrazují obsah tohoto tagu ve výsledcích vyhledávání.
- expires
- Datum a čas, kdy by měl být obsah stránky považován za expirovaný (vypršený). Prohlížeč stránku znovu načítá až po uvedeném datu. Datum a čas musí být uvedeny v souladu s normou RFC822. Metoda není z mnoha důvodů stoprocentní (např. proto, že je hodnota uložena v cache prohlížeče ale ne už proxy serverů). Expires META Tag – obsahuje také generátor meta tagu expires.
- generator
- Aplikace, která daný dokument vytvořila. Tuto informaci často automaticky vkládají WYSIWYG HTML editory nebo CMS systémy.
- geo.country
- Rodina geo meta tagů. Určení zeměpisné polohy.
- googlebot
- Meta tag, který má ovlivňovat chování indexovacího robota vyhledávače Google. Remove Content from Google\’s Index.
- ICBM
- Určení zeměpisné polohy. Používá i tento weblog (hledejte odkaz GeoURL).
- imagetoolbar
- Ruší v IE plovoucí nástrojovou lištu, která se objevuje při pohybu myši nad některými obrázky.
- keywords
- Klíčová slova stránky. Pro externí vyhledávače nemá v současnosti prakticky význam. Může být ale užitečné např. pro interní vyhledávače nebo pro lepší orientaci autora webu.
- MSSmartTagsPreventParsing
- Pokud je uvedena hodnota
TRUE
, tak zabraňuje použití Microsoft Smart Tags na stránce. Další informace např. META name MSSmartTagsPreventParsing. - Pragma
- Zabraňuje cacheování. Povolena je jediná hodnota
no-cache
. - rating
- Hodnocení obsahu souboru. Více třeba na META name rating. Pokud vím, tak neexistuje jednotná norma na používání tohoto meta tagu. Doporučuje so používat
pics-label
. - reply-to
- Kontaktní e-mail (dobrá potrava pro spamovací roboty).
- revisit-after
- Má říct indexovacímu robotu, jak často má indexovat stránku.
- robots
- Ovlivňuje chování indexovacích robotů na stránkách.
– roboti nebudou stránku indexovat, ale budou procházet odkazy na ní obsažené.
- Problematiku je možné řešit také (lépe) pomocí souboru
robots.txt
.
Souvislosti
- Popis tagů META – Dušan Janovský
- Metadata a hlavička pro XHTML dokument – Vilém Málek
- A Dictionary of HTML META Tags – Vancouver Webpages
- META – HTML tag reference guide
- Expressing Dublin Core in HTML/XHTML meta and link elements – Andy Powel