Výskyt tagů 2

První spot Výskyt tagů zaznamenal solidní ohlas. Co se týká metodiky, tak jsem použil málý vzorek: svůj web conVERTER a aktuální obsah cache mého počítače. V tomto pokračování bych nabídl objektivnější obrázek:

  • 22 uživatelů různé úrovně a různých zájmů (obsah části cache prohlížeče IE)
  • 1100 souborů (celková velikost 15 445 kB))
  • 208 443 tagů
  • Obsah cache z 21. 11. 2003
Nejčastěji se vyskytující rodiny tagů
Značka (tag) Výskyt
table 16,1 %
img 14,0 %
a 13,9 %
br 10,7 %
form 6,9 %
font 5,5 %
nespec. 4,7 %
b 4,2 %
!– 4,1 %
div 3,9 %
p 2,9 %
span 1,8 %
script 1,6 %
meta 1,5 %
ol/ul 1,0 %

V tabulce zobrazená první patnáctka v podstatě potvrzuje stesky kritiků některých současných (a minulých i budoucích) praktik webdesignerů:

  • používání tabulek pro rozvržení dokumentu
  • nadměrné používání obrázků
  • značka br pro vytváření seznamů, menu a odstavců
  • používání zakázaných/nedoporučených značek pro formátování – např. font a b
  • výskyt neexistujících nebo chybně zapsaných značek (v tabulce v položce nespec.).

CSS: dvakrát jak na to

Dave Shea (mezzoblue) vydal dva po sobě jdoucí spoty o tom, jak nejlépe vytvářet CSS soubory:

Z obou spotů, které odráží především Davovy praktické zkušenosti, bych zdůraznil hlavně tyto body:

  • Nejprve validujte a potom hledejte chyby.
  • Testujte nejprve na nejpokročilejším prohlížeči, teprve pak na ostatních.
  • Ověřte, co udělá změna velikosti písma v prohlížeči.
  • Jména přidělujte podle funkce ne podle vzhledu.
  • Uvádějte jednotky u nenulových hodnot.
  • Udržujte v CSS souboru pořádek.

Statistika

Včera jsem si trochu pohrál s novou funkcionalitou na conBLOGu. Začal jsem tvořit stránku statistiky. Dnes ráno jsem zjistil, že od začátku blogování se systémem b2 (7. 3. 2003) jsem zveřejnil 309 spotů, které jsme 921krát komentovali.

Jako zdroj pro mou upravenou verzi jsem použil b2stat.php – já jsem stahoval soubor b2stats.zip. Pokud chcete b2stat použít a nechcete počešťovat, počkejte si. Až odchytám mouchy, dám soubor k dispozici ke stažení.

Vítejte spameři

Tak jsem se dočkal! Komentářové spamování dorazilo na conBLOG. Mám tu první 2 vlaštovky. První přiletěla v pondělí a druhá dnes. Takže mě čeká mazací období.

Zatím se problém komentářového spamu týkal zahraničních blogů. Své si zažívají třeba Mark Pilgrim, Phil Ringnalda, Simon Willison a další.

Jak se spamemu bránit, když jsou spameři bohatí, rychlí, chytří a bez skrupulí (Mark Pilgrim)? Zrušit komentáře by se mi nelíbilo. Takže nejspíš zvolím nějakou restrikci. Už jste, kolegové blogeři, uvažovali, jak se budete spamu bránit? Poraďte.

Související

Výskyt tagů

Napadlo Vás někdy, jaký je výskyt jednotlivých značek (tagů) na webových stránkách? Když někoho učím HTML, tak na úvod povzbuzuji nováčka, že pro začátek vystačí s konstrukcemi do počtu prstů na rukou. Které to ale jsou?

Není nad to vše pěkně spočítat. Takto vypadá první desítka značek na mém webu conVERTER:

  1. a – 27,6 %
  2. td – 16,6 %
  3. div – 12,6 %
  4. tr – 5,5 %
  5. meta – 4,4 %
  6. br – 3,8 %
  7. !– – 3,6 %
  8. h2 – 2,6 %
  9. em – 2,2 %
  10. li – 2,1 %

Zajímavé možná bude zjištění, jak jsou na tom ostatní – přece jenom nejsem reprzentativní vzorek. Pro následující žebříček posloužil obsah cache mého počítače:

  1. a – 16,8 %
  2. td – 14,5 %
  3. br – 12,8 %
  4. img – 8,2 %
  5. tr – 7,2 %
  6. font – 4,1 %
  7. option – 4,0 %
  8. p – 3,8 %
  9. div – 3,1 %
  10. table – 3,0 %
  11. b – 2,7 %
  12. input – 2,5 %
  13. span – 1,9 %
  14. !– – 1,7 %
  15. li – 1,5 %

Pokud výsledky z cache zredukuji na rodiny značek (např. tabulka obsahuje několik určitých značek), dostanu tento žebříček:

  1. table – 24,8 %
  2. a – 16,8 %
  3. br – 15,5 %
  4. img – 8,5 %
  5. form – 7,7 %
  6. font – 4,1 %
  7. p – 3,8 %
  8. div – 3,1 %
  9. span – 1,9 %
  10. ul/ol – 1,8 %

Za pozornost stojí snad až příliš vysoký výskyt tabulek a značky font. Mě osobně překvapilo vítězství br nad p.