Co je to ten Netskejp? Nemrtvej!

Co je to ten Netskejp, zeptal se synáček svého tatínka. Tak takhle nějak bych mohl začít povídání o tom, že prohlížeč Netscape není ještě mrtvý (to neznamená, že se nenachází v klinické smrti). Na 3. 8. se chystá uvedení Netscape 7.2 (via The Web Standards Project).

Nový Netscape 7.2 je postavený na jádře Mozilla 1.7 (předchozí Netscape 7.1 využíval jádro Mozilla 1.4). A já se ptám k čemu to všechno? Jenom pro dokreslení: v letošním roce na converter.cz přišli netscapeovci takto (v závorce je údaj za červenec pro dokreslení vývoje):

  1. Netscape 5.0 – 0,4 % (0,5 %)
  2. Netscape 6.2 – 0,1 % (0 %)
  3. Netscape 7.1 – 0,1 % (0,1 %)
  4. Netscape 3.0(!) – 0,1 % (0 %)

Ale kdybyste chtěli, tak si můžete objednat třeba pěticédéčkové balení Netscape 7.2 bratru za 18 doláčů. Chce se mi říct s klasikem Tudy ne, přátelé, tudy ne! Tudy cesta nevede!

Souvislosti (doplněno)

Kolaps RSS (3.) – trend

Ve druhém díle povídání o možných problémech, které může přivodit webovým serverům nárůst obliby RSS, jsem zveřejnil statická data za část měsíce července 2004. Zároveň jsem Vás požádal o informaci, jak jsou na tom vaše weby.

Statická informace je jedna věc. Druhá věc je, jaký je vlastně vývoj daného jevu. Probral jsem logy webu converter.cz za dobu, po kterou mám k dispozici data a výsledek nabízím v dnešním spotu.

Poměr stránek a dat připadajících na RSS/RDF webu converter.cz
Měsíc Stránky Velikost
2/2004 34 % 21 %
3/2004 33 % 21 %
4/2004 39 % 32 %
5/2004 46 % 24 %
6/2004 60 % 50 %
7/2004* 63 % 36 %

*) Hodnoty za prvních 23 dní července.

Průměrné hodnoty jsou 44 % stránek a 28 % velikost.

Graf vývoje poměru RSS/celý web converter.cz (stránky a objem dat)

Vývoj poměru stránek a objemu dat připadající na RSS/RDF

Ke grafu snad jen pár poznámek:

  • Údaje za červen 2004 ovlivnilo hodně obrázků na blogu. Narostla velikost RSS 2.0 a RDF kanálů.
  • Plynulý nárůst % načtených stránek, který se samozřejmě jednou zastaví, je patrný na obou datových řadách.
  • Web converter.cz má poměrně velmi dobře optimalizovaný poměr obsah/kód – proto taková vysoká čísla.

A co jinde

Martin Malý (Artur Dent) mi poslal (díky) pro tento účel poměrně podrobnou statistiku Bloguje.cz za červen 2004. Z ní mj. vyplývá:

  • Počet hitů souboru rss.xml je 14,2 % (tj. asi o polovinu víc, než jak je na tom domovská stránka blogů). Na RSS komentářů připadá 3,4 %. Celkem tedy 17,6 %.
  • Objem takto stažených dat 4,4 % (domovská stránka blogů zabírá 18,1 %). RSS komentářů má 0,7 %. Celkem tedy 5,1 %.

Zajímavé také je, že téměř 13 % hitů na Bloguje.cz mají na svědomí RSS čtečky (do sta procent jsou ještě hity prohlížečů, robotů a spol.).

Další informace dodal meky (Dallas Stars). U jeho webu připadá na RSS (3 kanály):

  • 9,75 % přístupy,
  • 4,62 % přístupy.

Přidejte se

Pokud máte zajímavé (i nezajímavé) údaje o Vašem webu, komentujte, mailujte.

Souvislosti

RSS čtečka pro Pocket PC

RSS čtečky se objevují na tomto blogu v různých souvislostech poměrně často. V mém zorném poli byly zatím hlavně desktopové RSS čtečky pro Windows.

Teď bych se rád obrátil na Vás, abyste do komentářů doporučili nějaké dobré RSS čtečky pro platformu Microsoft Pocket PC. Když o tom tak uvažuji, tak může být užitečná také informace o jiných platformách. Když přidáte také pár zkušeností, nebude to určitě na škodu.

S tématem také souvisí nová anketa o používání RSS čtečky ve Vašem kapesním počítači.

Kolaps RSS (2.) – co říká log

S výrazným nástupem RSS se začínají vynořovat úvahy nad možným zahlcením (především) webových serverů velkým množstvím, byť malých, požadavků. RSS soubory jsou sice malé (jak které), ale počet požadavků může být obrovský. Mnozí uživatelé desktopových čteček mají totiž čtečky nesprávně nastaveny. Dílem je to vina tvůrců čteček. Není výjimka, že výchozím nastavení je u každého jednoho kanálu stahování RSS souboru každých pět minut! Někteří závislí uživatelé pak refreshují své čtečky možná ještě častěji.

V předchozím spotu Kolaps RSS? jsem se snažil říct, že celá záležitost nebude pro internet fatální. Na druhou stranu představuje čtení RSS kanálu pro webový server určitou zátěž. Tak proč ji nesnížit.

Co říká serverový log?

Až potud mé úvahy byly pouze v rovině úvah. Jaká je ale skutečnost? Včera jsem se podíval na červencový log celého serveru converter.cz. Vedle weblogu, který ze své podstaty víc přitahuje uživatele RSS čteček, tady běží web conVERTER, jehož zaměření i použité technologie se od weblogu conBLOG podstatně liší. Je tvořen především statickými html stránkami trvalého charakteru.

Za sledované období (1. – 23. 7. 2004) bylo otevřeno 119938 stránek. Takto bylo staženo 2,59 GB dat. Na RSS kanály, kterých je celkem 7, z toho připadá 63 % přístupů a 36 % objemu stažených dat! To už je docela velká porce. Nemyslíte?

Uznávám, že web, na který přichází zhruba polovina návštěvníků kvůli weblogu, je svým způsobem odlišný od jiných webů poskytujících syndikovaný obsah. Na druhou stranu web, který RSS poskytuje je mému webu podobný (jiné weby nemají zase tak velký důvod RSS poskytovat). Proto je zátěž serverů vyvolaná čtením RSS v celém spektru webových stránek na internetu menší než na tomto webu. Přesto by ale měly být udělány kroky, které povedou ke snížení zátěže:

  • Výchozí nastavení RSS desktopových čteček by mělo být k webovým serverům šetrnější (toto může ve svém důsledku mást nezkušené uživatele a všem pak přidá práci s nastavováním).
  • Uživatelé by měli být opatrnější při nastavování opakovaného stahování.
  • Závisláci by pak neměli mít nastavené stahování každých pět minut.

Možná je mé přání naivní, ale pokud bude zátěž internetu narůstat rychleji, než jeho výkon, vyvolá to tak jako tak nějakou reakci. Možná to začne tím, že do návodů jak používat RSS přibudou odstavce s probou nastavení delší obnovovací frekvence načítání RSS kanálů.

Zajímalo by mě, jaký je poměr počtu stahovaných dokumentů a jejich velikost na Vámi provozovaných webech. Pokud můžete, piště do komentářů nebo na můj e-mail.

Ve při

Po nějaké době jsou domácí blogující opět ve při (nezaměňovat s vepři). Celou záležitost vyvolala zmínka o přednášce blogerů/našinců na vídeňském BlogTalk (Denisa Kera, Martin Kopta, Adam Javůrek, David Bureš). Následovala přestřelka mezi zúčastněnými a lidmi, kteří nerozlišili mezi pojmy prezentovat a reprezentovat.

Podle všeho Denisa prezentovala výsledky společného zkoumání domácí blogosféry (prý jsem v tom měl taky prsty). Do tohoto faktu se obul Filip Rožánek ve spotu Jen si tak trochu blognout…. Osobně nevidím nic zavrženíhodného na tom, že se dá vědecky zkoumat třeba i fenomén blogů (proč taky, když to sám dělám, že?). Nevidím taky nic špatného na tom, že je někdo bloger (protože bloguje). A ani se mi nezdá, že by někdo někoho reprezentoval (proboha, snad nejsem na nějakém seznamu agentů/blogerů).

Denisa Kera si tak trochu (dost) postěžovala na chování určitých lidí, které předcházelo a následovalo kolem zmíněné akce – Blogtalk a dozvuky. Svou odpověď přidal Martin Malý. Celkem se mi líbí přirovnání o lyžařích a výborech (ve smyslu ti výboři).

Na těchto přestřelkách mě nejvíc fascinuje, že nejvíc se hádají lidé, kteří jsou si vlastně nejvíc blízcí. Víc se štěkají blogeři mezi sebou než nepřátelé blogování a blogující. Víc se perou křesťani s muslimama (náboženství jsou si velmi podobná) než muslimové s hidnuisty (i když…). Bohužel ale i v této debatě mizí podstata problému. Problému? On vlastně ale podle mě žádný problém nikdy nebyl.

Souvislosti

Kolaps RSS?

Martin Kopta v článku Když se sdílení odkazů změní v útok DoS poukazuje na možnost nadměrného zahlcení webových serverů, ze kterých čtou RSS kanály (především) uživatelé desktopových RSS čteček. Martin cituje z článku RSS growing painsChad Dickerson:

Návaly požadavků na RSS mají veškeré charakteristiky distribuovaného útoku DoS, a to přestože požadavky jsou legální a v jednotlivosti malé, při strmém nárůstu požadavků v krátkém časovém úseku způsobují nepříjemnou zátěž serveru.

Máme se tedy bát kolapsu, který bude způsoben velkým množstvím opakovaných požadavků na RSS a Atom kanály? V úvahu je potřeba brát mnohé skutečnosti:

  • Velikost xml souboru RSS kanálu je zlomkem velikosti stránky, která se otevře po kliknutí na odkaz v RSS čtečce (docela by mě zajímala, jaká je průměrná klikatelnost na položky v RSS kanálu) – od určitého procenta je objem stahovaných stránek výraznější než je objem přenesených xml dat (v konečném důsledku pak může RSS linky šetřit).
  • Ne každý má ve čtečce nastavené automatické opakované stahování RSS kanálů (já osobně nemám refresh nastaven ani po spuštění čtečky ani automatický – vše řeším ručně). Pravdou je, že mnoho čteček mívá defaultně nastavený automatický opakovaný download a to na dost krátký interval. Autoři v budoucnu pravděpodobně toto změní, pokud na ně bude vyvinut tlak od uživatelů a potažmo i provozovatelů serverů.
  • Výkon serverů, propustnost internetu, velikost webových stránek a požadavky na stahované objemy dat (uzavřená smyčka) neustále rostou (a to nemluvím o virech, spamu a spol.). Podle mě existují větší žrouti výkonu, než je RSS (tím ale RSS riziko rozhodně nesnižuji).

Pod článkem mě zaujaly průběžné výsledky ankety o používaném typu RSS čtečky. Desktopové čtečky používá 85 % hlasujících.

Vyhledávač od BBC?

BBC prý zvažuje, že naskočí do řítícího se vlaku vyhledávání na internetu. Vyplývá to alespoň ze zprávy, kterou jsem zachytil via ABAKUS SEO Blog: BBC Eyes SearchMike McDonald.

Podle BBC je vyhledávání až příliš pod nadvládou Yankees. No uvidíme. Ještě abysme se dozvěděli, že něco lepšího měli (podle nejnovějších poznatků) už vědci v Sovětském svazu.