Internet Archive – jak ta stránka vypadala?

Simon Willison mi připoměl užitečnou službu Internet Archive (via Google, circa 1998). Internet Archive je takový elektronický archiv, který zachycuje historický stav webových stránek. Můžete se např. podívat jak vypadaly některé weby v minulosti:

Souvislosti

Porovnání pozic v SE graficky

Thumbshots Ranking je webová aplikace, která je určena k porovnání pozic výsledků vyhledávání ve dvou vybraných vyhledávačích. Nyní jsou podporovány AllTheWeb, AltaVista, Google, MSN, Teoma, Wisenut a Yahoo.

Po zadání hledané fráze a výběru vyhledávačů (standardně je nastaven souboj Google vs. Yahoo) je zobrazen grafický výstup srovnávající výsledky na obou vyhledávačích:

Výsledky souboje na Thumbshots

Grafický výstup z Thumbshot Rankings

Aplikace propojí čarou stránky, které jsou ve výsledcích vyhledávání obou vyhledávačů. Dále je možné zadat web, který má být zvýrazněn (červeně) ve výsledcích souboje. Via seo.nawebu.cz.

Budou platit za JPEG?

Jak se tak dívám po domácích blozích, tak nikdo nepsal o tom, že se za JPEG bude platit. Tahle bublina (podle mi dostupných informací je to navíc bublina vyčpělá) se v posledních dnech propírala na několika světových blozích (viz odkazy na konci spotu). Doma se problému licencování JPEG grafického formátu naposledy věnoval Tomáš Holčík na Živě.cz v článku Formát JPEG v ohrožení.

Oč jde? Firma Forgent Networks (můžete mi říct, proč Živě jen zřídka odkazuje?) vlastní patent na postupy použité v JPEG (více tisková zpráva Forgent Networks). Firma se chce na poslední chvíli poléčit na významných výrobcích SW a HW, kteří využívají JPEG. Patent totiž za pár měsíců vyprší. Podobně se zachovala firma UNISYS v kauze GIF (patent vypršel v červnu 2003).

Věřím, že se akce Forgentu nedotknou běžných uživatelů a tvůrců webu (od kdy si kapři vypouští rybník?). Patent navíc platí v USA a netýká se EU a mnoha dalších států.

Z mnoha zpráv mě zaujal zajímavý automatický překlad z Wikipedia pořízený programem Eurotran datovaný 18.7.2002:

Patenty: Forgent sítě tvrdil, že to vlastní a vykoná patent práva na široce-použitý JPEG komprimace obrazu standard, který je použitý široce na Celosvětová pavučina. Oznámení má vyvolal zuřivost remisicent Unisys\‘ pokusy tvrdit jeho práva přes GIF obrazový komprimační standard.

Souvislosti

Lžigoogle.cz není Google

To že Google.cz, kterýžto nestojí za odkaz, není Google snad ví každý. Parazitování na schopnostech, kvalitách nebo slávě je pro některé jedince asi výhodné. Dušan Janovský píše, proč Google.cz není Google. Onehdy jsem se přepsal (místo com mi uklouzlo cz) a nestačil se divit.

Hlásím se k výzvě, kterou dnes zveřejnil Marek Prokop ve spotu Yuhů vs. Google.cz – 177:1334. Přidejte se taky a odkažte na Yuhůův článek Google.cz není Google.

Otesánek: Google, Yahoo!, MSN

WebSideStory vydal zajímavou zprávu Google’s Search Referral Market Share Reaches an All-Time High… (via ABAKUS SEO Blog). WebSideStory se zkoumal počty refererů z vyhledávačů v letech 2001 až 2004 v USA vztažené ke konci března každého zkoumaného roku. Vyhledávač Google si upevnil první místo oproti svým největším konkurentům Yahoo! a MSN.

Poměr refererů z vyhledávačů v USA ke konci března daného roku:
Vyhledávač 2001 2002 2003 2004
Celkem 63,48 % 81,04 % 84,77 % 87,88 %
Google 11,93 % 28,86 % 35,99 % 40,91 %
Yahoo! 36,86 % 36,65 % 30,95 % 27,40 %
MSN 14,69 % 15,53 % 17,83 % 19,57 %

Graf vývoje poměru refererů Google, Yahoo!, MSN v USA

Graf: Poměr vývoje refererů

Ztráta Yahoo! potvrzuje dva roky trvající pokles. Uvidíme, jak se projeví nedávné změny (třeba Yahoo buys Kelkoo…). Naopak spokojení mohou být v MSN, která také už nějakou dobu mocně zbrojí (Microsoft to upgrade search tools).

Zajímavé je srovnání mocné trojky, která si ukrajuje stále více z pomyslného koláče, se zbytkem světa:

Graf vývoje poměru refererů Google, Yahoo!, MSN vs. ostatní v USA

Graf: Poměr vývoje refererů Google+Yahoo!+MSN vs. ostatní

Související

Google zvýrazňuje v adrese

Když už byly poslední dva spoty na conBLOGu o Google, tak se zařídím podle rčení třikrát a dost. Google teď zvýrazňuje ve výsledcích vyhledávání také klíčová slova v adrese nalezené stránky. Že by to byl nepřímý důkaz tvrzení, že je dobré mít klíčová slova také v adrese dokumentu?

Google v novém kabátě

Musím říct, že vzhled stránek má pro mě poměrně velký význam. Dneska změnil vzhled web z nejwebovatějších – Google.

Titulní stránka je ještě více graficky odlehčená. To samé platí i pro stránky s výsledky vyhledávání. Tmavomodrou barvu vodorovných lišt vystřídala světlemodrá barva s tenkou ohraničující tmavě modrou linkou. Horní lišta neobsahuje navigaci Web | Obrázky | Skupiny | Adresář – ta se přesunula na stránce úplně nahoru. Z horních pozic starého designu se až dolů propadly volby Výběr jazyka a Tipy pro vyhledávání. Pokročilé vyhledávání a Nastavení si našlo místo vpravo od tlačítka Hledej, které se původně jmenovalo Vyhledat Googlem.

Cítím patrnou snahu po dalším zjednodušení. Pořád ale přetrvávájí mírné nejednotnosti. Např. tlačítko pro vyhledávání na titulce nese nápis Vyhledat Googlem (čím bych na Google hledal jiným?) a ve výsledcích Hledej. Vedle pole pro vyhledávání na titulce chybí oproti stejnému poli na stránce s výsledky odkaz Výběr jazyka (je dole). To jsou ale opravdu drobnosti.

Co mě ale udivuje, je přístup autorů HTML kódu. Web není validní. Stačí letmý pohled a vyplavou začátečnické chyby, např.:

  • hodnoty atributů nejsou uzavřené v uvozovkách,
  • …,
  • atd.

Chyb je samozřejmě(?) víc. Kdyby měl dokument DTD, možná bych mohl napsat číslo mezi 20 – 57, ale takto opravdu nevím.

Související

AllTheWeb s Yahoo!

AllTheWeb začal používat Yahoo! vyhledávání dříve, než se možná čekalo (via Abakus SEO Blog).

V této souvislosti jsem se podíval na zdrojový XHTML (nevalidní) kód AllTheWeb. Pouze jediná tabulka a jenom 25 chyb nalezených validátorem jej staví před tabulkový (3 tabulky) Google s 36 chybami. Docela by mě zajímalo, jaký je postoj obou zmíněných gigantů k něčemu tak základnímu, jako je validita kódu. To těm firmám nestojí za to upravit pár šablon? Práci, kterou by třeba zdarma, udělal během pár desítek minut kdejaký školák.

Nakládání s nalezenci

Marek Prokop včera zveřejnil velmi zajímavý spot Nalézání nalezeného, který popisuje projekt Informační školy při Washingtonské universitě Found Keeping Found Things.

Marek se zaměřil na výsledky KFTF Survey of Web Keeping Methods. Tento výzkum hodnotil způsoby uchovávání informací nalezených uživateli na webu. Nebudu citovat všechny výsledky, ale za pozornost stojí některé (pro někoho možná) překvapivé způsoby chování návštěvníků:

  • vytvoření záložky – 80 %,
  • nic si neukládá a znovu hledá – 54% %,
  • stránku si vytiskne – 40 %.

Pro mě osobně jsou mnohá zjištění velmi poučná.

PageRank pod lupou

Blognul to sice dnes už Marek Prokop (Analýzy PageRanku a změn pozic v Googlu), ale rád si to uschovám pro budoucnost:

  • Google PageRank Value Report – nakrmil jsem ho asi 150 odkazy najednou a vrátil seznam zadaných stránek a jejich GPR.
  • Keyword Pagerank Finder – pracuje tak, že zadáte klíčová slova a aplikace vrátí seznam stránek vč. jejich pozice a GPR.

Jsem zvědavý, kdy, jak a jestli vůbec zareaguje Google na podobné nástroje?

Souvislosti