Spamer – slovanský pobratim

Netrvalo to dlouho a má ochrana proti spamu zažila kolaps. Koncem tohoto týdne jsem smazal několik stovek komentářových spamů, zabanoval dvě ip adresy a vyměnil kontrolní dotaz. A všechno nasvědčuje tomu, že za všechno můžou naši slovanští bratři.

Nejnovější článek antispamové ochrany na conBLOGu žádá uživatele, aby zadal do pole požadovanou číslici. Pro anglicky hovořícího spamera je to ořech zvící kokosu. Ne tak pro kluka slovanského, který může z textu ledacos pochopit.

První várka spamu dorazila podle všeho z Polska (usuzuji podle ip adresy a slova cokolwiek v emailu). Změna kontrolní otázky a ban ip adresy prvního útočníka odrazil. Další pokus o den později přišel z Ruska. Tentokrát stačilo zabanovat.

Uvidím, jak se celá věc bude vyvíjet. Díky jednoduchému dotazu, na který uživatel s javascriptem ani nemusí odpovídat, byl od spamu tři čtvrtě roku pokoj. Doufám, že nenazrál čas na další antispam.

Lepší komentářový antispam?

Tento spot berte jako rychlé nahození myšlenky, pro kterou bych vás chtěl požádat o kritický rozbor.

Komentářový spam je velký problém. Pamatuji doby, kdy se nespamovalo v e-mailech. Pamatuji doby, kdy se nespamovalo skrze komentářové formuláře open source publikačních systémů. Poslední dobou se ale spamuje snad každý formulář na webové stránce. Na mých webech spamují mé vlastní kontaktní formuláře i jednopolíčkové formuláře pro objednávku newsletteru.

Každé antispamové řešení má nějakou mouchu (nebo spíš much několik). Poslední dobou používám ve formulářích pole, do kterého musí uživatel zadat např. číslo, uvedené v popisku formuláře. To zdržuje a u roztržitých pisatelů (včetně mně) způsobuje chyby při odesílání.

A teď na konci, zpět k úvodní myšlence spotu. Tedy k další možnosti komentářového antispamu. Je jím textové pole (třeba skryté), které se nesmí vyplnit. Uživatel nemusí nic zadat (není obtěžován zadáním) a projde. Robot poctivka pole vyplní a skončí. Chci se zeptat vás, kteří tento komentářový antispam používáte, jak se vám osvědčil. A rád bych se dozvěděl něco také od vás ostatních.

Nasazen další antispam

Komentářoví spameři před vánocemi obešli další antispamovou ochranu na conBLOGu. Zkouším tedy další komentářový antispam. Omlouvám se za to.

Po dlouhém váhání a vymazání několika set spamů v komentářích jsem do komentářového formuláře doplnil pole, do kterého komentující zadá to, co po něm žádá popiska pole. V současnosti je třeba zadat číslici pět. Drtivá většina komentářů je v češtině nebo slovenštině a všechny brutální spamy byly psány anglicky. Předpokládám, že se čeština stane dostatečným štítem proti všem cizákům.

Chci se na tomto místě omluvit Vám všem komentujícím, kteří musí zadat tu jednu informaci navíc. Pochopte prosím, že každodenní mazání desítek (někdy i stovek) řádků z databáze není žádná velká zábava.

Souvislosti

Spameři k Vánocům

Venku se tiše snáší sníh (už jste někdy slyšeli, aby sněžilo nahlas?). Štědrý večer na krku. Kde rychle splašit nějaký vhodný dárek? Tatínkovi (a mamince) Vyjágru, mladýmu nějaký rynktóny na mobil, dědovi kredity do kasína, babičce Diazepam. Stačí se podívat na nějakou kůl sajtu, kterou právě teď promují (od slova promotion) spameři v komentářích na mém blogu. Za chvíli ale kliknu na obrázek odstranit zaškrtnuté a první spamová padesátka půjde do kytek.

Posledních pár měsíců byl naštěstí od spamerů pokoj. Nasadil jsem vlastní antispam a byl klid. Čas od času jsem sice musel smazat těch několik málo rukodělných kousků, ale žádný kobercový nálet se už nekonal. Až teď (chvilku počkejte, smáznu další várku spamu).

Dobré SEO, více spamu?

À propos rukodělný spam. Když tak občas promazávám těch pár spamů (podle všeho psaných/kopírovaných ručně) z komentářů na conBLOGu vidím, že se spam opakuje jen u několika spotů. Myslím, že se spameři zaměřují na spoty, které jsou vysoko ve výsledcích vyhledávání (např. ve spojení se jménem publikačního systému). Rozhodně by to bylo vzhledem k účelu logické. Když už píšu spam ručmo, tak ať to aspoň stojí za tu námahu. Důležité jsou nejen zpětné odkazy, ale taky proklik. Cholera.

Souvislosti

Nový komentářový antispam

Před pár dny jsem aktualizovat systém proti komentářovému spamu tady na conBLOGu. Ten předchozí totiž žral komentáře. Využíval ip adresu komentujícího a ta mohla být mezi otevřením spotu a odesláním komentáře z nejrůznějších důvodů změněna (více informací v diskusi pod spotem Antispam nebo anticomment).

Přešel jsem tedy na systém, který (snad) není závislý na vnějších vlivech. Přidávání komentářů by mělo být bezproblémové. Koneckonců to můžete vyzkoušet v komentářích pod tímto spotem. Chtěl bych poprosit hlavně ty z Vás, kteří využívají různé firewally šachující s ip adresami, připojují se skrze různé akcelerátory apod. Pokud něco selže, dejte prosím vědět na můj mail nebo použijte kontaktní formulář – ten jsem taky vylepšoval, tak snad bude funkční :-).

Antispam nebo anticomment

Když je vše v pořádku, tak je něco v nepořádku. Jenom o tom nevíte. Už dřív jsem měl takový divný pocit. A ten se mi začíná potvrzovat. Systém proti komentářovému spamu, který jsem v tichosti nasadil začátkem února 2005, podle všeho odmítá některé komentáře (nebo některým všechny, nebo některým některé, nebo všem některé).

Když komentářový antispam požírá komentáře, je to taková nepříjemná patálie. Po nasazení antispamu na stařičký publikační systém b2 se všechno zdálo v pohodě. Automaticky vkládaný spam zmizel jako mávnutím kouzelného proutku. Přesto ve mě občas zahlodalo podezření, že sovy nejsou tím, čím se zdají být (kdo ví, odkud je tento citát, získá 10 bodů). Mé podezření se potvrdilo. Od soboty mi přišly už 2 e-maily na téma zruš si ochranu proti spamu.

Abych rozmotal celé klubko, přidám pár informací o antispamové technice, kterou používám:

  • Ve formuláři pro zadávání komentáře mám skryté pole, do kterého vkládám hashovanou hodnotu proměnné $REMOTE_ADDR – hodnota pole se předává skriptu pro zpracování formuláře.
  • Skript pro zpracování formuláře znovu zjišťuje hodnotu proměnné $REMOTE_ADDR a opět ji hashuje.
  • Následně skript pro zpracování formuláře porovná předanou a nově hashovanou hodnotu. Pokud nejsou stejné, vypíše hlášení Your comment has been filtered as a SPAM!

Vycházel jsem z toho, že spamovací robot přistupuje do skriptu, který zpracovává komentáře, přímo bez toho, aby otvíral stránku s komentářovým formulářem. A opravdu. Spam ustal a já byl rád, že nemusím denně mazat stovky řádků v databázi. Ale jak se zdá, tak ustaly i komentáře některých čtenářů (u některých mě to hodně mrzí). Omlouvám se.

Pomůžete mi odhalit v čem je zakopaný hafák? Proč některým z Vás nejde zapsat komentář? Jakým způsobem píšete komentáře? Je něco shnilého na mém antispamovém řešení? Chtělo by se mi napsat, abyste své poznatky zapsali do komentářů, ale to asi některým z Vás nepůjde (následuje další má omluva) – přesto to zkuste. Použijte tedy prosím kontaktní formulář. Můžete také psát na e-mail bures@centrum.cz.

Souvislosti

rel="nofollow" proti spamu

Spot Preventing comment spam přináší informaci o podpoře atributu rel="nofollow" u odkazů v Google (via Annes Weblog).

Podpora atributu rel="nofollow" v odkazech si klade za cíl zamezit komentářovým a refererovým spamerům zvyšovat svůj PageRank a tím i své pozice ve výsledcích vyhledávání. Stačí vkládat rel="nofollow" do odkazů v komentářích a Google nebude brát odkaz v potaz. Upravit třeba blogovaci CMS by nemělo být složité. Výrobci už začali reagovat a své aplikace aktualizují.

Vedle Google prý atribut začalo podporovat také Yahoo! a MSN. Důsledky mohou být závažné, jak píše Marek Prokop:

Ještě zajímavější ovšem budou důsledky. Mohou být nepatrné, ale mohou být také mnohem větší, než jaké měl zatím jakýkoli Google dance. Trochu mne děsí jednoduchost, s jakou jde tento atribut v CMS aplikovat na všechny odchozí odkazy a složitost, s jakou ho lze aplikovat správně, tj. jen na odkazy nedoporučené, resp. z neověřenýchzdrojů.

Dovedete si představit, co by se stalo, kdyby tento atribut plošně použily velké katalogy a zpravodajské weby?

No uvidíme. Otázkou je, jestli tento způsob obrany zabrání spamerům v jejich činnosti. Spíš tomu nevěřím.

Souvislosti

Generované e-maily jako spam

Účinnost webových aplikací může být znatelným způsobem snížena antispamovou ochranou na straně příjemce.

Právě teď řeším s kamarádem takový problém. Jeho webová aplikace vyžaduje registraci. Po registraci je odeslán uživateli klasický potvrzovací e-mail, který mj. obsahuje odkaz na stránku, kde si své přihlášení potvrdí. Velká část přihlášek nakonec neproběhla. Část přihlášek samozřejmě padá na konto těch, kteří si něco zkouší nebo si dělají legraci. Když jsem se ale do aplikace přihlásil sám, tak jsem objevil další významnou skupinu lidí, kteří na potvrzení přihlášky nereagovali. Byli to uživatelé, kterým potvrzovací e-mail spadl do spamu.

U českých systémů tento problém není zase tak závažný. Převážná většina spamu je psaná anglicky. A tak i antispamové systémy citlivěji reagují na anglicky psané texty. Autoři newsletterů a konfirmačních e-mailů generovaných automaticky by měli pečlivě vážit, jakým způsobem sestavit text sdělení. Mohlo by se jim totiž docela snadno stát, že sníží účinnost svého snažení.

Pokud sestavujete text sdělení, snažte se:

  1. Vyhýbat postupům, které využívají spameři.
  2. Nepoužívat slovní spojení vyskytující se ve spamech.
  3. Pečlivě zvažit e-mailovou adresu uvedenou v odesílateli.
  4. Co nejvíce personalisovat odesílaný e-mail.
  5. Testovat odesílané zprávy proti pádu do spamových košů na různých systémech.

Můžete tak zvýšit účinnost své webové aplikace.

Refererový spam

Už zhruba měsíc nacházím ve statistikách mého webu v položce Odkaz z jiné stránky weby, ze kterých na můj web žádné odkazy nevedou. Na pořadu dne je refererový spam.

Dost často se dívám do statistik mého webu. Je užitečné vědět, jak se chovají návštěvníci (ať živí nebo neživí). Zajímavá položka statistiky je informace, ze kterých stránek přichází návštěvníci. Poslední dva měsíce se začaly mezi Top10 odkazů z jiných stránek objevovat evidentně nesmyslné odkazy. Většinou to byly odkazy na staré známé weby z komentářového spamu. Refererový spam dorazil na conBLOG.

Refererový spam se často vyskytuje právě na blozích. Je to hlavně proto, protože některé blogy automaticky generují pod spoty seznam naposledy odkazujících webů na daný spot. Pro návštěvníky to může být užitečná vlastnost, která autora nestojí skoro žádnou námahu. Návštěvníci si rádi přečtou, co se na dané téma píše jinde. A na tohle sází spameři, kteří se snaží protlačit do seznamu odkazujících stránek. Drží se hesla škoda každého odkazu, který padne vedle.

Já na conBLOGu žádné seznamy odkazujících stránek nemám. Robota, který tenhle balast generuje to samozřejmě nezajímá. Dál mi zapleveluje serverové logy nesmyslnými údaji. Nezbývá, než se pustit do boje. Jaké máte zkušenosti s refererovým spamem? Jak se proti němu bráníte?