Komentářový spam: další taktiky

Už jsem si myslel, že si můžu přidat fajku k položce zastavit komentářový spam. Mé řešení bylo jen částečné, a jak se ukazuje v těchto dnech, na některé postupy spamerů pochopitelně neúčinné. Přesto je zajímavé sledovat metody spamerů. Co jsem vysledoval na dvou spamových vlnách z těchto dnů?

Spameři jsou chytří a bez skrupulí. Jinak by nemohli spamovat, že? Když jsem včera odmazal kolem pětistovky spamů a dnes rovných 560, honilo se mi hlavou ledasco. Od starších spamerských útoků jsem vysledovat další (pro mně) nové taktiky:

Komentář bez textu komentáře
Spamerovi stačí, když je odkazovaná adresa uvedena v položce určené pro URL komentujícího. Z hlediska Google to nemusí být nejúčinnější, ale nemusí pršet, stačí, když kape.
Náhodné rozumné texty
Tohle je případ obou masových spamovacích útoků na conBLOG. Spamy mají různý text komentářů. Už to není ten opakující se seznam odkazů. Text vypadá na první pohled rozumně. Autor spamu pravděpodobně čerpá z databáze více méně smysluplných a na první pohled neškodných textů. K nim pak přilepí jeden odkaz na propagovaný web. Tohle mi přijde jako poměrně účinný postup i z hlediska SEO.
Spamer také používá velké množství IP adres, takže nelze jednoduše omezit jedinou adresu.

Testuji komentářový antispam

Už hezky dlouhou dobu používám pro publikování a správu tohoto blogu dnes už mrtvý systém b2. Včera a dnes na conBLOG dopadl těžký komentářový spam. Smazal jsem něco kolem 300 komentářových spamů.

Právě teď zkouším jeden malý zásah do systému b2, který by měl zamezit jednomu způsobu automatického vkládání spamu. Až si řešení ověřím, tak se s ním podělím.

Zatím vás chci požádat o ověření funkčnosti komentářů. Můžete zadat komentář k tomuto spotu. Třeba něco na téma jak bojovat s komentářovým spamem. Nebo něco jiného, co s komentářovým spamem souvisí. Zajímá mě, jestli ve Vašem prohlížeči můžete zadat komentář (uveďte prosím OS a prohlížeč, ať nemusíte testovat všichni). Je možné, že budete muset dát refresh stránky s komentáři. Pokud se vyskytnout nějaké problémy, ozvěte se na můj mail nebo využijte kontaktní formulář. Díky za pomoc.

Spameři se zase probudili

Komentářoví spameři zase začali řádit. Nebo přesněji začal řádit maník propagující karetní hazard. Štve mě to, ale zatím to není tak hrozné, jako v případě Dana Cederholma. Ten dostal do komentářů více než 200 kousků. Komentáře dočasně zrušil.

V mém případě vyhrála lenost nad budoucím klidem. Žádné akce prozatím nechystám. Možná s tím něco udělám, až vyměním současný publikační systém. Ale kdo ví, kdy to bude?

Aktualizace: Tak se zdá, že jsem snad tak dobrý jako Dan Cederholm. Spamer, ludra jedna, se činí. Zatím jsem od včerejška napočítal více než stovku nových komentářových spamů.

Aktualizace 2: Spamer se opravdu činí. Před chvilkou jsem z mySQL smazal více než 200 spamových komentářů. Vypadá to, že jede jeden spot po druhém. Jsem zvědavý, jestli pojede zase od začátku (snad nebude zjišťovat, jesli už něco není smazané). Zatím jsem si procvičil DELETE FROM. Systémovější kroky budou následovat (na školení se nedá dělat všechno).

SpamBayes

Před nějakou dobou jsem hořekoval nad balastem, který se valí do mé e-mailové schránky (Užitečný e-mail?). David Grudl mi v diskusi pod spotem poradil SpamBayes. Aplikaci jsem nainstaloval a slíbil, že se ještě ke SpamBayes vrátím.

Co je SpamBayes

SpamBayes je projekt, který používá Bayesiánské filtry (využití statistické analýzy) pro potírání spamu. Projekt SpamBayes (není to jeden program) mj. tvoří:

  • plug-in pro MS Outlook,
  • mail filtr pro POP3 server,
  • mail filtr pro IMAP.

SpamBayes se pokouší třídit příchozí poštu na spam, dobré zprávy a zprávy podezřelé ze spamu. SpamBayes učíte rozeznávat co je spam a co spam není.

SpamBayes pro Windows

Já jsem nasadil SpamBayes na svá PC jako plug-in pro MS Outlook. Vedle Outlooku je SpamBayes funkční i v dalších e-mailových klientech ve Windows (nezkoušel jsem, napište své zkušenosti do komentářů). Zmíněný plug-in není funkční v Outlook Express.

Program funguje tak, že na pozadí zkoumá došlé zprávy. Každou zprávu buď:

  • posoudí jako „dobrou“,
  • označí za spam – zprávu přesune do vybrané složky,
  • označí jako možný spam – zprávu přesune do vybrané složky.

A teď se dostávám ke zmíněnému učení. SpamBayes se pořád učí. Na nástrojové liště Outlooku po instalaci přibudou ikony, kterými můžete označit vybranou zprávu za spam, nebo můžete zprávy ve složkách ze spamem označit za nespamové. Tato akce přesune zprávu do složky kam měla být původně doručena, nebo spam přesune do spamové složky.

V předchozím odstavci jsem popsal denní rutinu učení (ani vám to nepříjde). V nastavení programu je možné vybrat složku, ve které jsou zaručeně zdravé zprávy a složku se spamem a na tomto vzorku může SpamBayes podstoupit nalejvárnu.

SpamBayes má samozřejmě celou řadu dalších nastavení. Můžete např. měnit prahové hodnoty, od kterých bude program považovat e-mail za spam nebo za možný spam.

Mé zkušenosti

SpamBayes používám na 2 počítačích skoro půl roku. Zatím jsem se nesetkal s případem, že by byl některý e-mail omylem označen za spam. Čas od času (nejvíc na začátku provozu) je některý e-mail označen za možný spam. Když ale programu oznámím (jeden klik na ikonu), že je vše OK, už nikdy mi tento typ zprávy za spam neoznačí (já to samozřejmě v budoucnu udělat můžu).

SpamBayes jsem instaloval na pár dalších PC ve firmě. Kolega informatik chrochtá blahem. Běžní uživatelé jsou spokojení. Neradím instalovat zmrdům, protože ti mají další příležitost k alibismu ve stylu já ten e-mail nedostal a může za to Bureš.

Od doby, kdy jsem SpamByes instaloval nemusím být nervozní z toho co mažu a co otvírám. Ve složce s doručenou poštou mám jen užitečné e-maily. Jednou nebo dvakrát za den prohlédnu složku Spam asi a jednou za týden (pro jistotu) proletím složku Spam a obsah složky mažu. SpamBayes můžu jenom doporučit.

Souvislosti

Antispamové třeštění

Nový tzv. antispamový zákon 480/2004 (pdf soubor, 76 kB) nabízí lákavé sousto pro autory (především) internetových médií. Dnes o tom mj. na Živě píše Jiří Peterka v článku Kauza reklamních patiček.

Už v pátek mi přišel nevyžádaný e-mail mj. s tímto kouzelným textem:

Vzhledem k aktualizaci údajů v našem firemním registru oslovujeme společnosti s dotazem na souhlas s oslovením ve věci aktualizace údajů o společnosti v naší databázi podnikatelských subjektů.

Hlavně konstrukce oslovujeme s dotazem na souhlas s oslovením je takovým zajímavým kutilským pokusem o vyslyšení litery zákona. Dále HELENE & MICHEL (jak se autoři mailu podepsali) tajnůstkářsky pokračují v (ne)popisu svého projektu. Podrobnosti o něm zašlou po odklepnutí odkazu. Takže tu máme další námět pro autory virů.

Celé mi to antispamové třeštění připomíná situaci se zákonem o televizní reklamě, kterou jsme zažívali před pár lety. To nemohl pan Podlaha (doktor) ve svém pořadu (tehdy snad ještě na ČT) ani říct vyluxovat, protože by (skoro) pojmenoval jednu firmu. Vypadá to, že podobná připosranost nás čeká i u antispamového zákona. Ale kdo ví?

Další svinský komentářový spammer

Čas od času navštíví mé komentáře nějaký ten komentářový spammer. Většinou pokrčím rameny a ten jeden dva komentáře smažu.

Včera před půlnocí se jeden spammer docela vyznamenal. Nějaký filuta (možná ze Švýcarska podle koncovky e-mailu) zadal sice jen 5 komentářových spamů, ale trhl rekord v počtu odkazů na jeden spam: více než 200 odkazů (663 slov) je už docela pěkný kousek. Nu čož. Zase jsem pokrčil rameny a mazal.

Jenom by mě zajímalo, jaký prvek sociálního inženýrství nutí spammery aby na žačátek spamu dávali pár slov ve stylu:

Tak jsem se díval po webu a našel vaše stránky. Návštěva mě zaujala a doufám, že se brzy vrátím. Zdravím.

Tak tohle mi napsal ten paznecht ze Švýcar. Ještě, že se pohybuješ ve vituálním světě. Takhle mě navštívit u mě doma, nasvinit tady a ještě slíbit, že se vrátíš, tak dostaneš po čuni. Enjoy.

Souvislosti

spamShield

Marek \’nebko\‘ Nebesář spolu s \’Arturem Dentem\‘ nastartovali projekt spamShield, který je možné vyzkoušet. Hezký počin.

Marka mrzí, že se nesetkal s větším ohlasem blogerů. Marku, počkej až se začne spamovat fest!

Vítejte spameři

Tak jsem se dočkal! Komentářové spamování dorazilo na conBLOG. Mám tu první 2 vlaštovky. První přiletěla v pondělí a druhá dnes. Takže mě čeká mazací období.

Zatím se problém komentářového spamu týkal zahraničních blogů. Své si zažívají třeba Mark Pilgrim, Phil Ringnalda, Simon Willison a další.

Jak se spamemu bránit, když jsou spameři bohatí, rychlí, chytří a bez skrupulí (Mark Pilgrim)? Zrušit komentáře by se mi nelíbilo. Takže nejspíš zvolím nějakou restrikci. Už jste, kolegové blogeři, uvažovali, jak se budete spamu bránit? Poraďte.

Související

Penispam

O spamu jsem na conBLOGu už párkrát psal. A určitě nejsem sám, komu spam vadí. A to je vadí poměrně velký eufemismus.

Právě před chvílí jsem z odpolední várky e-mailů vymazal (bez jediného) všechny maily. Suverénně nejvíce e-mailů bylo s nadpisem NATURAL PENIS ENLARGEMENT! No a pak že prý neplatí, že na velikosti nezáleží.

Všude o spamu

Otevřu noviny, spam. Otevřu internet, spam. Otevřu konzervu, sp…

O spamu napsal pár slov také Jiří Hlavenka na Živě. Nechci se nějak rozepisovat o obsahu článku, protože většina ze čtenářů conBLOGu ví, o čem je řeč. Docela mě zaujala tato pasáž:

Co je to spam? Internetoví guruové, nerdové, pionýři a svazáci nad otázkou mávnou opovržlivě rukou, protože oni to přece již dávno definovali. To ovšem jednak není pravda, a jednak to není důležité – co je a co není spam, ve smyslu „co je pro mě nežádoucí a co je přijatelné“, nerozhodují žádní rozumbradové, ale prostí uživatelé. Ostatně, žádná jednoznačná, jednoduchá, snadno zapamatovatelná a zvučně znějící definice spamu neexistuje ani dle oněch expertů.

Takže nám to zase nandal. Proč pan Hlavenka nemá rád odborníky? S chutí se do nich navezl, ale v diskuzi si (pro něj příznačně) neodpustí na konto kritického diskuzního příspěvku poznamenat: „…Kdyby se váš příspěvek obešel bez osobních útoků, bylo by to lepší…“.

Co nemám sám rád, nedělám jiným, se často míchá s tím, že ač všichni rovni, někteří jsou si rovnější.