Spamlog - Haszprus überblog

Spamlog

©   Haszprus   |   fejlesztés, reklám, php

Spamlog

A cucc naponként egy text/xml adatbázist dolgoz fel, amiben el vannak mentve a spamküldés részletes körülményei. Ebből a logolásból egyébként sok érdekes tapasztalatra tehetünk szert, így pl. az alábbiakra:

  • A kommenteket (egy részüket legalábbis) egyértelműen valami spambot (szoftver) hagyja, mivel előfordulnak a kitöltött mezők között olyanok is, amik már rég más névre hallgatnak (így pl. az anon_nick neve régóta vendeg_nev, mégis jönnek spamek kitöltött anon_nick mezővel - érdemes hát betenni a szűrési feltételek közé azt, hogy amennyiben van anon_nick a $_REQUEST-ben, akkor nyilvánvalóan spammel van dolgunk).

  • Javascriptet a legritkább esetben futtatják le, ez egyrészt következik a fentiből, másrészt a logban látható, hogy a javascript által létrehozott mezők nincsenek kitöltve.
  • Értelmi képességekkel nem rendelkeznek, a noscript esetén megjelenő szorzást nem végzik el, az eredmény helyére gyakorta egyéb szöveget vagy reklámurl-t pakolnak.
  • Gyakran üres kommentet próbálnak meg beküldeni.
  • Vannak annyira primitív botok akik a pw nevű input mezőbe is url-t próbálnak beírni aztán csodálkoznak hogy nem jelenik meg a hozzászólásuk…

RSS: hozzászólások ehhez a bejegyzéshez 7 hozzászólás - Szólj hozzá Te is!


Hasznos így kielemezni, mert könnyebben rá lehet jönni a spambotok gyengéire. Jó ötlet, nekem eddig nem jutott eszembe. Bár igaz, hogy hozzám még egy spam sem jött

2) adamo
Ez a spamfaktor mi a szösz? leütött karakterek száma?

Eheh nem. Van egy rakás spamgyanús dolog (szavak, linkek, egyéb jellemzők), ezeket számolja a $spamfactorban, s ha ez a szám x-nél nagyobb akkor hótziher hogy spammel van dolgunk. Emellett 0-s spamfactorú spam is előfordulhat, ilyenek tipikusan azok a spamek ahol a hülye bot nem tudja hogy mit kell írni a user/pass mezőkbe, és benyom oda is valami reklámot… Ekkor a hozzászólás elhalálozik mindenféle spamfactor-számítgatás nélkül.

Mivel a spamlog elérte a napi 4 megát (750 spam/nap, és némely spamek több oldal hosszúságúak), ami a php-t memóriaallokációs problémákra vezeti, ezért mostantól az adatok jórészét nem rögzítem, csak a spamek kiértékelését (spamfactor, badness, időpont, és az első 100 karakter).

Pillanatnyilag a spamszűrés nem szorul tökéletesítésre (mert tökéletes ), úgyhogy ez így nem is okoz problémát.

Különben ha a kommentküldő form actionjét js töltené ki, akkor még csak a küldésig se tudnának eljutni a botok. Cserébe js nélkül nem lehetne kommentálni (kivéve bejelentkezve). Vajon az gáz lenne? Hordozható eszközökön mennyire szokott js lenni (bekapcsolva)?

Van egy olyan gyanúm, hogy már userregisztráció-"spammel" is dolgunk van… Köztünk vannak…


A spammerek már a spájzban vannak!


Egy évnél régebbi bejegyzésekhez nem lehet hozzászólni.