[SIMILAR] WITH 7055 語sp WITH 6676 策? WITH 4850 printable WITH 4672 boundary WITH 3967 shift WITH 3033 手先 WITH 3027 合法 WITH 2726 はsh WITH 2604 ル入 WITH 2440 encoding WITH 2247 本文 WITH 2146 jis WITH 1891 spam WITH 1629 subject WITH 1582 freebsd WITH 713 入手 WITH 574 対策 WITH 507 プル WITH 506 何故 WITH 482 本語 WITH 443 スペ WITH 411 残念 WITH 386 メイ WITH 344 ンプ WITH 323 サン WITH 248 ペー WITH 236 イル WITH 183 日本 WITH 140 ース WITH 1 [ WITH 1 ] WITH 1 - の検索結果 212 件中 41 - 50 件目 (1.605888275 秒)
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
_ (スコア:1290)
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:1290)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:1290)
PGP keyserverあたりで公開鍵を拾われて、暗号化されたspamが送られることはないのだろうか。結構、嫌な状況だと思うが。送信側のコストが高いか。 ...
_ (スコア:1290)
bsfilterはspamフィルターとしてもうほとんど完成していると思うので拡張のアイディアを出すのが難しそうですね。 ifileというbayesianベースのspamフィルタリングソフトがあるのですが、こいつはspamだけでなくcleanなメールの内容についても学習し、内容ごとに自動的に振り分けしてくれるという妙な進化をして ...
_ (スコア:1290)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:1290)
_ (スコア:1293)