[SIMILAR] WITH 10401 gdbm WITH 9100 bsfilter WITH 5545 sdbm WITH 5317 時) WITH 4434 行可 WITH 3658 長官 WITH 3139 clean WITH 2925 export WITH 2542 縮小 WITH 2532 import WITH 2390 revision WITH 1298 サポ WITH 1263 タベ WITH 1192 学習 WITH 1183 db WITH 945 spam WITH 900 移行 WITH 837 デフ WITH 557 ォル WITH 548 何度 WITH 546 ポー WITH 463 非常 WITH 438 以下 WITH 413 ベー WITH 360 ルト WITH 332 デー WITH 324 可能 WITH 278 ート WITH 276 フォ WITH 222 ータ WITH 140 ース WITH 1 [ の検索結果 224 件中 111 - 120 件目 (0.047697389 秒)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
Invalid Text気になるわけで。 H.Okada bsfilter 15というのはPaul Grahamが出してきたマジックナンバーなので、調整する余地はあるかも。 しゃれにならない日々。 対抗馬のmpは、blacklistを自動的にダウンロードする仕組みが付いている。Vipul's Razorと同じアプローチ? mp_spammer.txtには、"^from:.*@earth ...
_ (スコア:4732)
そろそろリリースしよう。release 1.0.0に対する変更は以下のはず。 --mark-in-token # で落ちるバグ修正 --export-probability 追加(デバッグ用) --insert-revision 追加 --header-prefix 追加 --imap-auth loginc 追加。LOGIN命令でIMAP serverに接続 --imap-auth auto 追加。適当にIMAP serverに接続。デフォ ...
_ (スコア:4730)
Invalid Textは駄目だったが、今回はうまくいったので、Exerb 3.2.0に移行。原因不明。 ...
_ (スコア:4556)
ベイジアンフィルタによる迷惑メール対策の効果的な利用に関する考察 統計的フィルタリングに対するWord Salad 攻撃についての考察 Evaluation of Anti-spam Method Combining Bayesian Filtering and Strong Challenge and Response Density-Based Spam Detector| ...
_ (スコア:4522)
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
_ (スコア:4521)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:4491)
--mark-spam-subjectで改行コードがおかしくなるバグ を修正してリリース。 改行コードのテストケースで、--mark-spam-subjectが指定されていなかった(テスト仕様バグ) 指定されていたとしても、バグを検出出来ないコードだった(テストコードバグ) ...
_ (スコア:4479)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:4289)
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:4259)
_ (スコア:4732)