[SIMILAR] WITH 16493 認式 WITH 12397 salad WITH 10312 ignore WITH 7748 果, WITH 7481 誤認 WITH 6721 式さ WITH 6506 probability WITH 6092 bayesian WITH 5991 ・sp WITH 5684 ・ha WITH 5684 閾値 WITH 5518 spammer WITH 4405 英単 WITH 3963 て誤 WITH 3931 が徐 WITH 3548 選別 WITH 3033 bsfilter WITH 2637 filter WITH 2562 還元 WITH 2542 確率 WITH 2461 word WITH 2460 す. WITH 2455 auto WITH 2434 る確 WITH 2309 に, WITH 2257 辞書 WITH 2254 観察 WITH 1963 body WITH 1891 spam WITH 1757 傾向 WITH 1739 無視 WITH 1514 default の検索結果 218 件中 1 - 10 件目 (0.093490605 秒)
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:3134)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:2358)
procmailからの移行を検討中。maildroptipsには、"if ( /^Subject: rosebud/ )"という例がある。こういうの好き。Rubyアプリケーションプログラミングには、パスタを茹でるのにテニスラケットを使う話が出ていたと思う。 mhフォルダへの振り分けは出来ないみたい。ので、強引に対処。 SHELL=/bin/sh MAILDIR=$H ...
_ (スコア:2320)
実家がアンチウィルスソフトを欲しいようなので、自宅PCでAVGを試してみた。 SMTP/POP proxyとしてメールをチェックする仕組みなので、MUAの設定変更が必要なのは面倒くさい メールのチェック結果をヘッダに入れる方法がないっぽい "高度な設定"から設定する項目と、概要->各コンポーネントで設定する項目とがあ ...
_ (スコア:2307)
そろそろリリースしよう。release 1.0.0に対する変更は以下のはず。 --mark-in-token # で落ちるバグ修正 --export-probability 追加(デバッグ用) --insert-revision 追加 --header-prefix 追加 --imap-auth loginc 追加。LOGIN命令でIMAP serverに接続 --imap-auth auto 追加。適当にIMAP serverに接続。デフォ ...
_ (スコア:2213)
--pipe, --insert-flag, --insert-probability追加 デフォルトのデータベース形式をsdbmに変更 デフォルトのspam判定方式をRobinsoh-Fisherに変更 ...
_ (スコア:2166)
ベイジアンフィルタによる迷惑メール対策の効果的な利用に関する考察 統計的フィルタリングに対するWord Salad 攻撃についての考察 Evaluation of Anti-spam Method Combining Bayesian Filtering and Strong Challenge and Response Density-Based Spam Detector| ...
_ (スコア:2113)
bsfilterはspamフィルターとしてもうほとんど完成していると思うので拡張のアイディアを出すのが難しそうですね。 ifileというbayesianベースのspamフィルタリングソフトがあるのですが、こいつはspamだけでなくcleanなメールの内容についても学習し、内容ごとに自動的に振り分けしてくれるという妙な進化をして ...
_ (スコア:2113)
Invalid Text気になるわけで。 H.Okada bsfilter 15というのはPaul Grahamが出してきたマジックナンバーなので、調整する余地はあるかも。 しゃれにならない日々。 対抗馬のmpは、blacklistを自動的にダウンロードする仕組みが付いている。Vipul's Razorと同じアプローチ? mp_spammer.txtには、"^from:.*@earth ...
_ (スコア:2006)
_ (スコア:10000)