[SIMILAR] WITH 11983 spamassassin WITH 6721 布物 WITH 5926 ヰ) WITH 5440 事読 WITH 1582 freebsd WITH 1106 配布 WITH 945 spam WITH 558 ィル WITH 534 ルタ WITH 507 プル WITH 354 イラ WITH 344 ンプ WITH 323 サン WITH 317 フィ WITH 290 ラス WITH 282 記事 WITH 134 ミ!! WITH 129 スト WITH 122 ツッ WITH 117 ッコ WITH 115 コミ WITH 1 !! WITH 1 ( WITH 1 ) WITH 1 の配 WITH 1 物の WITH 1 の中 WITH 1 中に WITH 1 に、 WITH 1 、sp WITH 1 のサ WITH 1 ルが の検索結果 275 件中 171 - 180 件目 (3.860661293 秒)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:586)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:586)
procmailからの移行を検討中。maildroptipsには、"if ( /^Subject: rosebud/ )"という例がある。こういうの好き。Rubyアプリケーションプログラミングには、パスタを茹でるのにテニスラケットを使う話が出ていたと思う。 mhフォルダへの振り分けは出来ないみたい。ので、強引に対処。 SHELL=/bin/sh MAILDIR=$H ...
_ (スコア:586)
無関係な単語を大量に含むspamが増えてきた。人間の目には入らないように、という工夫も無い。それは、spam filter対策として反則だろう。もともとspamは反則なのだが。 ...
_ (スコア:586)
bsfilterででもbogofilterででもいいのだが、 spamらしきメイルはユーザに送らず、どこかに保存 保存したspamは、1日に1回、1通にまとめて、ユーザに送る というような運用をしているドメインはあるのだろうか。 ...
_ (スコア:586)
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:586)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:586)
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
_ (スコア:586)
_ (スコア:586)