[SIMILAR] WITH 15083 同上 WITH 8118 一括 WITH 7748 用fr WITH 6162 。bc WITH 5802 ス更 WITH 4813 括し WITH 4723 。bm WITH 4434 procmail WITH 3942 flag WITH 3139 clean WITH 2836 spam WITH 2814 。bs WITH 2132 判定 WITH 1654 上。 WITH 1516 bsfilter WITH 1495 て同 WITH 1263 タベ WITH 1119 見逃 WITH 582 が付 WITH 534 場合 WITH 504 合は WITH 493 定。 WITH 413 ベー WITH 386 メイ WITH 355 更新 WITH 334 の場 WITH 332 デー WITH 328 マー WITH 284 必要 WITH 239 ーク WITH 236 イル WITH 222 ータ の検索結果 237 件中 11 - 20 件目 (0.114663022 秒)
procmailではなくmaildropあたりを使うのか、ぐっと来る機能をbsfilterに追加するのか。 ...
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:1919)
procmailの仲間で、受け取ったメイルを振り分ける奴ですか? だと、ちょっと力不足。 .procmailrcの文法が謎だったり、ソースが暗号だったり、バグってるような気がするのは、"それはまた別の話"。 ...
_ (スコア:1903)
procmailバグってますか? 踏んだことないけど。 パターンマッチさせて外部プログラムに渡しちゃえば、あとはそっちの話なので、procmail駆使する程でもないですよね。 でも、最初からFWの外に出しておいて、ヱブメールがやっぱり簡単な様な気がする。 ...
_ (スコア:1893)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:1809)
procmailのロックするタイミングが、recipeに入ったときではなく、recipe内のアクションを実行するときのようで、bsfilterが同時に複数、起動されている気がする。ので、bsfilter側でロックするように変更。 ...
_ (スコア:1785)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:1584)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:1536)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
_ (スコア:1386)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:1345)
_ (スコア:1928)