[SIMILAR] WITH 10268 ト値 WITH 7748 更単 WITH 7748 効デ WITH 7748 新me WITH 7748 更mv WITH 6858 number WITH 6066 bsfilter WITH 5991 tokenizer WITH 5545 全プ WITH 5440 ズ制 WITH 4672 数制 WITH 4405 行数 WITH 3931 を微 WITH 3667 ル全 WITH 3049 限な WITH 2446 、判 WITH 2399 ン名 WITH 2393 。0 WITH 2390 revision WITH 2385 学習 WITH 2288 味す WITH 2261 イパ WITH 2218 習の WITH 2132 判定 WITH 2046 先頭 WITH 1821 line WITH 1688 制限 WITH 1675 デフ WITH 1613 pop WITH 1480 ル( WITH 1450 定、 WITH 1440 ロト の検索結果 201 件中 41 - 50 件目 (0.066250015 秒)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:2354)
POP daemon -> bsfilterでヘッダ追加 -> POPでメイルを取ってくる普通のMUA というのが出来ると嬉しいですか? IMAP関連の仕様を決定して、ベータという言い訳を止めるのが先のような気もするが。 ...
_ (スコア:2351)
postfix -> bsfilter -> sieve -> cyrus imapd という経路での使用方法が説明されている。参考になる。 config-fileとhomedirが指定されている状態で、"HOME が ENV にないと bsfilter がエラーでこける。"というのはバグだ。 ...
_ (スコア:2333)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:2333)
日本語メイル中の英単語の扱いに問題があったので、修正。 --exec-spam "command args.."のようなオプションを付けようか迷っている。 ~/Mail/inbox/*に対してbsfilterを実行し、spamについてはformailで X-Spam-Flag: Yesヘッダを追加するというのを想定。 ...
_ (スコア:2333)
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
_ (スコア:2333)
_ (スコア:2380)