[SIMILAR] WITH 7748 formail WITH 5027 語メ WITH 4550 bsfilter WITH 4405 英単 WITH 2402 command WITH 1765 ル中 WITH 1355 想定 WITH 1104 ッダ WITH 1063 単語 WITH 1025 オプ WITH 945 spam WITH 830 プシ WITH 730 ヘッ WITH 690 実行 WITH 578 修正 WITH 482 本語 WITH 455 追加 WITH 386 メイ WITH 236 イル WITH 226 問題 WITH 183 日本 WITH 178 ョン WITH 160 ショ WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 . WITH 1 19 WITH 1 中の WITH 1 の英 WITH 1 語の WITH 1 の扱 の検索結果 245 件中 11 - 20 件目 (0.207963136 秒)
やまだあきらさんのパッチに対応できてない。 未読管理とかの状態の保持 "Seen"のチェック、設定のみ? RFC822.HEADERを書き換えてappend? bsfilterの判定結果がヘッダに入っていると嬉しい? IMAPMessage class メイル1通に対応するclassを作るべきか 複数メイルのsequence number/UIDを一気に渡して、戻り値を配 ...
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:3877)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:3877)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:3864)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:3864)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:3864)
Invalid Text気になるわけで。 H.Okada bsfilter 15というのはPaul Grahamが出してきたマジックナンバーなので、調整する余地はあるかも。 しゃれにならない日々。 対抗馬のmpは、blacklistを自動的にダウンロードする仕組みが付いている。Vipul's Razorと同じアプローチ? mp_spammer.txtには、"^from:.*@earth ...
_ (スコア:3864)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...
_ (スコア:3862)
procmailのロックするタイミングが、recipeに入ったときではなく、recipe内のアクションを実行するときのようで、bsfilterが同時に複数、起動されている気がする。ので、bsfilter側でロックするように変更。 ...
_ (スコア:3850)
shで始まってunameを実行してrubyかruby_rか切り分ける起動方法が不評。例Gold fever。切り替える規準もいい加減だし、自分としても気持ちのいいコードではない。誰か、いい書き方、教えてくれないかしらん。 /usr/local/bin/ruby -x path_of_bsfilter .... で、PATHを追加することなく、cronから起動できると思 ...
_ (スコア:3849)
_ (スコア:3910)