[SIMILAR] WITH 5655 robinson WITH 4804 command WITH 4550 bsfilter WITH 3539 自力 WITH 2950 で" WITH 2845 案中 WITH 2546 拡張 WITH 2159 思案 WITH 1025 オプ WITH 1015 確定 WITH 945 spam WITH 837 デフ WITH 830 プシ WITH 793 コマ WITH 780 力で WITH 734 を付 WITH 675 る? WITH 613 が自 WITH 557 ォル WITH 496 指定 WITH 480 パイ WITH 443 イプ WITH 386 メイ WITH 360 ルト WITH 276 フォ WITH 264 にす WITH 264 マン WITH 258 付け WITH 236 イル WITH 198 ンド WITH 178 ョン WITH 160 ショ の検索結果 271 件中 21 - 30 件目 (0.116976009 秒)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:4216)
--ignore-plain-text-part htmlのパートがある時、plain textのパートを無視するオプションを追加 mew.tgz BBSでの指摘に従い、bsfilter.el更新 ...
_ (スコア:4208)
SDBMサポート。デフォルトのmarshalに比べて、-s、-c、spam判定は格段に速い。-uはちょっと遅い。 データベースの肥大を抑える仕組みがそのうち必要になる? ...
_ (スコア:4163)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:4153)
そろそろリリースしよう。release 1.0.0に対する変更は以下のはず。 --mark-in-token # で落ちるバグ修正 --export-probability 追加(デバッグ用) --insert-revision 追加 --header-prefix 追加 --imap-auth loginc 追加。LOGIN命令でIMAP serverに接続 --imap-auth auto 追加。適当にIMAP serverに接続。デフォ ...
_ (スコア:4147)
ruby-1.6.4でエラーするのを対策したつもり IMAPでアクセスするとき、フォルダ単位だけでなく、メイル単位の指定も可能に bsfilter --imap inbox/1 bsfilter --imap inbox/1,2,3 bsfilter --imap inbox/1:3 勢いでChaSen, KAKASIもサポート ...
_ (スコア:4147)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:4138)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:4138)
やまだあきらさん作のwl-bsfilter.elが公開。 \ay diary、Re: Mark & Action (Re: 2種類の削除コマンド)から。 ...
_ (スコア:4126)
_ (スコア:4225)