[SIMILAR] WITH 7748 系ツ WITH 6198 qpopper WITH 4494 fetchmail WITH 4434 procmail WITH 3942 ル経 WITH 2542 文中 WITH 2371 新着 WITH 2324 経路 WITH 2059 着メ WITH 1582 freebsd WITH 1516 bsfilter WITH 1159 メイ WITH 1123 本文 WITH 1117 一切 WITH 1014 ロバ WITH 944 ーモ WITH 757 条件 WITH 708 イル WITH 695 イダ WITH 590 自宅 WITH 585 from WITH 531 ツー WITH 445 モン WITH 430 カル WITH 421 現在 WITH 346 ーカ WITH 332 デー WITH 331 ェッ WITH 328 マー WITH 314 途中 WITH 294 チェ WITH 281 バイ の検索結果 303 件中 161 - 170 件目 (0.159890945 秒)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
SIGHUPだとwindowsで問題があるそうなので、SIGINTを待つようにした。 ~/.bsfilter/bsfilter.pidを作るようにした。 --pop-proxy-setは複数回指定できるようにした。 ...
_ (スコア:1099)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:1099)
Invalid Text BBSでの議論にもとづき、-c、-sでfindするのを止めた。 今後は、-c ~/Mail/inboxでは駄目で、-c ~/Mail/inbox/*とする必要がある。 ~/.bsfilter/bsfilter.confを読むようにした。--config-fileで指定することも出来る。--homedirと、--config-fileで、ハイフンの有無が違うのが、気持ち悪い。--co ...
_ (スコア:1099)
bsfilter -uでフォルダ名が必要なのはバグなので修正。確認していないけど。 ...
_ (スコア:1099)
_ (スコア:1099)