[SIMILAR] WITH 7748 junkmailcontrol WITH 7380 bsfilterw WITH 6425 部プ WITH 1516 bsfilter WITH 1281 外部 WITH 453 使用 WITH 439 ラム WITH 416 説明 WITH 314 グラ WITH 295 ログ WITH 249 プロ WITH 1 [ WITH 1 ] WITH 1 plugin WITH 1 for WITH 1 edmax WITH 1 明で WITH 1 で使 WITH 1 用さ WITH 1 され WITH 1 れて WITH 1 てい WITH 1 いる WITH 1 る外 WITH 1 ムが WITH 1 がbs WITH 1 . WITH 1 exe の検索結果 250 件中 11 - 20 件目 (0.184443189 秒)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:1210)
普通にインストール出来る。 perl-5.8, p5-Text-Kakasiをportsからmake install マルチプラットホーム版POPFileをget、展開 日本語化パッチ(popfile_jpn_src.zip)をget、展開 日本語化パッチのClassifier, UI, languages, manual, stopwordsで、マルチプラットホーム版を上書き perl5.8.0 -I /usr/local/lib/pe ...
_ (スコア:1196)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...
_ (スコア:1196)
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
_ (スコア:1196)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:1196)
ruby-1.6.4でエラーするのを対策したつもり IMAPでアクセスするとき、フォルダ単位だけでなく、メイル単位の指定も可能に bsfilter --imap inbox/1 bsfilter --imap inbox/1,2,3 bsfilter --imap inbox/1:3 勢いでChaSen, KAKASIもサポート ...
_ (スコア:1196)
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:1196)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:1196)
SIGHUPだとwindowsで問題があるそうなので、SIGINTを待つようにした。 ~/.bsfilter/bsfilter.pidを作るようにした。 --pop-proxy-setは複数回指定できるようにした。 ...
_ (スコア:1196)
_ (スコア:1219)