[SIMILAR] WITH 6593 開中 WITH 3033 bsfilter WITH 1790 中止 WITH 1753 release WITH 914 公開 WITH 693 バグ WITH 606 判断 WITH 365 間違 WITH 355 更新 WITH 1 [ WITH 1 ] WITH 1 - WITH 1 1 WITH 1 . WITH 1 0 WITH 1 8 WITH 1 大き WITH 1 きな WITH 1 なバ WITH 1 グが WITH 1 があ WITH 1 あっ WITH 1 った WITH 1 たの WITH 1 ので WITH 1 で公 WITH 1 止に WITH 1 にし WITH 1 した WITH 1 のだ WITH 1 だけ WITH 1 けど の検索結果 276 件中 41 - 50 件目 (0.21354215 秒)
こんなところにすみません、1.0.10 ですが、--imap で --add-spam できません。あってるか分かりませんが、以下のようにしたら動きました。 --- bsfilter.dist 2005-11-14 23:52:36.000000000 +0900 +++ bsfilter 2006-01-12 15:39:11.000000000 +0900 @@ -2235,7 +2235,7 @@ else imap = Net::IMAP::new(@opti ...
revision 1.67.2.1 で対応してみた。 --ssl use POP over SSL with --pop option --ssl-cert filename|dirname specify a filename of a certificate of a trusted CA or a name of a directory of certificates --ssl-certが指定されていない場合は、verify_mode=nilで、検証しない 指定されている場合は、ver ...
_ (スコア:3886)
SourceForge.jp 経由で bsfilter-1.0.14.rc1.tgz を入手しようとしたところ、 avast! Antivirus により、当該ファイルにはトロイの木馬「Win32:Ruby [Trj]」 が含まれているとの警告を受けました。 avast! version 4.7 Professional Build: May 2006 4.7.827 VPS ファイル (ウイルス・データベース) 編集日 : 2 ...
_ (スコア:3886)
1.31.4.7を数日、使って問題なかったら、これを1.32とする。 1.32.4系列では、データベースの無限膨張を抑える仕組みを入れる。 3ヶ月間、楽しく作って来たけど、そろそろ終わりかしら。 ...
_ (スコア:3886)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...
_ (スコア:3886)
utf-8サポート iconvが使えれば、utf-8をeucJPに変換しようとする 本文についてはcharsetを信用しない。signatureがマッチしたらiconvする ヘッダについてはcharsetを信用する。 utf-8なメイルは日本語と判定する。 pop proxy時にlistenするインターフェイスを指定可能 例えば、--pop-proxy-port 127.0.0.1:101 ...
_ (スコア:3886)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:3886)
-aが実用的でないので改造。 -aの場合、exitしてspamか否かをstatus codeで返す直前に、子プロセスをfork。親がexitしたあとに、子がデータベースの更新を行なう。子の処理時間は一見、見えない。 --synchronous-auto-updateは、旧-aに相当。forkせずに、データベースの更新をしてからexit。 tokenizerも少し変 ...
_ (スコア:3886)
日本語化関連のToDoが投稿されている。 ISO-2022-JP 以外の文字コードへの対応(パッチとしてすでに公開していますが本家にマージする作業が残っています) base64、Quoted Printable への対応 途中で改行されてしまった日本語の単語への対応 Subject の分かち書き insert.pl の日本語化(本家にマージする作業が ...
_ (スコア:3886)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:3886)
_ (スコア:3886)