[SIMILAR] WITH 5832 応作 WITH 1516 bsfilter WITH 426 作業 WITH 398 対応 WITH 1 [ WITH 1 ] WITH 1 mew4 WITH 1 業を WITH 1 を始 WITH 1 始め WITH 1 めた WITH 1 た。 の検索結果 210 件中 51 - 60 件目 (0.107300053 秒)
SDBMサポート。デフォルトのmarshalに比べて、-s、-c、spam判定は格段に速い。-uはちょっと遅い。 データベースの肥大を抑える仕組みがそのうち必要になる? ...
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
_ (スコア:2504)
Invalid Text --show-new-token追加。新たに登録されたtokenが表示される。 Content-Type: Message/Rfc822なパートのヘッダ部分が、本文扱いだったのをいい加減に修正。ソースが0.2procmailくらいになったので、なんとかしたい。 ...
_ (スコア:2504)
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
_ (スコア:2504)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:2504)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:2504)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:2504)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:2504)
revisionでdirectoryを分けるよう、配付方法変更 --pop-msg-max-sizeの単位変更。数字が意味するのは、メイルの行数 --tasktray追加。タスクトレイに常駐する。VisualuRubyでpop proxyとして動作しているときに有効 bsfilter.exeとbsfilterw.exeを生成。 exerbのcorefileが違う bsfilterw.exeでstdin/stdout/st ...
_ (スコア:2504)
shで始まってunameを実行してrubyかruby_rか切り分ける起動方法が不評。例Gold fever。切り替える規準もいい加減だし、自分としても気持ちのいいコードではない。誰か、いい書き方、教えてくれないかしらん。 /usr/local/bin/ruby -x path_of_bsfilter .... で、PATHを追加することなく、cronから起動できると思 ...
_ (スコア:2504)
_ (スコア:2504)