[SIMILAR] WITH 7696 行コ WITH 4252 グ開 WITH 3613 改行 WITH 1516 bsfilter WITH 1176 デバ WITH 728 指摘 WITH 545 ッグ WITH 456 開始 WITH 394 コー WITH 333 バッ WITH 294 ード WITH 1 [ WITH 1 ] WITH 1 ドが WITH 1 がお WITH 1 おか WITH 1 かし WITH 1 しい WITH 1 いと WITH 1 と指 WITH 1 摘さ WITH 1 され WITH 1 れた WITH 1 たの WITH 1 ので WITH 1 で、 WITH 1 、デ WITH 1 始。 の検索結果 208 件中 61 - 70 件目 (0.203586652 秒)
POP daemon -> bsfilterでヘッダ追加 -> POPでメイルを取ってくる普通のMUA というのが出来ると嬉しいですか? IMAP関連の仕様を決定して、ベータという言い訳を止めるのが先のような気もするが。 ...
"特集2 スクリプトはなかなか役立ちます"の表に、bsfilterが出ている。tDiary, Hikiと並んで :-) リンク集もある。 著者の吉田さんは、第二の住人だ。 ...
_ (スコア:1551)
SDBMサポート。デフォルトのmarshalに比べて、-s、-c、spam判定は格段に速い。-uはちょっと遅い。 データベースの肥大を抑える仕組みがそのうち必要になる? ...
_ (スコア:1551)
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
_ (スコア:1551)
Invalid Text --show-new-token追加。新たに登録されたtokenが表示される。 Content-Type: Message/Rfc822なパートのヘッダ部分が、本文扱いだったのをいい加減に修正。ソースが0.2procmailくらいになったので、なんとかしたい。 ...
_ (スコア:1551)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:1551)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:1551)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:1551)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:1551)
revisionでdirectoryを分けるよう、配付方法変更 --pop-msg-max-sizeの単位変更。数字が意味するのは、メイルの行数 --tasktray追加。タスクトレイに常駐する。VisualuRubyでpop proxyとして動作しているときに有効 bsfilter.exeとbsfilterw.exeを生成。 exerbのcorefileが違う bsfilterw.exeでstdin/stdout/st ...
_ (スコア:1551)
_ (スコア:1551)