[SIMILAR] WITH 24024 options WITH 20030 mailbox WITH 14426 authenticate WITH 14044 imap WITH 12619 preference WITH 8640 000000000 WITH 8246 teranisi WITH 6892 auth WITH 6506 2235 WITH 5655 password WITH 3033 bsfilter WITH 2455 auto WITH 1388 user WITH 1309 0900 WITH 438 以下 WITH 134 ミ!! WITH 122 ツッ WITH 117 ッコ WITH 115 コミ WITH 1 !! WITH 1 ( WITH 1 ) WITH 1 こん WITH 1 んな WITH 1 なと WITH 1 とこ WITH 1 ころ WITH 1 ろに WITH 1 にす WITH 1 すみ WITH 1 みま WITH 1 ませ の検索結果 196 件中 71 - 80 件目 (0.109975755 秒)
Invalid Text --show-new-token追加。新たに登録されたtokenが表示される。 Content-Type: Message/Rfc822なパートのヘッダ部分が、本文扱いだったのをいい加減に修正。ソースが0.2procmailくらいになったので、なんとかしたい。 ...
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
_ (スコア:709)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:709)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:709)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:709)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:709)
revisionでdirectoryを分けるよう、配付方法変更 --pop-msg-max-sizeの単位変更。数字が意味するのは、メイルの行数 --tasktray追加。タスクトレイに常駐する。VisualuRubyでpop proxyとして動作しているときに有効 bsfilter.exeとbsfilterw.exeを生成。 exerbのcorefileが違う bsfilterw.exeでstdin/stdout/st ...
_ (スコア:709)
shで始まってunameを実行してrubyかruby_rか切り分ける起動方法が不評。例Gold fever。切り替える規準もいい加減だし、自分としても気持ちのいいコードではない。誰か、いい書き方、教えてくれないかしらん。 /usr/local/bin/ruby -x path_of_bsfilter .... で、PATHを追加することなく、cronから起動できると思 ...
_ (スコア:709)
しつこく更新。 本文中の"From"を"unix from"だと誤解するケースがあるので、--mboxが指定されない限り、"unix from"を探さないように変更。 日本語のtokenizeに入る前に、">>"等の引用マークを削除するように変更。単語の途中で改行され、引用マークが入っても、単語として切り出すように努力する。 ...
_ (スコア:709)
全てのreceivedヘッダを見ていたのを止めて、送り手に一番近いものだけを見るように変更。特にML経由の場合、後半のreceivedは見るだけ無駄なので。-Hを付けた方が判定精度が高いという話も、これが影響していたのかもしれない。 html中のnumeric character referenceを無視するように変更。FreeBSD-users-jp 7 ...
_ (スコア:709)
_ (スコア:709)