[SIMILAR] WITH 4621 大バ WITH 1516 bsfilter WITH 1386 バグ WITH 728 指摘 WITH 1 [ WITH 1 ] WITH 1 exit WITH 1 status WITH 1 グを WITH 1 をbb WITH 1 bbs WITH 1 で指 WITH 1 摘さ WITH 1 され WITH 1 れて WITH 1 てし WITH 1 しま WITH 1 まっ WITH 1 った WITH 1 た。 の検索結果 225 件中 61 - 70 件目 (0.109912596 秒)
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:2967)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:2967)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:2967)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:2967)
revisionでdirectoryを分けるよう、配付方法変更 --pop-msg-max-sizeの単位変更。数字が意味するのは、メイルの行数 --tasktray追加。タスクトレイに常駐する。VisualuRubyでpop proxyとして動作しているときに有効 bsfilter.exeとbsfilterw.exeを生成。 exerbのcorefileが違う bsfilterw.exeでstdin/stdout/st ...
_ (スコア:2967)
shで始まってunameを実行してrubyかruby_rか切り分ける起動方法が不評。例Gold fever。切り替える規準もいい加減だし、自分としても気持ちのいいコードではない。誰か、いい書き方、教えてくれないかしらん。 /usr/local/bin/ruby -x path_of_bsfilter .... で、PATHを追加することなく、cronから起動できると思 ...
_ (スコア:2967)
しつこく更新。 本文中の"From"を"unix from"だと誤解するケースがあるので、--mboxが指定されない限り、"unix from"を探さないように変更。 日本語のtokenizeに入る前に、">>"等の引用マークを削除するように変更。単語の途中で改行され、引用マークが入っても、単語として切り出すように努力する。 ...
_ (スコア:2967)
Smilezone::blogのおかげで勉強できた。 AUTHENTICATE命令のLOGINと、LOGIN命令は別 Net::IMAP#authenticate("login"...と、Net::IMAP#loginが、それぞれに対応 bsfilterは、--imap-auth loginと、--imap-auth logincで区別する 引数の名前がよろしくない感じ --imap-auth autoも追加 CAPABILITYを見つつ、"cra ...
_ (スコア:2967)
全てのreceivedヘッダを見ていたのを止めて、送り手に一番近いものだけを見るように変更。特にML経由の場合、後半のreceivedは見るだけ無駄なので。-Hを付けた方が判定精度が高いという話も、これが影響していたのかもしれない。 html中のnumeric character referenceを無視するように変更。FreeBSD-users-jp 7 ...
_ (スコア:2967)
_ (スコア:2967)