[SIMILAR] WITH 15006 inbox WITH 8246 phenterm0ne WITH 8246 medications WITH 8246 覧. WITH 7748 リ形 WITH 7380 roberts WITH 7323 ダ構 WITH 6955 知) WITH 3939 チメ WITH 3508 multipart WITH 3033 bsfilter WITH 3033 用ア WITH 2950 で" WITH 2471 ascii WITH 2195 と, WITH 1733 アタ WITH 1526 愛知 WITH 1381 実行 WITH 1230 す. WITH 1217 ト上 WITH 1140 一覧 WITH 1030 タッ WITH 1012 ィレ WITH 998 行す WITH 977 形式 WITH 849 構成 WITH 763 表示 WITH 756 中身 WITH 742 ナリ WITH 677 ジナ WITH 676 を実 WITH 654 リジ の検索結果 209 件中 61 - 70 件目 (0.095657519 秒)
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:1121)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:1121)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:1121)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:1121)
revisionでdirectoryを分けるよう、配付方法変更 --pop-msg-max-sizeの単位変更。数字が意味するのは、メイルの行数 --tasktray追加。タスクトレイに常駐する。VisualuRubyでpop proxyとして動作しているときに有効 bsfilter.exeとbsfilterw.exeを生成。 exerbのcorefileが違う bsfilterw.exeでstdin/stdout/st ...
_ (スコア:1121)
しつこく更新。 本文中の"From"を"unix from"だと誤解するケースがあるので、--mboxが指定されない限り、"unix from"を探さないように変更。 日本語のtokenizeに入る前に、">>"等の引用マークを削除するように変更。単語の途中で改行され、引用マークが入っても、単語として切り出すように努力する。 ...
_ (スコア:1121)
そろそろリリースしよう。release 1.0.0に対する変更は以下のはず。 --mark-in-token # で落ちるバグ修正 --export-probability 追加(デバッグ用) --insert-revision 追加 --header-prefix 追加 --imap-auth loginc 追加。LOGIN命令でIMAP serverに接続 --imap-auth auto 追加。適当にIMAP serverに接続。デフォ ...
_ (スコア:1121)
Smilezone::blogのおかげで勉強できた。 AUTHENTICATE命令のLOGINと、LOGIN命令は別 Net::IMAP#authenticate("login"...と、Net::IMAP#loginが、それぞれに対応 bsfilterは、--imap-auth loginと、--imap-auth logincで区別する 引数の名前がよろしくない感じ --imap-auth autoも追加 CAPABILITYを見つつ、"cra ...
_ (スコア:1121)
全てのreceivedヘッダを見ていたのを止めて、送り手に一番近いものだけを見るように変更。特にML経由の場合、後半のreceivedは見るだけ無駄なので。-Hを付けた方が判定精度が高いという話も、これが影響していたのかもしれない。 html中のnumeric character referenceを無視するように変更。FreeBSD-users-jp 7 ...
_ (スコア:1121)
_ (スコア:1121)