[SIMILAR] WITH 4019 seen WITH 1516 bsfilter WITH 1226 ラグ WITH 1066 判定 WITH 699 フラ WITH 380 セッ WITH 226 問題 WITH 118 ット WITH 1 [ WITH 1 ] WITH 1 spam WITH 1 定す WITH 1 する WITH 1 る際 WITH 1 際に WITH 1 にse WITH 1 グが WITH 1 がセ WITH 1 トさ WITH 1 され WITH 1 れて WITH 1 てし WITH 1 しま WITH 1 まう WITH 1 うと WITH 1 とい WITH 1 いう WITH 1 うの WITH 1 のは WITH 1 は、 WITH 1 、や WITH 1 やっ の検索結果 181 件中 11 - 20 件目 (0.23236239 秒)
--pop-max-size number numberより大きなメイルは、判定、学習の対象にしない。単にバイパスする オプション名を微妙に変更 単位をバイトに戻した バイパスする際は、pop daemonからMUAへパイプラインで渡す。今までは、メイル全体をbsfilterが受け取った後、MUAに渡していた デフォルト値は30000(byte)。0はサ ...
Invalid Text-cはファイルを1個だけ引数に取るオプションであるという仕様は、ヰさんにとっても、たださんにとっても、普通ではないようなので仕様を変更。revision 1.26以降ではたださんの記述通りに使える。 -c、-sは、オプションとしては引数を取らない。コマンドラインとして引数を取る。 -c、-sを指定する ...
_ (スコア:3821)
SDBMサポート。デフォルトのmarshalに比べて、-s、-c、spam判定は格段に速い。-uはちょっと遅い。 データベースの肥大を抑える仕組みがそのうち必要になる? ...
_ (スコア:3821)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:3821)
Ceekz Logsに、日経新聞とその他新聞の判定でベンチする話が出ている。 kakasiよりbigramの方がいいらしい。 ...
_ (スコア:3821)
全てのreceivedヘッダを見ていたのを止めて、送り手に一番近いものだけを見るように変更。特にML経由の場合、後半のreceivedは見るだけ無駄なので。-Hを付けた方が判定精度が高いという話も、これが影響していたのかもしれない。 html中のnumeric character referenceを無視するように変更。FreeBSD-users-jp 7 ...
_ (スコア:3821)
やまだあきらさんのパッチに対応できてない。 未読管理とかの状態の保持 "Seen"のチェック、設定のみ? RFC822.HEADERを書き換えてappend? bsfilterの判定結果がヘッダに入っていると嬉しい? IMAPMessage class メイル1通に対応するclassを作るべきか 複数メイルのsequence number/UIDを一気に渡して、戻り値を配 ...
_ (スコア:3683)
逃避がてら,sh scriptを見てみました. mvしてからbsfilterしてるのは,ファイルのタイムスタンプをtouchで合わせるためですよね. 個人的にはprocessの起動を減らすため,mvで潰すように修正しようと思います. umaskかけておけば,chmodも要りません. ex. umask 077 bsfilter -a --pipe --... < $target > $target. ...
_ (スコア:3683)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:3666)
Invalid Text気になるわけで。 H.Okada bsfilter 15というのはPaul Grahamが出してきたマジックナンバーなので、調整する余地はあるかも。 しゃれにならない日々。 対抗馬のmpは、blacklistを自動的にダウンロードする仕組みが付いている。Vipul's Razorと同じアプローチ? mp_spammer.txtには、"^from:.*@earth ...
_ (スコア:3666)
_ (スコア:3821)