[SIMILAR] WITH 7882 hfilter WITH 1445 方式 WITH 1263 タベ WITH 1120 仕組 WITH 1048 共有 WITH 945 spam WITH 558 ィル WITH 534 ルタ WITH 413 ベー WITH 332 デー WITH 317 フィ WITH 222 ータ WITH 140 ース WITH 1 [ WITH 1 ] WITH 1 のmd WITH 1 md5 WITH 1 を溜 WITH 1 溜め WITH 1 める WITH 1 る方 WITH 1 式の WITH 1 のフ WITH 1 タ。 WITH 1 。vi WITH 1 viplu WITH 1 ' WITH 1 s WITH 1 razor WITH 1 のよ WITH 1 よう WITH 1 うに の検索結果 156 件中 1 - 10 件目 (0.378293307 秒)
<strong>spamstrong><strong>のMDstrong>5<strong>を溜strong><strong>めるstrong><strong>方式strong><strong>のフstrong><strong>ィルstrong><strong>タ。strong><strong>Viplustrong><strong>'strong>s Razorのように、<strong>デーstrong><strong>タベstrong><strong>ースstrong>を<strong>共有strong>する<strong>仕組strong>みが欲しいかも。 ...
Invalid Text気になるわけで。 H.Okada bsfilter <strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>5というのはPaul Grahamが出してきたマジックナンバーなので、調整する余地はあるかも。 しゃれにならない日々。 対抗馬のmpは、blacklistを自動的にダウンロードする<strong>仕組strong>みが付いている<strong>。Vistrong>pul<strong>'strong>s Razorと同じアプローチ? mp_<strong>spamstrong>mer.txtには、"^from:.*@earth ...
_ (スコア:2458)
--pipe, --insert-flag, --insert-probability追加 デフォルトの<strong>デーstrong><strong>タベstrong><strong>ースstrong>形式をsdbmに変更 デフォルトの<strong>spamstrong>判定<strong>方式strong>をRobinsoh-Fisherに変更 ...
_ (スコア:2398)
Invalid Text ほんの少し高速化 連続していない漢字(==<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>文字を削ってProzacで試すよう ...
_ (スコア:2292)
SDBMサポート。デフォルトのmarshalに比べて、-s、-c、<strong>spamstrong>判定は格段に速い。-uはちょっと遅い。 <strong>デーstrong><strong>タベstrong><strong>ースstrong>の肥大を抑える<strong>仕組strong>みがそのうち必要になる? ...
_ (スコア:2136)
<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>.3<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>.4.7を数日、使って問題なかったら、これを<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>.32とする。 <strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>.32.4系列では、<strong>デーstrong><strong>タベstrong><strong>ースstrong>の無限膨張を抑える<strong>仕組strong>みを入れる。 3ヶ月間、楽しく作って来たけど、そろそろ終わりかしら。 ...
_ (スコア:2136)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-<strong>spamstrong> | bsfilter --db gdbm --import-<strong>spamstrong> bsfilter --db gdbm -u <strong>デーstrong><strong>タベstrong><strong>ースstrong>を縮小するとき(デフォルトでは<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>0000通を ...
_ (スコア:2012)
動作は以下のようになる。 --add-<strong>spamstrong> <strong>spamstrong>中のtokenの出現回数を、<strong>デーstrong><strong>タベstrong><strong>ースstrong>に加算する。 --update <strong>デーstrong><strong>タベstrong><strong>ースstrong>に入っている全tokenについて、今までの出現回数から<strong>spamstrong>確率を計算する。 --add-<strong>spamstrong> --update <strong>spamstrong>中のtokenの出現回数を、<strong>デーstrong><strong>タベstrong><strong>ースstrong>に加算し、その<strong>spamstrong>中のtokenについてのみ、<strong>spamstrong>確率を ...
_ (スコア:1968)
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham<strong>方式strong>の場合、キーとなった<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>5tokenの<strong>SPAMstrong>確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:1944)
Gary Robinson<strong>方式strong>導入。サンプルが少ない場合はPaul Graham<strong>方式strong>の方が正答率が高くなりそうな気がしないでもない。 Paul Graham<strong>方式strong>では<strong>spamstrong>確率が0と<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>strong>近辺に寄るが、Gary Robinson<strong>方式strong>では結構ちらばる。ので、--<strong>spamstrong>_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:1885)
_ (スコア:10000)