[SIMILAR] WITH 15473 maildir WITH 7933 folder WITH 7748 maildroptips WITH 7748 xfilter WITH 7323 rosebud WITH 6721 logfile WITH 6506 probability WITH 6309 maildrop WITH 4479 mh WITH 4434 procmail WITH 4008 insert WITH 3942 flag WITH 3033 bsfilter WITH 2985 nabeken WITH 2836 spam WITH 2548 ラケ WITH 2211 home WITH 2157 討中 WITH 2067 テニ WITH 1629 subject WITH 1618 強引 WITH 1514 default WITH 1087 ニス WITH 1067 対処 WITH 948 ラミ WITH 900 移行 WITH 895 new WITH 876 リケ WITH 778 検討 WITH 693 アプ WITH 682 スラ WITH 589 ルダ の検索結果 509 件中 21 - 30 件目 (0.08915854 秒)
bsfilterででもbogofilterででもいいのだが、 spamらしきメイルはユーザに送らず、どこかに保存 保存したspamは、1日に1回、1通にまとめて、ユーザに送る というような運用をしているドメインはあるのだろうか。 ...
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:1514)
bsfilterはspamフィルターとしてもうほとんど完成していると思うので拡張のアイディアを出すのが難しそうですね。 ifileというbayesianベースのspamフィルタリングソフトがあるのですが、こいつはspamだけでなくcleanなメールの内容についても学習し、内容ごとに自動的に振り分けしてくれるという妙な進化をして ...
_ (スコア:1501)
ベイジアンフィルタによる迷惑メール対策の効果的な利用に関する考察 統計的フィルタリングに対するWord Salad 攻撃についての考察 Evaluation of Anti-spam Method Combining Bayesian Filtering and Strong Challenge and Response Density-Based Spam Detector| ...
_ (スコア:1501)
http://www.h2.dion.ne.jp/~nabeken/bsfilter/bsfilter.1.2 ,同様に1.15, 1.27を置きました。仕様については過去の日記を検索して下さい。 ...
_ (スコア:1487)
portupgradeしたら落ちるようになってしまった。困った。 rcmdsh: unknown user: 文字化け /home/nabeken/bin/bsfilter:3098: [BUG] Bus Error ...
_ (スコア:1487)
C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...
_ (スコア:1442)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
_ (スコア:1386)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:1378)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:1378)
_ (スコア:1514)