[SIMILAR] WITH 15473 maildir WITH 7933 folder WITH 7748 maildroptips WITH 7748 xfilter WITH 7323 rosebud WITH 6721 logfile WITH 6506 probability WITH 6309 maildrop WITH 4479 mh WITH 4434 procmail WITH 4008 insert WITH 3942 flag WITH 3033 bsfilter WITH 2985 nabeken WITH 2836 spam WITH 2548 ラケ WITH 2211 home WITH 2157 討中 WITH 2067 テニ WITH 1629 subject WITH 1618 強引 WITH 1514 default WITH 1087 ニス WITH 1067 対処 WITH 948 ラミ WITH 900 移行 WITH 895 new WITH 876 リケ WITH 778 検討 WITH 693 アプ WITH 682 スラ WITH 589 ルダ の検索結果 509 件中 61 - 70 件目 (0.048862002 秒)
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:1117)
些細なtypo指摘です。 s/bsfitter/bsfilter/ ですよね。 あと解説ページにも s/Sapm Detection を基本としている/Spam Detection を基本としている/ も発見しました ...
_ (スコア:1117)
bsfilter使わせてもらっています。SPAM&ML(半)専用アドレスで使ってみて調子がよかったので、普通のメール用アドレスでも使うことにしました。 ...
_ (スコア:1117)
mundomicro.comからsourceforge.jpのアカウントに来ているメールがフィッシングっぽい。 www.nicos.co.jpのイメージを使いつつ、http://nicos.concourse.jp:443/へ誘っている感じ。 charset=windows-1252なので、bsfilterが日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 ...
_ (スコア:1117)
exportするフォーマットを変更して、importを大幅高速化。mbox-likeな形式でexportして、importはadd-clean/spamのパスを通すのは、良案だと思ったのだが遅すぎるので廃止。無駄にCPUを使うと、でんこちゃんに怒られそうだし。 ...
_ (スコア:1117)
bogofilterは、Paul Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 ...
_ (スコア:1117)
-aが実用的でないので改造。 -aの場合、exitしてspamか否かをstatus codeで返す直前に、子プロセスをfork。親がexitしたあとに、子がデータベースの更新を行なう。子の処理時間は一見、見えない。 --synchronous-auto-updateは、旧-aに相当。forkせずに、データベースの更新をしてからexit。 tokenizerも少し変 ...
_ (スコア:1117)
void GraphicWizardsLair( void ); //を見たりすると、デフォルトの値は大切だと思う。 spam-cutoffとして、何かの文献で見た0.95というを使っているのだが、高すぎるように思う。自分では0.6で使っているし、ただのにっきフルスロットルでも同じ傾向らしい。0.8くらいに下げようかしらん? ...
_ (スコア:1117)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:1117)
_ (スコア:1117)