[SIMILAR] WITH 15241 dcdflib WITH 12851 bogofilter WITH 11983 spamassassin WITH 9344 term WITH 7620 chi2q WITH 7323 装出 WITH 6676 無学 WITH 5655 robinson WITH 4813 sum WITH 1621 ルベ WITH 904 イジ WITH 903 ベイ WITH 837 実装 WITH 578 ジア WITH 558 ィル WITH 534 ルタ WITH 456 ンフ WITH 413 ベー WITH 317 フィ WITH 251 ルー WITH 250 出来 WITH 201 アン WITH 140 ース WITH 109 ール WITH 1 [ WITH 1 spam WITH 1 ] WITH 1 スと WITH 1 とい WITH 1 いい WITH 1 いつ WITH 1 つつ の検索結果 58 件中 1 - 10 件目 (0.070308191 秒)
ルールベースといいつつ、2.50からはベイジアンフィルタもついている。 bogofilterのsrc/dcdflib/dcdflib.cがなにを言っているか分からなかったので、bogofilterのRobinson-Fisher methodが実装出来なかったのだが、SpamAssassinのBayes.pmによれば sub chi2q { my ($x2, $v) = @_; die "v must be even in chi ...
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
_ (スコア:4417)
bsfilterででもbogofilterででもいいのだが、 spamらしきメイルはユーザに送らず、どこかに保存 保存したspamは、1日に1回、1通にまとめて、ユーザに送る というような運用をしているドメインはあるのだろうか。 ...
_ (スコア:4237)
情報ありがとうございます。 SpamAssassin用にはhttp://www.rogerbinns.com/isbg/, http://sourceforge.net/projects/imapassassinがあるようです。spambayesにはimapfilter.pyが付いてます。 ...
_ (スコア:4119)
spamcからspamdに聞くのか。やっぱ、そう作るよなぁ。tokenごとのspam確率をdrubyで貰ってみる? ...
_ (スコア:4119)
SpamAssassinの配布物の中に、SPAMのサンプルがあるらしいですよ。 www.spamassassin.orgのイラストが笑える。 FreeBSD PRESS No.15でSPAMフィルタの記事読みました。 ...
_ (スコア:4116)
bogofilterは、Paul Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 ...
_ (スコア:3879)
screenしてemacs -nwすると、metaが効かず悩んでいた。screenすると、TERM=vt100になり、termcap? terminfo?でkmがないため、emacsはmeta keyがないと思う、というシナリオだったらしい。 (set-input-mode nil nil t) で、取り敢えず解決。 FreeBSDだと、TERM=screenでtermcapにはkmがあるのに、やっぱりmetaが ...
_ (スコア:3211)
Invalid Text BBSでの議論にもとづき、-c、-sでfindするのを止めた。 今後は、-c ~/Mail/inboxでは駄目で、-c ~/Mail/inbox/*とする必要がある。 ~/.bsfilter/bsfilter.confを読むようにした。--config-fileで指定することも出来る。--homedirと、--config-fileで、ハイフンの有無が違うのが、気持ち悪い。--co ...
_ (スコア:1965)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:1943)
_ (スコア:10000)