[SIMILAR] WITH 2920 ス中 WITH 1911 グフ WITH 1753 release WITH 1516 bsfilter WITH 693 バグ WITH 681 中心 WITH 558 ィッ WITH 553 リリ WITH 317 フィ WITH 287 クス WITH 140 ース WITH 137 リー WITH 119 ック WITH 1 [ WITH 1 ] WITH 1 - WITH 1 1 WITH 1 . WITH 1 0 WITH 1 10 WITH 1 心で WITH 1 でリ WITH 1 スし WITH 1 した WITH 1 た。 の検索結果 224 件中 81 - 90 件目 (0.381170902 秒)
--ignore-plain-text-part htmlのパートがある時、plain textのパートを無視するオプションを追加 mew.tgz BBSでの指摘に従い、bsfilter.el更新 ...
http://www.h2.dion.ne.jp/~nabeken/bsfilter/bsfilter.1.2 ,同様に1.15, 1.27を置きました。仕様については過去の日記を検索して下さい。 ...
_ (スコア:3446)
POP daemon -> bsfilterでヘッダ追加 -> POPでメイルを取ってくる普通のMUA というのが出来ると嬉しいですか? IMAP関連の仕様を決定して、ベータという言い訳を止めるのが先のような気もするが。 ...
_ (スコア:3446)
"特集2 スクリプトはなかなか役立ちます"の表に、bsfilterが出ている。tDiary, Hikiと並んで :-) リンク集もある。 著者の吉田さんは、第二の住人だ。 ...
_ (スコア:3446)
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
_ (スコア:3446)
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
_ (スコア:3446)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:3446)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:3446)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:3446)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:3446)
_ (スコア:3446)