[SIMILAR] WITH 5365 経ソ WITH 5027 集2 WITH 3722 ア20 WITH 3033 bsfilter WITH 2332 年9 WITH 1768 ク集 WITH 1762 吉田 WITH 1632 住人 WITH 1466 役立 WITH 1292 日経 WITH 1215 月号 WITH 1068 著者 WITH 837 第二 WITH 808 特集 WITH 776 リプ WITH 708 プト WITH 681 トウ WITH 545 ェア WITH 405 ウェ WITH 373 ソフ WITH 336 フト WITH 292 スク WITH 234 クリ WITH 212 ンク WITH 174 リン WITH 1 [ WITH 1 ] WITH 1 2003 WITH 1 9 WITH 1 " WITH 1 2 WITH 1 トは の検索結果 212 件中 1 - 10 件目 (0.090903876 秒)
"特集2 スクリプトはなかなか役立ちます"の表に、bsfilterが出ている。tDiary, Hikiと並んで :-) リンク集もある。 著者の吉田さんは、第二の住人だ。 ...
1ページぐらいのサイズで取り上げられているので購入。日本語に対応したベイジアンフィルタとしては最も実績がありだそうだ :-) "bm"と入力するとCommand:と聞かれるというのは解せない。チェックしないと。 性能比較を期待していたのだが、それはなかった。 ...
_ (スコア:3760)
Ceekz Logsに、日経新聞とその他新聞の判定でベンチする話が出ている。 kakasiよりbigramの方がいいらしい。 ...
_ (スコア:3268)
原因は別なのか? Invalid argumentが出る ruby-dev:25574 2005-02-02の件 単なるスクリプトのバグなのか? ...
_ (スコア:3077)
IMAPサーバにもよって、普通にprocmailを使えるようなのもありますし、sieveのようなIMAPサーバ上で実行されるスクリプトを使う必要のあるものもあります。 あと、imapfilterというプログラムはIMAPでアクセスすることによって振り分けることができるようです。 (個人的にはimapfilterのようなものをRubyで作っ ...
_ (スコア:3077)
MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...
_ (スコア:3077)
bsfilterも紹介された。みんな使えているのか不安。 ...
_ (スコア:3048)
わぉ。いらっしゃいませ〜>第二。今後ともよろしくお願いします。bsfilter wiki もセットでいかがですか? (ぉ ...
_ (スコア:3033)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:3014)
bsfilterはspamフィルターとしてもうほとんど完成していると思うので拡張のアイディアを出すのが難しそうですね。 ifileというbayesianベースのspamフィルタリングソフトがあるのですが、こいつはspamだけでなくcleanなメールの内容についても学習し、内容ごとに自動的に振り分けしてくれるという妙な進化をして ...
_ (スコア:3012)
_ (スコア:10000)