[SIMILAR] WITH 19277 bogofilter WITH 7055 語sp WITH 5027 語メ WITH 4376 mecab WITH 3181 い遅 WITH 3033 bsfilter WITH 2864 倍く WITH 1422 測定 WITH 1107 不要 WITH 853 速度 WITH 784 加減 WITH 764 遅い WITH 735 と比 WITH 558 英語 WITH 505 比べ WITH 482 本語 WITH 386 メイ WITH 236 イル WITH 183 日本 WITH 1 [ WITH 1 ] WITH 1 vs WITH 1 いい WITH 1 い加 WITH 1 減に WITH 1 に速 WITH 1 度の WITH 1 の測 WITH 1 定。 WITH 1 。cl WITH 1 clean WITH 1 な日 の検索結果 226 件中 1 - 10 件目 (0.090721365 秒)
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
bogofilterは、Paul Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 ...
_ (スコア:8719)
bsfilterででもbogofilterででもいいのだが、 spamらしきメイルはユーザに送らず、どこかに保存 保存したspamは、1日に1回、1通にまとめて、ユーザに送る というような運用をしているドメインはあるのだろうか。 ...
_ (スコア:8660)
ルールベースといいつつ、2.50からはベイジアンフィルタもついている。 bogofilterのsrc/dcdflib/dcdflib.cがなにを言っているか分からなかったので、bogofilterのRobinson-Fisher methodが実装出来なかったのだが、SpamAssassinのBayes.pmによれば sub chi2q { my ($x2, $v) = @_; die "v must be even in chi ...
_ (スコア:8620)
日本語メイル中の英単語の扱いに問題があったので、修正。 --exec-spam "command args.."のようなオプションを付けようか迷っている。 ~/Mail/inbox/*に対してbsfilterを実行し、spamについてはformailで X-Spam-Flag: Yesヘッダを追加するというのを想定。 ...
_ (スコア:2594)
-aが実用的でないので改造。 -aの場合、exitしてspamか否かをstatus codeで返す直前に、子プロセスをfork。親がexitしたあとに、子がデータベースの更新を行なう。子の処理時間は一見、見えない。 --synchronous-auto-updateは、旧-aに相当。forkせずに、データベースの更新をしてからexit。 tokenizerも少し変 ...
_ (スコア:2425)
MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...
_ (スコア:2159)
Invalid Text上美谷さんから教えてもらった通りにja-mecab-0.76をインストールし、ja-ruby-mecab-0.76をinstallすると /usr/local/lib/ruby/site_ruby/1.6/i386-freebsd4/MeCab.so が出来る。以前のportでは、 /usr/local/lib/ruby/site_ruby/1.6/i386-freebsd4_r/MeCab.so だったはず。で、ruby_rからではなく ...
_ (スコア:1956)
Invalid Textしたりせず、普通に動くようになった。 ja-chasen-2.3.3 Japanese Morphological Analysis System ja-chasen-base-2.3.3_1 Japanese Morphological Analysis System ja-ipadic-2.7.0 Japanese Morphological Dictionary for ChaSen ja-ruby18-chasen-1.6_1 ChaSen module for Ruby ja-mecab-0.81 Y ...
_ (スコア:1956)
mecabを使用すると rcmdsh: unknown user ... が出ていたのは、libc_r/libc混在問題が原因だったようだ。 /etc/libmap.confに [/usr/local/lib/ruby/site_ruby/1.8/i386-freebsd4/MeCab.so] libc_r.so.4 libc.so と書いて、直ったことにする。 そろそろ5.3Rに引越しか? ...
_ (スコア:1956)
_ (スコア:10000)