[SIMILAR] WITH 1516 bsfilter WITH 1 [ WITH 1 ] WITH 1 import WITH 1 が遅 WITH 1 遅い WITH 1 ただ WITH 1 だの WITH 1 のに WITH 1 にっ WITH 1 っき WITH 1 きwe WITH 1 web WITH 1 notes WITH 1 diary WITH 1 薄々 WITH 1 々、 WITH 1 、気 WITH 1 気づ WITH 1 づい WITH 1 いて WITH 1 ては WITH 1 はい WITH 1 いた WITH 1 たの WITH 1 のだ WITH 1 だが WITH 1 が。 の検索結果 194 件中 131 - 140 件目 (0.199985253 秒)
KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現/デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi("-oeuc -w", str).scan(/\S+/).each do |token| token.gsub!(Reg_not_kanji_katakana, '') ...
「他のツールに任せるべき?」という点では、bsfilterをloadできたりするとうれしいと思うことはあります。__FILE__を使うとかなんとかで。ただ、/bin/shで起動するようになっていますから、そのままloadできるようにするのは難しそうですね。 ...
_ (スコア:10000)
1ページぐらいのサイズで取り上げられているので購入。日本語に対応したベイジアンフィルタとしては最も実績がありだそうだ :-) "bm"と入力するとCommand:と聞かれるというのは解せない。チェックしないと。 性能比較を期待していたのだが、それはなかった。 ...
_ (スコア:10000)
1.31.4.7を数日、使って問題なかったら、これを1.32とする。 1.32.4系列では、データベースの無限膨張を抑える仕組みを入れる。 3ヶ月間、楽しく作って来たけど、そろそろ終わりかしら。 ...
_ (スコア:10000)
Invalid Text-u -c、-u -s、-a等のときに、メイルに出て来てたtokenについてのみ、確率データベースを更新するように変更。-c等と一緒ではなく、-u単独の場合は、従来通り、全tokenについて再計算する。 の、1、2は終了したつもり。 ...
_ (スコア:10000)
bogofilterは、Paul Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 ...
_ (スコア:10000)
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...
_ (スコア:10000)
revision 1.69.2.1でパッチを取り込んだ。コンパイル条件不明でのパフォーマンスはざっくり、sdbm > gdbm = bdb1 > qdbm > bdb な感じ。 cdbはインターフェースが気持ち悪いので、今のところ見送り。 OS / エンディアンが違ってもDBが共通に使えると嬉しい。sdbmかgdbmかはダメだった記憶がある。 ...
_ (スコア:10000)
utf-8サポート iconvが使えれば、utf-8をeucJPに変換しようとする 本文についてはcharsetを信用しない。signatureがマッチしたらiconvする ヘッダについてはcharsetを信用する。 utf-8なメイルは日本語と判定する。 pop proxy時にlistenするインターフェイスを指定可能 例えば、--pop-proxy-port 127.0.0.1:101 ...
_ (スコア:10000)
ツッコミの"オプションを付けるとセット"は"リセット"の誤り。 revision 1.35.4.6では IMAPでアクセスした時、デフォルトではSEENフラグを変更しない --imap-reset-seen-flagをつけると、ヘッダを変更したとき、もしくは、メイルを違うフォルダに移動したとき、SEENをリセットする という仕様。 ...
_ (スコア:10000)
_ (スコア:10000)