[SIMILAR] WITH 15006 inbox WITH 8246 phenterm0ne WITH 8246 medications WITH 8246 覧. WITH 7748 リ形 WITH 7380 roberts WITH 7323 ダ構 WITH 6955 知) WITH 3939 チメ WITH 3508 multipart WITH 3033 bsfilter WITH 3033 用ア WITH 2950 で" WITH 2471 ascii WITH 2195 と, WITH 1733 アタ WITH 1526 愛知 WITH 1381 実行 WITH 1230 す. WITH 1217 ト上 WITH 1140 一覧 WITH 1030 タッ WITH 1012 ィレ WITH 998 行す WITH 977 形式 WITH 849 構成 WITH 763 表示 WITH 756 中身 WITH 742 ナリ WITH 677 ジナ WITH 676 を実 WITH 654 リジ の検索結果 209 件中 141 - 150 件目 (0.364794785 秒)
KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現/デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi("-oeuc -w", str).scan(/\S+/).each do |token| token.gsub!(Reg_not_kanji_katakana, '') ...
「他のツールに任せるべき?」という点では、bsfilterをloadできたりするとうれしいと思うことはあります。__FILE__を使うとかなんとかで。ただ、/bin/shで起動するようになっていますから、そのままloadできるようにするのは難しそうですね。 ...
_ (スコア:1121)
1ページぐらいのサイズで取り上げられているので購入。日本語に対応したベイジアンフィルタとしては最も実績がありだそうだ :-) "bm"と入力するとCommand:と聞かれるというのは解せない。チェックしないと。 性能比較を期待していたのだが、それはなかった。 ...
_ (スコア:1121)
1.31.4.7を数日、使って問題なかったら、これを1.32とする。 1.32.4系列では、データベースの無限膨張を抑える仕組みを入れる。 3ヶ月間、楽しく作って来たけど、そろそろ終わりかしら。 ...
_ (スコア:1121)
Invalid Text-u -c、-u -s、-a等のときに、メイルに出て来てたtokenについてのみ、確率データベースを更新するように変更。-c等と一緒ではなく、-u単独の場合は、従来通り、全tokenについて再計算する。 の、1、2は終了したつもり。 ...
_ (スコア:1121)
bogofilterは、Paul Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 ...
_ (スコア:1121)
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...
_ (スコア:1121)
revision 1.69.2.1でパッチを取り込んだ。コンパイル条件不明でのパフォーマンスはざっくり、sdbm > gdbm = bdb1 > qdbm > bdb な感じ。 cdbはインターフェースが気持ち悪いので、今のところ見送り。 OS / エンディアンが違ってもDBが共通に使えると嬉しい。sdbmかgdbmかはダメだった記憶がある。 ...
_ (スコア:1121)
utf-8サポート iconvが使えれば、utf-8をeucJPに変換しようとする 本文についてはcharsetを信用しない。signatureがマッチしたらiconvする ヘッダについてはcharsetを信用する。 utf-8なメイルは日本語と判定する。 pop proxy時にlistenするインターフェイスを指定可能 例えば、--pop-proxy-port 127.0.0.1:101 ...
_ (スコア:1121)
ツッコミの"オプションを付けるとセット"は"リセット"の誤り。 revision 1.35.4.6では IMAPでアクセスした時、デフォルトではSEENフラグを変更しない --imap-reset-seen-flagをつけると、ヘッダを変更したとき、もしくは、メイルを違うフォルダに移動したとき、SEENをリセットする という仕様。 ...
_ (スコア:1121)
_ (スコア:1121)