[SIMILAR] WITH 7748 良po WITH 7748 期ユ WITH 3033 bsfilter WITH 2850 ports WITH 1795 野良 WITH 951 初期 WITH 507 ーザ WITH 457 公開 WITH 452 ユー WITH 319 最初 WITH 1 [ WITH 1 ] WITH 1 の野 WITH 1 ザの WITH 1 のot WITH 1 otsune WITH 1 さん WITH 1 んが WITH 1 がpo WITH 1 開。 の検索結果 258 件中 131 - 140 件目 (0.20870938 秒)
--update/--auto-update系の利用による,還元がbsfilterの重要なポイントだと思うのですけれど,この評価では還元の際にノイズでtoken DBが撹乱されてしまうかどうかがわからないと思うのです. # しばらく首が回りそうにないから手が回らないなぁ... :< ...
KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現/デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi("-oeuc -w", str).scan(/\S+/).each do |token| token.gsub!(Reg_not_kanji_katakana, '') ...
_ (スコア:2542)
「他のツールに任せるべき?」という点では、bsfilterをloadできたりするとうれしいと思うことはあります。__FILE__を使うとかなんとかで。ただ、/bin/shで起動するようになっていますから、そのままloadできるようにするのは難しそうですね。 ...
_ (スコア:2542)
1ページぐらいのサイズで取り上げられているので購入。日本語に対応したベイジアンフィルタとしては最も実績がありだそうだ :-) "bm"と入力するとCommand:と聞かれるというのは解せない。チェックしないと。 性能比較を期待していたのだが、それはなかった。 ...
_ (スコア:2542)
exportするフォーマットを変更して、importを大幅高速化。mbox-likeな形式でexportして、importはadd-clean/spamのパスを通すのは、良案だと思ったのだが遅すぎるので廃止。無駄にCPUを使うと、でんこちゃんに怒られそうだし。 ...
_ (スコア:2542)
1.31.4.7を数日、使って問題なかったら、これを1.32とする。 1.32.4系列では、データベースの無限膨張を抑える仕組みを入れる。 3ヶ月間、楽しく作って来たけど、そろそろ終わりかしら。 ...
_ (スコア:2542)
Invalid Text-u -c、-u -s、-a等のときに、メイルに出て来てたtokenについてのみ、確率データベースを更新するように変更。-c等と一緒ではなく、-u単独の場合は、従来通り、全tokenについて再計算する。 の、1、2は終了したつもり。 ...
_ (スコア:2542)
bogofilterは、Paul Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 ...
_ (スコア:2542)
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...
_ (スコア:2542)
revision 1.69.2.1でパッチを取り込んだ。コンパイル条件不明でのパフォーマンスはざっくり、sdbm > gdbm = bdb1 > qdbm > bdb な感じ。 cdbはインターフェースが気持ち悪いので、今のところ見送り。 OS / エンディアンが違ってもDBが共通に使えると嬉しい。sdbmかgdbmかはダメだった記憶がある。 ...
_ (スコア:2542)
_ (スコア:2542)