[SIMILAR] WITH 7748 lottery WITH 3417 周年 WITH 3033 bsfilter WITH 3017 発/ WITH 1753 release WITH 449 開発 WITH 377 invalid WITH 115 今日 WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 text3 WITH 1 / WITH 1 5 WITH 1 で" WITH 1 " WITH 1 u WITH 1 . WITH 1 s WITH 1 green WITH 1 card WITH 1 spam WITH 1 から WITH 1 ら10 WITH 1 10 WITH 1 年、 WITH 1 、3 WITH 1 3 WITH 1 23 WITH 1 でme WITH 1 mew WITH 1 が10 の検索結果 331 件中 121 - 130 件目 (0.379205762 秒)
現在は以下のようなサポート状況。 r<strong>ustrong>byについてくるsdbm やっぱりGN<strong>Ustrong>なgdbm FreeBSDだと、ふつーport<strong>ustrong>pgradeでbdb<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong> marshalだった時代もあった bdb revision <strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong>のみだと寂しいかなぁ。revision 2が使えると嬉しい環境があるのかな? 本当は、val<strong>ustrong>eとしてhashを持てるデータベースを使いたい。 <strong>.strong><strong>.strong><strong>.strong>
m<strong>ustrong>ndomicro<strong>.strong>comからso<strong>ustrong>rceforge<strong>.strong>jpのアカウントに来ているメールがフィッシングっぽい。 www<strong>.strong>nicos<strong>.strong>co<strong>.strong>jpのイメージを使いつつ、http:<strong>/strong><strong>/strong>nicos<strong>.strong>conco<strong>ustrong>rse<strong>.strong>jp:443<strong>/strong>へ誘っている感じ。 charset=windows-<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong>2<strong>5strong>2なので、<strong>bsfilter<<strong>/strong>strong>が日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
--<strong>ustrong>pdate<strong>/strong>--a<strong>ustrong>to-<strong>ustrong>pdate系の利用による,還元が<strong>bsfilter<<strong>/strong>strong>の重要なポイントだと思うのですけれど,この評価では還元の際にノイズでtoken DBが撹乱されてしまうかどうかがわからないと思うのです<strong>.strong> # しばらく首が回りそうにないから手が回らないなぁ<strong>.strong><strong>.strong><strong>.strong> :< <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現<strong>/strong>デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi(<strong>&q<strong>ustrong>ot;strong>-oe<strong>ustrong>c -w<strong>&q<strong>ustrong>ot;strong>, str)<strong>.strong>scan(<strong>/strong>\S+<strong>/strong>)<strong>.strong>each do |token| token<strong>.strong>gs<strong>ustrong>b!(Reg_not_kanji_katakana, 39;39;) <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
「他のツールに任せるべき?」という点では、<strong>bsfilter<<strong>/strong>strong>をloadできたりするとうれしいと思うことはあります。__FILE__を使うとかなんとかで。ただ、<strong>/strong>bin<strong>/strong>shで起動するようになっていますから、そのままloadできるようにするのは難しそうですね。 <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong>ページぐらいのサイズで取り上げられているので購入。日本語に対応したベイジアンフィルタとしては最も実績がありだそうだ :-) <strong>&q<strong>ustrong>ot;strong>bm<strong>&q<strong>ustrong>ot;strong>と入力するとCommand:と聞かれるというのは解せない。チェックしないと。 性能比較を期待していたのだが、それはなかった。 <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
exportするフォーマットを変更して、importを大幅高速化。mbox-likeな形式でexportして、importはadd-clean<strong>/strong>spamのパスを通すのは、良案だと思ったのだが遅すぎるので廃止。無駄にCP<strong>Ustrong>を使うと、でんこちゃんに怒られそうだし。 <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
bogofilterは、Pa<strong>ustrong>l Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
revision <strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><strong>.strong>69<strong>.strong>2<strong>.strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong>でパッチを取り込んだ。コンパイル条件不明でのパフォーマンスはざっくり、sdbm > gdbm = bdb<strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong><strong>1strong>strong>strong>strong>strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong><<strong>/strong>strong> > qdbm > bdb な感じ。 cdbはインターフェースが気持ち悪いので、今のところ見送り。 OS <strong>/strong> エンディアンが違ってもDBが共通に使えると嬉しい。sdbmかgdbmかはダメだった記憶がある。 <strong>.strong><strong>.strong><strong>.strong>
_ (スコア:3137)
_ (スコア:3137)