[SIMILAR] WITH 7323 ル条 WITH 7323 件不 WITH 5545 sdbm WITH 5200 gdbm WITH 4390 qdbm WITH 2390 revision WITH 1516 bsfilter WITH 1248 見送 WITH 1126 共通 WITH 930 パフ WITH 757 条件 WITH 662 ェー WITH 624 不明 WITH 547 ィア WITH 498 ーフ WITH 496 記憶 WITH 480 パイ WITH 447 パッ WITH 431 ンデ WITH 392 ンパ WITH 386 ォー WITH 357 気持 WITH 357 ダメ WITH 320 フェ WITH 309 エン WITH 295 ーマ WITH 288 ッチ WITH 276 フォ WITH 264 マン WITH 236 イル WITH 219 ンタ WITH 218 ディ の検索結果 251 件中 161 - 170 件目 (0.506367491 秒)
KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現/デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi("-oeuc -w", str).scan(/\S+/).each do |token| token.gsub!(Reg_not_kanji_katakana, '') ...
「他のツールに任せるべき?」という点では、bsfilterをloadできたりするとうれしいと思うことはあります。__FILE__を使うとかなんとかで。ただ、/bin/shで起動するようになっていますから、そのままloadできるようにするのは難しそうですね。 ...
_ (スコア:1071)
1ページぐらいのサイズで取り上げられているので購入。日本語に対応したベイジアンフィルタとしては最も実績がありだそうだ :-) "bm"と入力するとCommand:と聞かれるというのは解せない。チェックしないと。 性能比較を期待していたのだが、それはなかった。 ...
_ (スコア:1071)
bogofilterは、Paul Graham -> Robinson -> Robinson-Fisherと、アルゴリズムを変えつつある。Robinson-Fisherを実装する? オプションとかをbogofilterに合わせておくべきだったか? でも、参考にせずに作っても、-sでspam追加なら、-Sで削除、というのは一緒。 ...
_ (スコア:1071)
bsfilter-1.0.17.rc4はleopardでリリースした。新たな問題に当たりたくなかったので、FreeBSD時代と同じ以下の物を使用した。 exerb-4.1.0.zip ruby-1.8.4-i386-mswin32.zip vruby-061102-i386-mswin32-1.8.zip vrswin-060205-i386-mswin32-1.8.zip exerbのインストールはleopard標準のrubyをそのまま使ったので ...
_ (スコア:1071)
しばしば日記等で遅いと書かれている。 googleで検索 しても、それなりに引っかかる風味。 "遅い"で思いだすジョブズの話。 MacOSを開発したが起動が遅い。最適化してもやっぱり遅い。で、ジョブズが檄を飛ばす。「多くの人が、多くの回数起動するのだ。その時間を合計すれば、人の寿命に匹敵するのだ。人の命を ...
_ (スコア:1071)
IMAPサーバにもよって、普通にprocmailを使えるようなのもありますし、sieveのようなIMAPサーバ上で実行されるスクリプトを使う必要のあるものもあります。 あと、imapfilterというプログラムはIMAPでアクセスすることによって振り分けることができるようです。 (個人的にはimapfilterのようなものをRubyで作っ ...
_ (スコア:1071)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:1071)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
_ (スコア:1071)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:1071)
_ (スコア:1071)