[SIMILAR] WITH 7371 用マ WITH 6633 tokenize WITH 3033 bsfilter WITH 2542 文中 WITH 2390 revision WITH 2127 単語 WITH 1806 改行 WITH 1395 引用 WITH 1346 誤解 WITH 1299 unix WITH 1293 更。 WITH 1123 本文 WITH 931 努力 WITH 743 変更 WITH 709 語の WITH 699 削除 WITH 656 マー WITH 585 from WITH 496 指定 WITH 482 本語 WITH 478 ーク WITH 428 に変 WITH 355 更新 WITH 314 途中 WITH 248 ケー WITH 183 日本 WITH 140 ース WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 . WITH 1 28 の検索結果 229 件中 151 - 160 件目 (0.156490354 秒)
void GraphicWizardsLair( void ); //を見たりすると、デフォルトの値は大切だと思う。 spam-cutoffとして、何かの文献で見た0.95というを使っているのだが、高すぎるように思う。自分では0.6で使っているし、ただのにっきフルスロットルでも同じ傾向らしい。0.8くらいに下げようかしらん? ...
bsfilterはspamフィルターとしてもうほとんど完成していると思うので拡張のアイディアを出すのが難しそうですね。 ifileというbayesianベースのspamフィルタリングソフトがあるのですが、こいつはspamだけでなくcleanなメールの内容についても学習し、内容ごとに自動的に振り分けしてくれるという妙な進化をして ...
_ (スコア:2560)
bsfilter-1.0.17.rc4はleopardでリリースした。新たな問題に当たりたくなかったので、FreeBSD時代と同じ以下の物を使用した。 exerb-4.1.0.zip ruby-1.8.4-i386-mswin32.zip vruby-061102-i386-mswin32-1.8.zip vrswin-060205-i386-mswin32-1.8.zip exerbのインストールはleopard標準のrubyをそのまま使ったので ...
_ (スコア:2560)
しばしば日記等で遅いと書かれている。 googleで検索 しても、それなりに引っかかる風味。 "遅い"で思いだすジョブズの話。 MacOSを開発したが起動が遅い。最適化してもやっぱり遅い。で、ジョブズが檄を飛ばす。「多くの人が、多くの回数起動するのだ。その時間を合計すれば、人の寿命に匹敵するのだ。人の命を ...
_ (スコア:2560)
IMAPサーバにもよって、普通にprocmailを使えるようなのもありますし、sieveのようなIMAPサーバ上で実行されるスクリプトを使う必要のあるものもあります。 あと、imapfilterというプログラムはIMAPでアクセスすることによって振り分けることができるようです。 (個人的にはimapfilterのようなものをRubyで作っ ...
_ (スコア:2560)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:2560)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
_ (スコア:2560)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:2560)
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:2560)
SourceForge.jp 経由で bsfilter-1.0.14.rc1.tgz を入手しようとしたところ、 avast! Antivirus により、当該ファイルにはトロイの木馬「Win32:Ruby [Trj]」 が含まれているとの警告を受けました。 avast! version 4.7 Professional Build: May 2006 4.7.827 VPS ファイル (ウイルス・データベース) 編集日 : 2 ...
_ (スコア:2560)
_ (スコア:2560)