[SIMILAR] WITH 6590 numeric WITH 6514 received WITH 6466 定精 WITH 4376 character WITH 3237 reference WITH 3033 bsfilter WITH 2637 番近 WITH 2390 revision WITH 2349 精度 WITH 2091 のre WITH 1582 freebsd WITH 1293 更。 WITH 1244 沢山 WITH 1104 ッダ WITH 1066 判定 WITH 975 後半 WITH 870 ゴミ WITH 869 無視 WITH 743 変更 WITH 730 ヘッ WITH 625 整理 WITH 624 無駄 WITH 576 経由 WITH 461 影響 WITH 428 に変 WITH 336 一番 WITH 267 場合 WITH 246 見る WITH 197 コー WITH 152 を見 WITH 147 ード WITH 1 [ の検索結果 282 件中 71 - 80 件目 (0.082032121 秒)
言語の判定はcharsetを見ない方針で show-processの表示フォーマットを拡張 bdb, qdbmのサポート追加 win9xでFile::LOCK_SH出来ないのに対応 ...
_ (スコア:2174)
mundomicro.comからsourceforge.jpのアカウントに来ているメールがフィッシングっぽい。 www.nicos.co.jpのイメージを使いつつ、http://nicos.concourse.jp:443/へ誘っている感じ。 charset=windows-1252なので、bsfilterが日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 ...
_ (スコア:2174)
C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...
_ (スコア:2174)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:2174)
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
_ (スコア:2152)
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
_ (スコア:2138)
shで始まってunameを実行してrubyかruby_rか切り分ける起動方法が不評。例Gold fever。切り替える規準もいい加減だし、自分としても気持ちのいいコードではない。誰か、いい書き方、教えてくれないかしらん。 /usr/local/bin/ruby -x path_of_bsfilter .... で、PATHを追加することなく、cronから起動できると思 ...
_ (スコア:2138)
sf.jpの統計によれば、portsの更新でダウンロードした人は、20-30人の感触。 ...
_ (スコア:2133)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:2131)
_ (スコア:2174)