[SIMILAR] WITH 6235 要修 WITH 6198 トre WITH 6162 ダ中 WITH 5991 tokenizer WITH 4125 字以 WITH 3540 token WITH 3257 received WITH 2975 グメ WITH 2390 revision WITH 2208 ッダ WITH 1995 のto WITH 1755 message WITH 1516 bsfilter WITH 1461 ヘッ WITH 1185 漢字 WITH 1176 デバ WITH 1050 解釈 WITH 960 ムス WITH 784 加減 WITH 578 修正 WITH 545 ッグ WITH 544 捨て WITH 529 カウ WITH 501 イム WITH 442 文字 WITH 399 マッ WITH 386 メイ WITH 344 ンプ WITH 333 バッ WITH 307 タン WITH 288 ッチ WITH 276 ウン の検索結果 209 件中 11 - 20 件目 (0.049280589 秒)
全てのreceivedヘッダを見ていたのを止めて、送り手に一番近いものだけを見るように変更。特にML経由の場合、後半のreceivedは見るだけ無駄なので。-Hを付けた方が判定精度が高いという話も、これが影響していたのかもしれない。 html中のnumeric character referenceを無視するように変更。FreeBSD-users-jp 7 ...
Invalid Text-u -c、-u -s、-a等のときに、メイルに出て来てたtokenについてのみ、確率データベースを更新するように変更。-c等と一緒ではなく、-u単独の場合は、従来通り、全tokenについて再計算する。 の、1、2は終了したつもり。 ...
_ (スコア:2998)
Invalid Textひどいコードなので、週末、scratchから書き直すことに決定。日本語の切り分けは、漢字が2文字以上続いたら、の予定。spamで困っていないので自分で使うつもりはないけど、どのくらいの威力か見たい。sapmのサンプル、欲しいな。 ...
_ (スコア:2853)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
_ (スコア:2762)
利害関係者の誘導による無意味な数字以外のなにものでもない。 ...
_ (スコア:2719)
KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現/デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi("-oeuc -w", str).scan(/\S+/).each do |token| token.gsub!(Reg_not_kanji_katakana, '') ...
_ (スコア:2687)
utf-8サポート iconvが使えれば、utf-8をeucJPに変換しようとする 本文についてはcharsetを信用しない。signatureがマッチしたらiconvする ヘッダについてはcharsetを信用する。 utf-8なメイルは日本語と判定する。 pop proxy時にlistenするインターフェイスを指定可能 例えば、--pop-proxy-port 127.0.0.1:101 ...
_ (スコア:2463)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:2463)
ツッコミの"オプションを付けるとセット"は"リセット"の誤り。 revision 1.35.4.6では IMAPでアクセスした時、デフォルトではSEENフラグを変更しない --imap-reset-seen-flagをつけると、ヘッダを変更したとき、もしくは、メイルを違うフォルダに移動したとき、SEENをリセットする という仕様。 ...
_ (スコア:2442)
spamcからspamdに聞くのか。やっぱ、そう作るよなぁ。tokenごとのspam確率をdrubyで貰ってみる? ...
_ (スコア:2333)
_ (スコア:3004)