[SIMILAR] WITH 15083 同上 WITH 8118 一括 WITH 7748 用fr WITH 6162 。bc WITH 5802 ス更 WITH 4813 括し WITH 4723 。bm WITH 4434 procmail WITH 3942 flag WITH 3139 clean WITH 2836 spam WITH 2814 。bs WITH 2132 判定 WITH 1654 上。 WITH 1516 bsfilter WITH 1495 て同 WITH 1263 タベ WITH 1119 見逃 WITH 582 が付 WITH 534 場合 WITH 504 合は WITH 493 定。 WITH 413 ベー WITH 386 メイ WITH 355 更新 WITH 334 の場 WITH 332 デー WITH 328 マー WITH 284 必要 WITH 239 ーク WITH 236 イル WITH 222 ータ の検索結果 237 件中 61 - 70 件目 (0.111812042 秒)
C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:1035)
SPAMらしきを一通にまとめてってのはBAD IDEAじゃないかしら。 Subjectで判断できないし、非SPAMの混入をチェキするためにそのメイルを開くと、結局SPAMを見る機会が増えるし、Virus(は事前に取り除かれているはずかどうかは置いておいて)が混入している可能性もあるし。 ので、うちではやりません。 (だいたい ...
_ (スコア:1008)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:994)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:978)
バラならば、これらの問題はなくなりますが、その場合、一旦溜めてから送る意味は何か残りますかね。誤判定されたcleanなメイルが遅れる分、マイナスな気も。 # あくまで私感ですので... ...
_ (スコア:941)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:933)
Invalid Text-u -c、-u -s、-a等のときに、メイルに出て来てたtokenについてのみ、確率データベースを更新するように変更。-c等と一緒ではなく、-u単独の場合は、従来通り、全tokenについて再計算する。 の、1、2は終了したつもり。 ...
_ (スコア:932)
全てのreceivedヘッダを見ていたのを止めて、送り手に一番近いものだけを見るように変更。特にML経由の場合、後半のreceivedは見るだけ無駄なので。-Hを付けた方が判定精度が高いという話も、これが影響していたのかもしれない。 html中のnumeric character referenceを無視するように変更。FreeBSD-users-jp 7 ...
_ (スコア:928)
--pop-max-size number numberより大きなメイルは、判定、学習の対象にしない。単にバイパスする オプション名を微妙に変更 単位をバイトに戻した バイパスする際は、pop daemonからMUAへパイプラインで渡す。今までは、メイル全体をbsfilterが受け取った後、MUAに渡していた デフォルト値は30000(byte)。0はサ ...
_ (スコア:912)
_ (スコア:1038)