[SIMILAR] WITH 7323 類数 WITH 2390 revision WITH 1813 で割 WITH 1516 bsfilter WITH 1224 数で WITH 580 種類 WITH 578 修正 WITH 386 メイ WITH 236 イル WITH 1 1 WITH 1 . WITH 1 6 WITH 1 ルの WITH 1 の数 WITH 1 割る WITH 1 るべ WITH 1 べき WITH 1 きと WITH 1 とこ WITH 1 ころ WITH 1 ろを WITH 1 を、 WITH 1 、to WITH 1 token WITH 1 の種 WITH 1 割っ WITH 1 って WITH 1 てい WITH 1 いた WITH 1 たの WITH 1 ので WITH 1 で修 の検索結果 254 件中 71 - 80 件目 (0.175655104 秒)
bsfilterででもbogofilterででもいいのだが、 spamらしきメイルはユーザに送らず、どこかに保存 保存したspamは、1日に1回、1通にまとめて、ユーザに送る というような運用をしているドメインはあるのだろうか。 ...
_ (スコア:1881)
C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...
_ (スコア:1869)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:1864)
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:1860)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:1847)
http://www.h2.dion.ne.jp/~nabeken/bsfilter/bsfilter.1.2 ,同様に1.15, 1.27を置きました。仕様については過去の日記を検索して下さい。 ...
_ (スコア:1847)
bsfilter-1.0.17.rc4はleopardでリリースした。新たな問題に当たりたくなかったので、FreeBSD時代と同じ以下の物を使用した。 exerb-4.1.0.zip ruby-1.8.4-i386-mswin32.zip vruby-061102-i386-mswin32-1.8.zip vrswin-060205-i386-mswin32-1.8.zip exerbのインストールはleopard標準のrubyをそのまま使ったので ...
_ (スコア:1847)
SourceForge.jp 経由で bsfilter-1.0.14.rc1.tgz を入手しようとしたところ、 avast! Antivirus により、当該ファイルにはトロイの木馬「Win32:Ruby [Trj]」 が含まれているとの警告を受けました。 avast! version 4.7 Professional Build: May 2006 4.7.827 VPS ファイル (ウイルス・データベース) 編集日 : 2 ...
_ (スコア:1847)
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
_ (スコア:1847)
_ (スコア:1892)