[SIMILAR] WITH 7748 cryptanalyze WITH 3920 無罪 WITH 2955 モド WITH 2197 皮肉 WITH 1757 傾向 WITH 1582 freebsd WITH 1064 作戦 WITH 1063 単語 WITH 945 spam WITH 794 出会 WITH 574 対策 WITH 533 ドキ WITH 531 ツー WITH 342 以前 WITH 284 必要 WITH 109 ール WITH 1 [ WITH 1 ] WITH 1 向と WITH 1 と対 WITH 1 ルを WITH 1 を作 WITH 1 作っ WITH 1 って WITH 1 てい WITH 1 いる WITH 1 ると WITH 1 とsp WITH 1 の傾 WITH 1 向を WITH 1 を知 WITH 1 知る の検索結果 236 件中 141 - 150 件目 (1.042914464 秒)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:947)
--mark-spam-subjectで改行コードがおかしくなるバグ を修正してリリース。 改行コードのテストケースで、--mark-spam-subjectが指定されていなかった(テスト仕様バグ) 指定されていたとしても、バグを検出出来ないコードだった(テストコードバグ) ...
_ (スコア:947)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...
_ (スコア:947)
たまにinfo@aumypage.jpから文字化けしたspamが届く。 http://www.aumypage.jp/Lifememory/Top?reqid=Top を宣伝するものらしいが、アクセスは出来ない。 Received: from nmoPF10.ezweb.ne.jp (HELO ezweb.ne.jp) (219.125.149.140) by ... for ... Received: from ezweb.ne.jp ([172.24.144.182]) by nm19stmt ...
_ (スコア:947)
Invalid Text気になるわけで。 H.Okada bsfilter 15というのはPaul Grahamが出してきたマジックナンバーなので、調整する余地はあるかも。 しゃれにならない日々。 対抗馬のmpは、blacklistを自動的にダウンロードする仕組みが付いている。Vipul's Razorと同じアプローチ? mp_spammer.txtには、"^from:.*@earth ...
_ (スコア:947)
spamcからspamdに聞くのか。やっぱ、そう作るよなぁ。tokenごとのspam確率をdrubyで貰ってみる? ...
_ (スコア:947)
bsfilter --add-spam --update と逐次 update するのと、最後に bsfilter --update と単独で実行するのでは結果に違いはありますか? 速度(効率)はどちらが良いですか。 ...
_ (スコア:947)
同じ数のspamが来るにしても、さみだれでポツポツ来るより、バーストで一気に来たほうが、心理的に楽かと思いまして。 ...
_ (スコア:947)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:946)
_ (スコア:947)