トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 4019 seen WITH 1516 bsfilter WITH 1226 ラグ WITH 1066 判定 WITH 699 フラ WITH 380 セッ WITH 226 問題 WITH 118 ット WITH 1 [ WITH 1 ] WITH 1 spam WITH 1 定す WITH 1 する WITH 1 る際 WITH 1 際に WITH 1 にse WITH 1 グが WITH 1 がセ WITH 1 トさ WITH 1 され WITH 1 れて WITH 1 てし WITH 1 しま WITH 1 まう WITH 1 うと WITH 1 とい WITH 1 いう WITH 1 うの WITH 1 のは WITH 1 は、 WITH 1 、や WITH 1 やっ の検索結果 181 件中 101 - 110 件目 (0.550053654 秒)

前へ ... 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 次へ

2004-08-13(Fri) [類似検索]

_[bsfilter] release-1.0.4

GPLのライセンス文が同梱されていなかった のを修正。 ...

_  (スコア:3247)

2003-10-10(Fri) [類似検索]

_[bsfilter] revision 1.35.4.13からgdbmサポート

長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...

_  (スコア:3230)

2003-12-20(Sat) [類似検索]

_[bsfilter] dump_mozdat

えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...

_  (スコア:3209)

2005-06-18(Sat) [類似検索]

_[bsfilter] tokenの使用状況

% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...

_  (スコア:3209)

2003-05-06(Tue) [類似検索]

_[bsfilter] bsfilter 1.19

日本語メイル中の英単語の扱いに問題があったので、修正。 --exec-spam "command args.."のようなオプションを付けようか迷っている。 ~/Mail/inbox/*に対してbsfilterを実行し、spamについてはformailで X-Spam-Flag: Yesヘッダを追加するというのを想定。 ...

_  (スコア:3200)

2003-06-16(Mon) [類似検索]

_[bsfilter] 次の拡張

思案中。1は確定。 拡張じゃないけど、SDBM、Robinson-Fisherを使うのをデフォルトにするbsfilterが自力で"X-Spam-Flag: Yes"を付けるようにする? bsfilterが自力で"X-Spam-Score: 0.9"を付けるようにする? --spam-command、--clean-commandオプションで指定したコマンドに、メイルをパイプするようにする? ...

_  (スコア:3180)

2003-05-10(Sat) [類似検索]

_[bsfilter] bsfilter revision 1.20

Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...

_  (スコア:3101)

2003-05-04(Sun) [類似検索]

_[bsfilter] bsfilter revision 1.18

spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...

_  (スコア:3101)

2007-06-14(Thu) [類似検索]

_[読書] ポール リンゼイ "目撃"

現職のFBI捜査官が著者だが、どこまでが実際にありそうな話で、どこからが御伽噺なんだか。 人物造形がちょっと派手すぎ。死亡フラグが分かりやすすぎ。 ...

_  (スコア:3023)

2003-03-08(Sat) [類似検索]

_bsfilter - bayesian spam filter

以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...

_  (スコア:2999)

前へ ... 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 次へ