トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 7380 長通 WITH 1516 bsfilter WITH 1339 認定 WITH 837 社長 WITH 720 通信 WITH 1 [ WITH 1 ] WITH 1 うざ WITH 1 ざっ WITH 1 った WITH 1 たく WITH 1 くな WITH 1 なっ WITH 1 って WITH 1 て来 WITH 1 来た WITH 1 たの WITH 1 ので WITH 1 で、 WITH 1 、sp WITH 1 spam WITH 1 定し WITH 1 した WITH 1 た。 の検索結果 211 件中 141 - 150 件目 (0.560948028 秒)

前へ ... 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 次へ

2004-05-14(Fri) [類似検索]

_[bsfilter] 韓国語、中国語サポート

r162_asianization branchで実験開始。が、spamしか持っていないので、効果が分からない。 euc-kr, ks_c_5601-1987を、ko databaseに入れる big5を、tw databaseに入れる gb2312を、cn databaseに入れる export/importのコードはutf-8 ko, tw, cnのデータベースのコードはutf-8 jaのデータベースのコードはeuc- ...

_  (スコア:1960)

2004-02-06(Fri) [類似検索]

_[spam] POPFile日本語化

日本語化関連のToDoが投稿されている。 ISO-2022-JP 以外の文字コードへの対応(パッチとしてすでに公開していますが本家にマージする作業が残っています) base64、Quoted Printable への対応 途中で改行されてしまった日本語の単語への対応 Subject の分かち書き insert.pl の日本語化(本家にマージする作業が ...

_  (スコア:1960)

2003-03-15(Sat) [類似検索]

_bsfilter revision 1.9

category + "*" + tokenという文字列がハッシュのキーで目覚めが悪かったので、hash[category][token]のように修正 unix from, from, to, cc, subject, received, reply-to, return-path, content-transfer-encoding, content-type以外のヘッダを捨てるように変更 相変わらずMIMEの解釈はしないが、base64、quo ...

_  (スコア:1960)

2003-04-29(Tue) [類似検索]

_bsfilter revision 1.15

-aが実用的でないので改造。 -aの場合、exitしてspamか否かをstatus codeで返す直前に、子プロセスをfork。親がexitしたあとに、子がデータベースの更新を行なう。子の処理時間は一見、見えない。 --synchronous-auto-updateは、旧-aに相当。forkせずに、データベースの更新をしてからexit。 tokenizerも少し変 ...

_  (スコア:1960)

2003-10-10(Fri) [類似検索]

_[bsfilter] revision 1.35.4.13からgdbmサポート

長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...

_  (スコア:1950)

2003-12-20(Sat) [類似検索]

_[bsfilter] dump_mozdat

えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...

_  (スコア:1937)

2005-06-18(Sat) [類似検索]

_[bsfilter] tokenの使用状況

% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...

_  (スコア:1937)

2003-05-06(Tue) [類似検索]

_[bsfilter] bsfilter 1.19

日本語メイル中の英単語の扱いに問題があったので、修正。 --exec-spam "command args.."のようなオプションを付けようか迷っている。 ~/Mail/inbox/*に対してbsfilterを実行し、spamについてはformailで X-Spam-Flag: Yesヘッダを追加するというのを想定。 ...

_  (スコア:1920)

2003-06-16(Mon) [類似検索]

_[bsfilter] 次の拡張

思案中。1は確定。 拡張じゃないけど、SDBM、Robinson-Fisherを使うのをデフォルトにする。 bsfilterが自力で"X-Spam-Flag: Yes"を付けるようにする? bsfilterが自力で"X-Spam-Score: 0.9"を付けるようにする? --spam-command、--clean-commandオプションで指定したコマンドに、メイルをパイプするようにする? ...

_  (スコア:1920)

2004-03-13(Sat) [類似検索]

_[bsfilter] --ignore系オプションベンチマーク

spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...

_  (スコア:1872)

前へ ... 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 次へ