トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 6235 要修 WITH 6198 トre WITH 6162 ダ中 WITH 5991 tokenizer WITH 4125 字以 WITH 3540 token WITH 3257 received WITH 2975 グメ WITH 2390 revision WITH 2208 ッダ WITH 1995 のto WITH 1755 message WITH 1516 bsfilter WITH 1461 ヘッ WITH 1185 漢字 WITH 1176 デバ WITH 1050 解釈 WITH 960 ムス WITH 784 加減 WITH 578 修正 WITH 545 ッグ WITH 544 捨て WITH 529 カウ WITH 501 イム WITH 442 文字 WITH 399 マッ WITH 386 メイ WITH 344 ンプ WITH 333 バッ WITH 307 タン WITH 288 ッチ WITH 276 ウン の検索結果 209 件中 1 - 10 件目 (0.066620786 秒)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ

2003-03-10(Mon) [類似検索]

_bsfilter revision 1.5

漢字マッチしなくなってたのをデバッグ メイルのヘッダ中tokenは、ヘッダごとにカウント Receivedのタイムスンプは、いい加減捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtoken捨てtokenizerがぐちゃぐちゃになったので、要修正 ...

_  (スコア:10000)

2003-04-29(Tue) [類似検索]

_bsfilter revision 1.15

-aが実用的でないので改造。 -aの場合、exitしてspamか否かをstatus codeで返す直前に、子プロセスをfork。親がexitしたあとに、子がデータベースの更新を行なう。子の処理時間は一見、見えない。 --synchronous-auto-updateは、旧-aに相当。forkせずに、データベースの更新をしてからexit。 tokenizerも少し変 ...

_  (スコア:4367)

2003-05-02(Fri) [類似検索]

_[spam] bsproc

0.2.10が出ているが、相変わらず、疑問なコードがbayespam.rbにある。 def token_freq_dir(directory) hash = {} Dir.open(directory) do |dir| dir.each do |file| next if file =~ /^\./ File.open(directory + '/' + file) do |f| hash.update(tokenizer(f)) 複数ファイル中のtokenの出現回数の合計を求めて ...

_  (スコア:4332)

2003-05-31(Sat) [類似検索]

_[bsfilter] revision 1.31.4.2

MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...

_  (スコア:4125)

2003-03-15(Sat) [類似検索]

_bsfilter revision 1.9

category + "*" + tokenという文字列がハッシュのキーで目覚めが悪かったので、hash[category][token]のように修正 unix from, from, to, cc, subject, received, reply-to, return-path, content-transfer-encoding, content-type以外のヘッダ捨てるように変更 相変わらずMIMEの解釈はしないが、base64、quo ...

_  (スコア:4049)

2003-07-29(Tue) [類似検索]

_ツッコミ!! (nabeken)

最近はデフォルトが"--method rf"なので、tokenizerが拾ってきたtokenを全部使って判定してます。 "--method g"については、15token固定なので、これを可変にという提案がありました。どうしよう... ...

_  (スコア:3949)

2004-12-14(Tue) [類似検索]

_ツッコミ!! (nabeken)

追試期待してます。tokenizerの影響は小さい、と思っていたのですけれども。 ...

_  (スコア:3949)

2003-12-06(Sat) [類似検索]

_[bsfilter] revision 1.36.4.22

--pop-max-size number numberより大きなメイルは、判定、学習の対象にしない。単にバイパスする オプション名を微妙に変更 単位をバイトに戻した バイパスする際は、pop daemonからMUAへパイプラインで渡す。今までは、メイル全体をbsfilterが受け取った後、MUAに渡していた デフォルト値は30000(byte)。0はサ ...

_  (スコア:3782)

2003-12-20(Sat) [類似検索]

_[bsfilter] dump_mozdat

えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...

_  (スコア:3560)

2003-05-14(Wed) [類似検索]

_[bsfilter] bsfilter 1.21

Invalid Text --show-new-token追加。新たに登録されたtokenが表示される。 Content-Type: Message/Rfc822なパートのヘッダ部分が、本文扱いだったのをいい加減修正。ソースが0.2procmailくらいになったので、なんとかしたい。 ...

_  (スコア:3099)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ