トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 7748 文扱 WITH 7748 2procmail WITH 5599 ダ部 WITH 3540 token WITH 3033 bsfilter WITH 1755 message WITH 1568 content WITH 1123 本文 WITH 1104 ッダ WITH 784 加減 WITH 730 ヘッ WITH 578 修正 WITH 546 登録 WITH 455 追加 WITH 381 表示 WITH 377 invalid WITH 367 部分 WITH 348 ソー WITH 247 パー WITH 140 ース WITH 139 ート WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 . WITH 1 21 WITH 1 text WITH 1 -- WITH 1 show WITH 1 - WITH 1 new WITH 1 加。 の検索結果 236 件中 1 - 10 件目 (0.102981154 秒)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ

2003-05-14(Wed) [類似検索]

_[bsfilter] bsfilter 1.21

Invalid Text --show-new-token追加。新たに登録されたtoken表示される。 Content-Type: Message/Rfc822なパートのヘッダ部分が、本文扱いだったのをいい加減修正ソースが0.2procmailくらいになったので、なんとかしたい。 ...

_  (スコア:10000)

2003-03-10(Mon) [類似検索]

_bsfilter revision 1.5

漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...

_  (スコア:3576)

2003-06-01(Sun) [類似検索]

_[bsfilter] revision 1.31.4.5

Invalid Text-u -c、-u -s、-a等のときに、メイルに出て来てたtokenについてのみ、確率データベースを更新するように変更。-c等と一緒ではなく、-u単独の場合は、従来通り、全tokenについて再計算する。 の、1、2は終了したつもり。 ...

_  (スコア:3294)

2003-08-24(Sun) [類似検索]

_[bsfilter] KAKASIでBus Error

KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現/デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi("-oeuc -w", str).scan(/\S+/).each do |token| token.gsub!(Reg_not_kanji_katakana, '') ...

_  (スコア:3281)

2003-05-24(Sat) [類似検索]

_[bsfilter] bsfilter revison 1.29

Invalid Text BBSでの議論にもとづき、-c、-sでfindするのを止めた。 今後は、-c ~/Mail/inboxでは駄目で、-c ~/Mail/inbox/*とする必要がある。 ~/.bsfilter/bsfilter.confを読むようにした。--config-fileで指定することも出来る。--homedirと、--config-fileで、ハイフンの有無が違うのが、気持ち悪い。--co ...

_  (スコア:3248)

2003-05-31(Sat) [類似検索]

_[bsfilter] revision 1.31.4.2

MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...

_  (スコア:3228)

2003-03-15(Sat) [類似検索]

_bsfilter revision 1.9

category + "*" + tokenという文字列がハッシュのキーで目覚めが悪かったので、hash[category][token]のように修正 unix from, from, to, cc, subject, received, reply-to, return-path, content-transfer-encoding, content-type以外のヘッダを捨てるように変更 相変わらずMIMEの解釈はしないが、base64、quo ...

_  (スコア:3210)

2004-02-26(Thu) [類似検索]

_Invalid Text[bsfilter]

動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...

_  (スコア:3021)

2003-05-30(Fri) [類似検索]

_[bsfilter] 次の拡張

どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...

_  (スコア:2901)

2003-05-02(Fri) [類似検索]

_[spam] bsproc

0.2.10が出ているが、相変わらず、疑問なコードがbayespam.rbにある。 def token_freq_dir(directory) hash = {} Dir.open(directory) do |dir| dir.each do |file| next if file =~ /^\./ File.open(directory + '/' + file) do |f| hash.update(tokenizer(f)) 複数ファイル中のtokenの出現回数の合計を求めて ...

_  (スコア:2611)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ