2003-05-01(Thu) [長年日記]

_1 [bsfilter] from eMotd

eMotdからの要望に答える。

  1. --homedirオプションと、環境変数BSFILTERHOMEを見る機能を追加予定。lockファイルにユーザ名が入ると、ユーザごとにユニークなlockファイルになってしまって、lockの役に立たないのですが。lockしているユーザを知る手段を付けろ、ということですか?
  2. content-length:が付いていて、本文中の"From"がエスケープされていない環境を無視していいですか? 本文中の"From"をUnixFromだと勘違いしても、大きな問題にはならないと思いますが。
  3. -v、-d(tokenizeとdatabase writeで有効)オプションでどうでしょう? 仕様が安定してませんけど。データベースの連結機能と共に整備すべきなのかもしれません。
  4. wikiみたいのでページを作ってみたいというのと、DIONに作るとreferrerとか見れないし、という理由で、紹介ページの作成が遅れてます。出来るまでは、http://nabeken.tdiary.net/20030308.htmlにでもお願いします。

_2 [bsfilter] bsfilter home page

作成開始。

本日のツッコミ(全4件) [ツッコミを入れる]
_ k (2003-05-01(Thu) 17:36)

Bayesianフィルターってデータベースを共有すると判定率が<br>低くなると思うのですが、どうなのでしょう?<br>あれは個々人当てのメールがそれぞれ違うためにメール学習を<br>させるのだからCleanなメールの幅を広げるとSpamをSpamでないと<br>する傾向が出てきませんかね?<br>その意味で--homedirオプションの存在価値に疑問を感じます。

_ nabeken (2003-05-01(Thu) 17:55)

その懸念はあります。ただ、グループの規模が小さければ、cleanなメイルとspamとの間には、十分大きな差が残るような気もしますし、サンプル数の増加による効果もあるかもしれません。ベンチマークを期待する意味で--homedirを追加したいと思います。

_ (2003-05-01(Thu) 19:20)

ども、要望元です。<br>lockの件、私の勘違い。ユーザ毎にロックされればいいのかと思った。<br>Content-Length無視していいかどうかは、判断できないんだけど、精度への影響が少ないなら無視してよさそうですね。<br>-v, -dはまだ試してないので、いずれ。<br>--homedir、私自身の例ですが、複数アドレス(複数ドメイン)をひとつのサーバ上にバーチャルホスティングしてまして、その複数アドレス(=複数ユーザ)間でデータベースを共有したいわけです。システム上のユーザが別でも、人間は同じわけで。レアケースとは思いますが。

_ nabeken (2003-05-02(Fri) 10:57)

Content-Length無視したいのは、単なるサボりなんですが。


トップ «前の日記(2003-04-29(Tue)) 最新 次の日記(2003-05-02(Fri))»