eMotdからの要望に答える。
作成開始。
Bayesianフィルターってデータベースを共有すると判定率が<br>低くなると思うのですが、どうなのでしょう?<br>あれは個々人当てのメールがそれぞれ違うためにメール学習を<br>させるのだからCleanなメールの幅を広げるとSpamをSpamでないと<br>する傾向が出てきませんかね?<br>その意味で--homedirオプションの存在価値に疑問を感じます。
その懸念はあります。ただ、グループの規模が小さければ、cleanなメイルとspamとの間には、十分大きな差が残るような気もしますし、サンプル数の増加による効果もあるかもしれません。ベンチマークを期待する意味で--homedirを追加したいと思います。
ども、要望元です。<br>lockの件、私の勘違い。ユーザ毎にロックされればいいのかと思った。<br>Content-Length無視していいかどうかは、判断できないんだけど、精度への影響が少ないなら無視してよさそうですね。<br>-v, -dはまだ試してないので、いずれ。<br>--homedir、私自身の例ですが、複数アドレス(複数ドメイン)をひとつのサーバ上にバーチャルホスティングしてまして、その複数アドレス(=複数ユーザ)間でデータベースを共有したいわけです。システム上のユーザが別でも、人間は同じわけで。レアケースとは思いますが。
Content-Length無視したいのは、単なるサボりなんですが。
Bayesianフィルターってデータベースを共有すると判定率が<br>低くなると思うのですが、どうなのでしょう?<br>あれは個々人当てのメールがそれぞれ違うためにメール学習を<br>させるのだからCleanなメールの幅を広げるとSpamをSpamでないと<br>する傾向が出てきませんかね?<br>その意味で--homedirオプションの存在価値に疑問を感じます。
その懸念はあります。ただ、グループの規模が小さければ、cleanなメイルとspamとの間には、十分大きな差が残るような気もしますし、サンプル数の増加による効果もあるかもしれません。ベンチマークを期待する意味で--homedirを追加したいと思います。
ども、要望元です。<br>lockの件、私の勘違い。ユーザ毎にロックされればいいのかと思った。<br>Content-Length無視していいかどうかは、判断できないんだけど、精度への影響が少ないなら無視してよさそうですね。<br>-v, -dはまだ試してないので、いずれ。<br>--homedir、私自身の例ですが、複数アドレス(複数ドメイン)をひとつのサーバ上にバーチャルホスティングしてまして、その複数アドレス(=複数ユーザ)間でデータベースを共有したいわけです。システム上のユーザが別でも、人間は同じわけで。レアケースとは思いますが。
Content-Length無視したいのは、単なるサボりなんですが。