2004-02-26(Thu) [長年日記]

_1 [bsfilter] bsfilter --add-spam --update と逐次 update するのと...

動作は以下のようになる。

--add-spam
spam中のtokenの出現回数を、データベースに加算する。
--update
データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。
--add-spam --update
spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を計算する。

なので、質問の答えは以下のようになる。

結果に違いはあるのか?
基本的にはない。が、実装上の都合で、微妙には異なると思う。
速度(効率)はどちらが良いか?
追加するメイルの数による。よほど大量のメイルを一度に扱わない限り、--add-spam --updateの方が速いはず。
[]