動作は以下のようになる。
- --add-spam
- spam中のtokenの出現回数を、データベースに加算する。
- --update
- データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。
- --add-spam --update
- spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を計算する。
なので、質問の答えは以下のようになる。
- 結果に違いはあるのか?
- 基本的にはない。が、実装上の都合で、微妙には異なると思う。
- 速度(効率)はどちらが良いか?
- 追加するメイルの数による。よほど大量のメイルを一度に扱わない限り、--add-spam --updateの方が速いはず。