_1 [spam] POPFile日本語化
日本語化関連のToDoが投稿されている。
- ISO-2022-JP 以外の文字コードへの対応(パッチとしてすでに公開していますが本家にマージする作業が残っています)
- base64、Quoted Printable への対応
- 途中で改行されてしまった日本語の単語への対応
- Subject の分かち書き
- insert.pl の日本語化(本家にマージする作業が残っています)
- 日本語化関連テストツール(バージョンが新しくなったときに古い日本語化関連のバグが再発しないよう、本家テストツールに日本語化関連のテストを漏れなく加える
- Kakasi よりも高速な形態素解析システム(例えばMecab?)への対応
bsfilterはテスト以外、大丈夫だと思う。"途中で改行"については、ちょっとした引用記号を捨てることもやっている。
無関係な単語を大量に含むspamが増えてきた。人間の目には入らないように、という工夫も無い。それは、spam filter対策として反則だろう。もともとspamは反則なのだが。