2003-05-30(Fri) [長年日記]

_1 [bsfilter] バッドノウハウ

procmailではなくmaildropあたりを使うのか、ぐっと来る機能をbsfilterに追加するのか。

_2 [時事] 国民生活白書:フリーター増、成長制約も 生産性の低下懸念

生産性が上がったから雇用が減ったわけで、職業訓練して生産性を上げても、雇用市場が供給過剰になって失業率が上がるだけのような気もするが。需要と生産が同じなら、失業率の低い社会の方が健全だと思うので、ワークシェアリングでもやって正社員の生産性を下げたらどう?

_3 [bsfilter] 雑文発散

使って頂いているようで嬉しい。

_4 [bsfilter] 次の拡張

どうしようかしら? 激しくツッコミ希望。

  1. ChaSenあたりを使ってみる。
  2. -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。
  3. いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken databaseから計算する?
  4. --max m、--min n追加。token database中にm通のメイルが溜まったら、全tokenについて登場回数をn/m倍する。token databaseの無限膨張を避ける。
  5. その他?
本日のツッコミ(全5件) [ツッコミを入れる]
_ k (2003-05-30(Fri) 22:55)

bsfilterはspamフィルターとしてもうほとんど完成していると思うので拡張のアイディアを出すのが難しそうですね。<br>ifileというbayesianベースのspamフィルタリングソフトがあるのですが、こいつはspamだけでなくcleanなメールの内容についても学習し、内容ごとに自動的に振り分けしてくれるという妙な進化をしてしまいました。<br>http://www.nongnu.org/ifile/

_ nabeken (2003-05-30(Fri) 23:39)

ifileは知りませんでした。96年からですか。spam/cleanの2値である必要ないのでは、とは思わないでもありませんでしたが、既に実装されてましたか。

_ KAMIYA (2003-05-30(Fri) 23:46)

やることはChaSenと同じですがMeCab(のrubyインターフェース) http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html<br>で形態素解析して頂けたら嬉しいです。

_ かずひこ (2003-05-31(Sat) 09:29)

私は .qmail から直接 bsfilter を使っています。<br>http://kazuhiko.tdiary.net/20030522.html#p02

_ (2003-05-31(Sat) 18:14)

bsfilter使わせてもらっています。SPAM&ML(半)専用アドレスで使ってみて調子がよかったので、普通のメール用アドレスでも使うことにしました。

[]

トップ «前の日記(2003-05-29(Thu)) 最新 次の日記(2003-05-31(Sat))»