[SIMILAR] WITH 19948 kakasi WITH 7748 害再 WITH 6676 katakana WITH 5832 張ラ WITH 4850 現/ WITH 4723 害報 WITH 3540 token WITH 2950 グ出 WITH 1877 近辺 WITH 1602 障害 WITH 1516 bsfilter WITH 1273 拡張 WITH 1176 デバ WITH 1073 再現 WITH 944 予感 WITH 550 ラリ WITH 545 ッグ WITH 508 報告 WITH 438 以下 WITH 350 生活 WITH 333 バッ WITH 301 ブラ WITH 295 イブ WITH 250 出来 WITH 226 問題 WITH 142 ライ WITH 1 [ WITH 1 ] WITH 1 でbu WITH 1 bus WITH 1 error WITH 1 + の検索結果 196 件中 51 - 60 件目 (0.050551935 秒)
--add-clean/spamで行われるのはtoken databaseの学習で、確率databaseへの反映には--updateが必要、という設計は失敗だったのかもしれない。 ...
ruby-1.6.4でエラーするのを対策したつもり IMAPでアクセスするとき、フォルダ単位だけでなく、メイル単位の指定も可能に bsfilter --imap inbox/1 bsfilter --imap inbox/1,2,3 bsfilter --imap inbox/1:3 勢いでChaSen, KAKASIもサポート ...
_ (スコア:609)
Ceekz Logsに、日経新聞とその他新聞の判定でベンチする話が出ている。 kakasiよりbigramの方がいいらしい。 ...
_ (スコア:609)
普通にインストール出来る。 perl-5.8, p5-Text-Kakasiをportsからmake install マルチプラットホーム版POPFileをget、展開 日本語化パッチ(popfile_jpn_src.zip)をget、展開 日本語化パッチのClassifier, UI, languages, manual, stopwordsで、マルチプラットホーム版を上書き perl5.8.0 -I /usr/local/lib/pe ...
_ (スコア:609)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:609)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:609)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:609)
日本語化関連のToDoが投稿されている。 ISO-2022-JP 以外の文字コードへの対応(パッチとしてすでに公開していますが本家にマージする作業が残っています) base64、Quoted Printable への対応 途中で改行されてしまった日本語の単語への対応 Subject の分かち書き insert.pl の日本語化(本家にマージする作業が ...
_ (スコア:609)
procmailからの移行を検討中。maildroptipsには、"if ( /^Subject: rosebud/ )"という例がある。こういうの好き。Rubyアプリケーションプログラミングには、パスタを茹でるのにテニスラケットを使う話が出ていたと思う。 mhフォルダへの振り分けは出来ないみたい。ので、強引に対処。 SHELL=/bin/sh MAILDIR=$H ...
_ (スコア:609)
_ (スコア:610)