[SIMILAR] WITH 15083 同上 WITH 8118 一括 WITH 7748 用fr WITH 6162 。bc WITH 5802 ス更 WITH 4813 括し WITH 4723 。bm WITH 4434 procmail WITH 3942 flag WITH 3139 clean WITH 2836 spam WITH 2814 。bs WITH 2132 判定 WITH 1654 上。 WITH 1516 bsfilter WITH 1495 て同 WITH 1263 タベ WITH 1119 見逃 WITH 582 が付 WITH 534 場合 WITH 504 合は WITH 493 定。 WITH 413 ベー WITH 386 メイ WITH 355 更新 WITH 334 の場 WITH 332 デー WITH 328 マー WITH 284 必要 WITH 239 ーク WITH 236 イル WITH 222 ータ の検索結果 237 件中 71 - 80 件目 (0.070504733 秒)
Ceekz Logsに、日経新聞とその他新聞の判定でベンチする話が出ている。 kakasiよりbigramの方がいいらしい。 ...
最近はデフォルトが"--method rf"なので、tokenizerが拾ってきたtokenを全部使って判定してます。 "--method g"については、15token固定なので、これを可変にという提案がありました。どうしよう... ...
_ (スコア:910)
思案中。1は確定。 拡張じゃないけど、SDBM、Robinson-Fisherを使うのをデフォルトにする。 bsfilterが自力で"X-Spam-Flag: Yes"を付けるようにする? bsfilterが自力で"X-Spam-Score: 0.9"を付けるようにする? --spam-command、--clean-commandオプションで指定したコマンドに、メイルをパイプするようにする? ...
_ (スコア:894)
日本語メイル中の英単語の扱いに問題があったので、修正。 --exec-spam "command args.."のようなオプションを付けようか迷っている。 ~/Mail/inbox/*に対してbsfilterを実行し、spamについてはformailで X-Spam-Flag: Yesヘッダを追加するというのを想定。 ...
_ (スコア:894)
現在は以下のようなサポート状況。 rubyについてくるsdbm やっぱりGNUなgdbm FreeBSDだと、ふつーportupgradeでbdb1 marshalだった時代もあった bdb revision 1のみだと寂しいかなぁ。revision 2が使えると嬉しい環境があるのかな? 本当は、valueとしてhashを持てるデータベースを使いたい。 ...
_ (スコア:877)
1.31.4.7を数日、使って問題なかったら、これを1.32とする。 1.32.4系列では、データベースの無限膨張を抑える仕組みを入れる。 3ヶ月間、楽しく作って来たけど、そろそろ終わりかしら。 ...
_ (スコア:877)
やまだあきらさんのパッチに対応できてない。 未読管理とかの状態の保持 "Seen"のチェック、設定のみ? RFC822.HEADERを書き換えてappend? bsfilterの判定結果がヘッダに入っていると嬉しい? IMAPMessage class メイル1通に対応するclassを作るべきか 複数メイルのsequence number/UIDを一気に渡して、戻り値を配 ...
_ (スコア:858)
逃避がてら,sh scriptを見てみました. mvしてからbsfilterしてるのは,ファイルのタイムスタンプをtouchで合わせるためですよね. 個人的にはprocessの起動を減らすため,mvで潰すように修正しようと思います. umaskかけておけば,chmodも要りません. ex. umask 077 bsfilter -a --pipe --... < $target > $target. ...
_ (スコア:841)
r162_asianization branchで実験開始。が、spamしか持っていないので、効果が分からない。 euc-kr, ks_c_5601-1987を、ko databaseに入れる big5を、tw databaseに入れる gb2312を、cn databaseに入れる export/importのコードはutf-8 ko, tw, cnのデータベースのコードはutf-8 jaのデータベースのコードはeuc- ...
_ (スコア:813)
-aが実用的でないので改造。 -aの場合、exitしてspamか否かをstatus codeで返す直前に、子プロセスをfork。親がexitしたあとに、子がデータベースの更新を行なう。子の処理時間は一見、見えない。 --synchronous-auto-updateは、旧-aに相当。forkせずに、データベースの更新をしてからexit。 tokenizerも少し変 ...
_ (スコア:795)
_ (スコア:912)