[SIMILAR] WITH 7748 誤判 WITH 4813 字) WITH 3858 語( WITH 3453 既知 WITH 3365 非日 WITH 3033 bsfilter WITH 2431 solaris WITH 2408 弱点 WITH 1739 クン WITH 1446 本語 WITH 1422 語と WITH 1333 エキ WITH 1316 トメ WITH 1185 漢字 WITH 1096 キス WITH 1066 判定 WITH 1063 単語 WITH 826 トフ WITH 551 日本 WITH 550 テキ WITH 515 スポ WITH 457 公開 WITH 355 更新 WITH 324 ァイ WITH 319 ンテ WITH 277 結果 WITH 273 ポー WITH 265 トー WITH 239 ーク WITH 236 イル WITH 212 ンク WITH 208 メン の検索結果 200 件中 21 - 30 件目 (0.092517914 秒)
やまだあきらさんのパッチに対応できてない。 未読管理とかの状態の保持 "Seen"のチェック、設定のみ? RFC822.HEADERを書き換えてappend? bsfilterの判定結果がヘッダに入っていると嬉しい? IMAPMessage class メイル1通に対応するclassを作るべきか 複数メイルのsequence number/UIDを一気に渡して、戻り値を配 ...
Invalid Text-cはファイルを1個だけ引数に取るオプションであるという仕様は、ヰさんにとっても、たださんにとっても、普通ではないようなので仕様を変更。revision 1.26以降ではたださんの記述通りに使える。 -c、-sは、オプションとしては引数を取らない。コマンドラインとして引数を取る。 -c、-sを指定する ...
_ (スコア:2520)
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:2500)
逃避がてら,sh scriptを見てみました. mvしてからbsfilterしてるのは,ファイルのタイムスタンプをtouchで合わせるためですよね. 個人的にはprocessの起動を減らすため,mvで潰すように修正しようと思います. umaskかけておけば,chmodも要りません. ex. umask 077 bsfilter -a --pipe --... < $target > $target. ...
_ (スコア:2490)
MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...
_ (スコア:2469)
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...
_ (スコア:2464)
言語の判定はcharsetを見ない方針で show-processの表示フォーマットを拡張 bdb, qdbmのサポート追加 win9xでFile::LOCK_SH出来ないのに対応 ...
_ (スコア:2449)
SPAM判定する際にSEENフラグがセットされてしまうというのは、やっぱり問題だった。 ...
_ (スコア:2444)
--pipe, --insert-flag, --insert-probability追加 デフォルトのデータベース形式をsdbmに変更 デフォルトのspam判定方式をRobinsoh-Fisherに変更 ...
_ (スコア:2444)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:2444)
_ (スコア:2524)