[SIMILAR] WITH 7748 グ認 WITH 5832 新1 WITH 2390 revision WITH 1516 bsfilter WITH 1339 認定 WITH 1085 要素 WITH 693 バグ WITH 398 対応 WITH 386 メイ WITH 371 変更 WITH 355 更新 WITH 236 イル WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 . WITH 1 38 WITH 1 8 WITH 1 でar WITH 1 argv WITH 1 の要 WITH 1 素が WITH 1 がfr WITH 1 freeze WITH 1 され WITH 1 れる WITH 1 るよ WITH 1 よう WITH 1 うに WITH 1 にな WITH 1 なっ WITH 1 った の検索結果 299 件中 31 - 40 件目 (0.216915297 秒)
1.31.4.7を数日、使って問題なかったら、これを1.32とする。 1.32.4系列では、データベースの無限膨張を抑える仕組みを入れる。 3ヶ月間、楽しく作って来たけど、そろそろ終わりかしら。 ...
MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...
_ (スコア:2747)
r162_asianization branchで実験開始。が、spamしか持っていないので、効果が分からない。 euc-kr, ks_c_5601-1987を、ko databaseに入れる big5を、tw databaseに入れる gb2312を、cn databaseに入れる export/importのコードはutf-8 ko, tw, cnのデータベースのコードはutf-8 jaのデータベースのコードはeuc- ...
_ (スコア:2747)
category + "*" + tokenという文字列がハッシュのキーで目覚めが悪かったので、hash[category][token]のように修正 unix from, from, to, cc, subject, received, reply-to, return-path, content-transfer-encoding, content-type以外のヘッダを捨てるように変更 相変わらずMIMEの解釈はしないが、base64、quo ...
_ (スコア:2684)
bsfilter -uでフォルダ名が必要なのはバグなので修正。確認していないけど。 ...
_ (スコア:2669)
そろそろリリースしよう。release 1.0.0に対する変更は以下のはず。 --mark-in-token # で落ちるバグ修正 --export-probability 追加(デバッグ用) --insert-revision 追加 --header-prefix 追加 --imap-auth loginc 追加。LOGIN命令でIMAP serverに接続 --imap-auth auto 追加。適当にIMAP serverに接続。デフォ ...
_ (スコア:2669)
LIST nのときでも、".CRLF"を待っていたのをデバッグして、revision 1.35.4.11。 UIDL nのときでも、".CRLF"を待っていたのをデバッグして、revision 1.35.4.12。なんで一発で直せないかなぁ。 ...
_ (スコア:2656)
現在は以下のようなサポート状況。 rubyについてくるsdbm やっぱりGNUなgdbm FreeBSDだと、ふつーportupgradeでbdb1 marshalだった時代もあった bdb revision 1のみだと寂しいかなぁ。revision 2が使えると嬉しい環境があるのかな? 本当は、valueとしてhashを持てるデータベースを使いたい。 ...
_ (スコア:2656)
しつこく更新。 本文中の"From"を"unix from"だと誤解するケースがあるので、--mboxが指定されない限り、"unix from"を探さないように変更。 日本語のtokenizeに入る前に、">>"等の引用マークを削除するように変更。単語の途中で改行され、引用マークが入っても、単語として切り出すように努力する。 ...
_ (スコア:2633)
全てのreceivedヘッダを見ていたのを止めて、送り手に一番近いものだけを見るように変更。特にML経由の場合、後半のreceivedは見るだけ無駄なので。-Hを付けた方が判定精度が高いという話も、これが影響していたのかもしれない。 html中のnumeric character referenceを無視するように変更。FreeBSD-users-jp 7 ...
_ (スコア:2613)
_ (スコア:2747)