[SIMILAR] WITH 5655 robinson WITH 4804 command WITH 4550 bsfilter WITH 3539 自力 WITH 2950 で" WITH 2845 案中 WITH 2546 拡張 WITH 2159 思案 WITH 1025 オプ WITH 1015 確定 WITH 945 spam WITH 837 デフ WITH 830 プシ WITH 793 コマ WITH 780 力で WITH 734 を付 WITH 675 る? WITH 613 が自 WITH 557 ォル WITH 496 指定 WITH 480 パイ WITH 443 イプ WITH 386 メイ WITH 360 ルト WITH 276 フォ WITH 264 にす WITH 264 マン WITH 258 付け WITH 236 イル WITH 198 ンド WITH 178 ョン WITH 160 ショ の検索結果 271 件中 131 - 140 件目 (0.110998429 秒)
IMAPサーバにもよって、普通にprocmailを使えるようなのもありますし、sieveのようなIMAPサーバ上で実行されるスクリプトを使う必要のあるものもあります。 あと、imapfilterというプログラムはIMAPでアクセスすることによって振り分けることができるようです。 (個人的にはimapfilterのようなものをRubyで作っ ...
MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...
_ (スコア:4071)
だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...
_ (スコア:4071)
SourceForge.jp 経由で bsfilter-1.0.14.rc1.tgz を入手しようとしたところ、 avast! Antivirus により、当該ファイルにはトロイの木馬「Win32:Ruby [Trj]」 が含まれているとの警告を受けました。 avast! version 4.7 Professional Build: May 2006 4.7.827 VPS ファイル (ウイルス・データベース) 編集日 : 2 ...
_ (スコア:4071)
bsfilterの過去のバージョンは公開されていないのでしょうか? 初期の物からどういった改良が加えられてきたのか、興味があります。 ...
_ (スコア:4062)
iconv.dllに関するドキュメントを更新して、release-1.0.10として出す方向。 クラス定数を変数代りに使っていて、複数同時にインスタンシエーションするとヤバいのを修正。 ...
_ (スコア:4055)
exportするフォーマットを変更して、importを大幅高速化。mbox-likeな形式でexportして、importはadd-clean/spamのパスを通すのは、良案だと思ったのだが遅すぎるので廃止。無駄にCPUを使うと、でんこちゃんに怒られそうだし。 ...
_ (スコア:4049)
やまだあきらさんのパッチに対応できてない。 未読管理とかの状態の保持 "Seen"のチェック、設定のみ? RFC822.HEADERを書き換えてappend? bsfilterの判定結果がヘッダに入っていると嬉しい? IMAPMessage class メイル1通に対応するclassを作るべきか 複数メイルのsequence number/UIDを一気に渡して、戻り値を配 ...
_ (スコア:4041)
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:4036)
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...
_ (スコア:4030)
_ (スコア:4071)