[SIMILAR] WITH 6235 要修 WITH 6198 トre WITH 6162 ダ中 WITH 5991 tokenizer WITH 4125 字以 WITH 3540 token WITH 3257 received WITH 2975 グメ WITH 2390 revision WITH 2208 ッダ WITH 1995 のto WITH 1755 message WITH 1516 bsfilter WITH 1461 ヘッ WITH 1185 漢字 WITH 1176 デバ WITH 1050 解釈 WITH 960 ムス WITH 784 加減 WITH 578 修正 WITH 545 ッグ WITH 544 捨て WITH 529 カウ WITH 501 イム WITH 442 文字 WITH 399 マッ WITH 386 メイ WITH 344 ンプ WITH 333 バッ WITH 307 タン WITH 288 ッチ WITH 276 ウン の検索結果 209 件中 81 - 90 件目 (0.187270669 秒)
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
以前から、ちょっとイヤな点がある。誰のせいか調査中。 text/plainな日本語ファイルを添付すると、漢字コードがiso-2022-jpになる。 text/plainな日本語ファイルを添付し、'C'でoutput message charsetを 例えばeuc-jpに指定すると、改行コードが0x0d 0x0aになる。 本文なしでtext/plainなファイルを添付すると ...
_ (スコア:1398)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...
_ (スコア:1366)
やったこと Mew 4.2.53対応 IMAPについてのデバッグ 今後の予定 mecab-0.90 対応 ...
_ (スコア:1333)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:1215)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:1185)
逃避がてら,sh scriptを見てみました. mvしてからbsfilterしてるのは,ファイルのタイムスタンプをtouchで合わせるためですよね. 個人的にはprocessの起動を減らすため,mvで潰すように修正しようと思います. umaskかけておけば,chmodも要りません. ex. umask 077 bsfilter -a --pipe --... < $target > $target. ...
_ (スコア:1175)
派手に文字化けしたメールが来た。 ◇本メールの送付を希望されない方は、こちらのURLから手続きを行って下さい。 http://r02.smp.ne.jp/... と書いてあるので、付き合いのある会社の名を騙ったフィッシングかと思った。 smp.ne.jpはML専門業者 "<", ">"で括られたMessage-IDをそのままmime boundaryに使った "< ...
_ (スコア:1164)
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
_ (スコア:1119)
_ (スコア:1426)