[SIMILAR] WITH 7748 15token WITH 5991 tokenizer WITH 5599 部使 WITH 5293 可変 WITH 2985 nabeken WITH 2281 method WITH 1103 提案 WITH 1066 判定 WITH 1057 固定 WITH 837 デフ WITH 557 ォル WITH 452 全部 WITH 360 ルト WITH 276 フォ WITH 223 最近 WITH 134 ミ!! WITH 122 ツッ WITH 117 ッコ WITH 115 コミ WITH 1 !! WITH 1 ( WITH 1 ) WITH 1 近は WITH 1 はデ WITH 1 トが WITH 1 が"- WITH 1 "-- WITH 1 rf WITH 1 " WITH 1 なの WITH 1 ので WITH 1 で、 の検索結果 380 件中 321 - 330 件目 (0.143973393 秒)
CPPFLAGS に -DJISX0208 を追加して、日本語を通るようにした CONFIGURE_ARGS に --with-fontconfigincludedir=/usr/X11R6/include --with-fontconfiglibdir=/usr/X11R6/lib を追加して、fc-list で表示されるフォントを使えるようにした。Times-Roman が入っていないので、デフォルトのままだとエラーが出るの ...
やまだあきらさんのパッチに対応できてない。 未読管理とかの状態の保持 "Seen"のチェック、設定のみ? RFC822.HEADERを書き換えてappend? bsfilterの判定結果がヘッダに入っていると嬉しい? IMAPMessage class メイル1通に対応するclassを作るべきか 複数メイルのsequence number/UIDを一気に渡して、戻り値を配 ...
_ (スコア:807)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:807)
mewから使えるようにしてみた。procmailが必要。 bm SPAMか判定。SPAMの場合は、X-Spam-Flag: Yesが付く。cleanの場合は、No。 bM @マークが付いているメイルについて、一括でSPAM判定。 bs SPAMとして、データベース更新。見逃したSPAMにX-Spam-Flag: Yesを付ける。 bS 一括して同上。 bc cleanとして同上。 b ...
_ (スコア:807)
Ceekz Logsに、日経新聞とその他新聞の判定でベンチする話が出ている。 kakasiよりbigramの方がいいらしい。 ...
_ (スコア:807)
SPAM判定する際にSEENフラグがセットされてしまうというのは、やっぱり問題だった。 ...
_ (スコア:807)
mundomicro.comからsourceforge.jpのアカウントに来ているメールがフィッシングっぽい。 www.nicos.co.jpのイメージを使いつつ、http://nicos.concourse.jp:443/へ誘っている感じ。 charset=windows-1252なので、bsfilterが日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 ...
_ (スコア:807)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:807)
utf-8サポート iconvが使えれば、utf-8をeucJPに変換しようとする 本文についてはcharsetを信用しない。signatureがマッチしたらiconvする ヘッダについてはcharsetを信用する。 utf-8なメイルは日本語と判定する。 pop proxy時にlistenするインターフェイスを指定可能 例えば、--pop-proxy-port 127.0.0.1:101 ...
_ (スコア:807)
C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...
_ (スコア:807)
_ (スコア:814)