[SIMILAR] WITH 16493 imapfilter WITH 4434 procmail WITH 3157 はim WITH 2674 バ上 WITH 2006 imap WITH 1516 bsfilter WITH 1418 コム WITH 1029 妄想 WITH 776 リプ WITH 708 プト WITH 690 実行 WITH 641 ーバ WITH 477 サー WITH 477 セス WITH 451 人的 WITH 439 ラム WITH 429 クセ WITH 368 アク WITH 352 個人 WITH 314 グラ WITH 303 普通 WITH 295 ログ WITH 292 スク WITH 284 必要 WITH 249 プロ WITH 245 ツッ WITH 242 を使 WITH 235 ッコ WITH 234 クリ WITH 197 コー WITH 154 時間 WITH 147 ード の検索結果 222 件中 91 - 100 件目 (0.118737791 秒)
Invalid Text3/5で"U.S. Green Card Lottery"spamから10周年、 3/23でmewが10周年らしい。 今日で、bsfilterの開発 / 1st releaseからである。 ...
完成したことにする。なにかアイディアが浮かぶまでは、ほそぼそとした改良のみの予定。 bsfilter mew front-endのページも作った。 ...
_ (スコア:844)
--homedir追加 標準入力からを除いて、mbox形式サポート javascript必須で、MS Pゴシックをフォントに指定するDION掲示板抹殺 ...
_ (スコア:844)
--ignore-plain-text-part htmlのパートがある時、plain textのパートを無視するオプションを追加 mew.tgz BBSでの指摘に従い、bsfilter.el更新 ...
_ (スコア:844)
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
_ (スコア:844)
Invalid Text --show-new-token追加。新たに登録されたtokenが表示される。 Content-Type: Message/Rfc822なパートのヘッダ部分が、本文扱いだったのをいい加減に修正。ソースが0.2procmailくらいになったので、なんとかしたい。 ...
_ (スコア:844)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:844)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:844)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
_ (スコア:844)
しつこく更新。 本文中の"From"を"unix from"だと誤解するケースがあるので、--mboxが指定されない限り、"unix from"を探さないように変更。 日本語のtokenizeに入る前に、">>"等の引用マークを削除するように変更。単語の途中で改行され、引用マークが入っても、単語として切り出すように努力する。 ...
_ (スコア:844)
_ (スコア:844)