[SIMILAR] WITH 4054 ダ名 WITH 3033 bsfilter WITH 2390 revision WITH 693 バグ WITH 589 ルダ WITH 578 修正 WITH 557 ォル WITH 336 確認 WITH 284 必要 WITH 276 フォ WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 . WITH 1 38 WITH 1 4 WITH 1 10 WITH 1 - WITH 1 u WITH 1 でフ WITH 1 名が WITH 1 が必 WITH 1 要な WITH 1 なの WITH 1 のは WITH 1 はバ WITH 1 グな WITH 1 ので WITH 1 で修 WITH 1 正。 WITH 1 。確 WITH 1 認し の検索結果 262 件中 71 - 80 件目 (0.212052798 秒)
mewから使えるようにしてみた。procmailが必要。 bm SPAMか判定。SPAMの場合は、X-Spam-Flag: Yesが付く。cleanの場合は、No。 bM @マークが付いているメイルについて、一括でSPAM判定。 bs SPAMとして、データベース更新。見逃したSPAMにX-Spam-Flag: Yesを付ける。 bS 一括して同上。 bc cleanとして同上。 b ...
C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...
_ (スコア:5273)
IMAPサーバにもよって、普通にprocmailを使えるようなのもありますし、sieveのようなIMAPサーバ上で実行されるスクリプトを使う必要のあるものもあります。 あと、imapfilterというプログラムはIMAPでアクセスすることによって振り分けることができるようです。 (個人的にはimapfilterのようなものをRubyで作っ ...
_ (スコア:5273)
普通にインストール出来る。 perl-5.8, p5-Text-Kakasiをportsからmake install マルチプラットホーム版POPFileをget、展開 日本語化パッチ(popfile_jpn_src.zip)をget、展開 日本語化パッチのClassifier, UI, languages, manual, stopwordsで、マルチプラットホーム版を上書き perl5.8.0 -I /usr/local/lib/pe ...
_ (スコア:5272)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:5272)
bsfilter-1.0.17.rc4はleopardでリリースした。新たな問題に当たりたくなかったので、FreeBSD時代と同じ以下の物を使用した。 exerb-4.1.0.zip ruby-1.8.4-i386-mswin32.zip vruby-061102-i386-mswin32-1.8.zip vrswin-060205-i386-mswin32-1.8.zip exerbのインストールはleopard標準のrubyをそのまま使ったので ...
_ (スコア:5272)
word saladの影響なんて関係ないのであれば,</BODY>とか</HTML>とかの後を無視する必要もない訳ですし,--ignore-plain-text-part, --ignore-after-last-atag, --ignore-bodyなんてのも要らないと思うのです. 他のBayesian spam filterでも,word saladの影響を無視できなくなってきている(spammerがfilter対策を ...
_ (スコア:5272)
mew 用アタッチメントですが,multipart なメッセージで,`.' や `:'(或はそのまま)で個々のパートを表示させ, アタッチメントのパート上で "b m" を実行すると,bsfilter に失敗し,フォルダ構成が変更されてしまいます. ex. +inbox で 24021 M01/01 3k "Jesus Roberts Re: Real Good PHENTERM0NE, V1AGR0, AMBI ...
_ (スコア:5272)
日本語化関連のToDoが投稿されている。 ISO-2022-JP 以外の文字コードへの対応(パッチとしてすでに公開していますが本家にマージする作業が残っています) base64、Quoted Printable への対応 途中で改行されてしまった日本語の単語への対応 Subject の分かち書き insert.pl の日本語化(本家にマージする作業が ...
_ (スコア:5272)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:5272)
_ (スコア:5273)