[SIMILAR] WITH 2467 ルme WITH 2390 revision WITH 1769 ィホ WITH 1516 bsfilter WITH 1025 オプ WITH 830 プシ WITH 707 キタ WITH 631 ュリ WITH 630 セキ WITH 606 ー! WITH 508 リテ WITH 383 キュ WITH 377 invalid WITH 360 ホー WITH 197 ティ WITH 178 ョン WITH 160 ショ WITH 150 ター WITH 109 ール WITH 1 [ WITH 1 ] WITH 1 memo WITH 1 text WITH 1 お客 WITH 1 客さ WITH 1 さん WITH 1 んキ WITH 1 ! WITH 1 を直 WITH 1 直し WITH 1 して WITH 1 て、 の検索結果 233 件中 81 - 90 件目 (0.452394982 秒)
mundomicro.comからsourceforge.jpのアカウントに来ているメールがフィッシングっぽい。 www.nicos.co.jpのイメージを使いつつ、http://nicos.concourse.jp:443/へ誘っている感じ。 charset=windows-1252なので、bsfilterが日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 ...
「他のツールに任せるべき?」という点では、bsfilterをloadできたりするとうれしいと思うことはあります。__FILE__を使うとかなんとかで。ただ、/bin/shで起動するようになっていますから、そのままloadできるようにするのは難しそうですね。 ...
_ (スコア:3282)
bsfilterも紹介された。みんな使えているのか不安。 ...
_ (スコア:3280)
RETRではなくてTOPでメールを参照されると、pop-max-sizeでのバイパスが効かないコードっぽい。マズー。 EdMaxがTOPを使うけど... 他にもあると思うけど... バイパスが効いていても遅い、という可能性も十分にあるが、それも困ったものだ。 ...
_ (スコア:3280)
spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...
_ (スコア:3274)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:3274)
普通にインストール出来る。 perl-5.8, p5-Text-Kakasiをportsからmake install マルチプラットホーム版POPFileをget、展開 日本語化パッチ(popfile_jpn_src.zip)をget、展開 日本語化パッチのClassifier, UI, languages, manual, stopwordsで、マルチプラットホーム版を上書き perl5.8.0 -I /usr/local/lib/pe ...
_ (スコア:3274)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:3274)
postfix -> bsfilter -> sieve -> cyrus imapd という経路での使用方法が説明されている。参考になる。 config-fileとhomedirが指定されている状態で、"HOME が ENV にないと bsfilter がエラーでこける。"というのはバグだ。 ...
_ (スコア:3274)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:3274)
_ (スコア:3282)