[SIMILAR] WITH 7748 誤判 WITH 4813 字) WITH 3858 語( WITH 3453 既知 WITH 3365 非日 WITH 3033 bsfilter WITH 2431 solaris WITH 2408 弱点 WITH 1739 クン WITH 1446 本語 WITH 1422 語と WITH 1333 エキ WITH 1316 トメ WITH 1185 漢字 WITH 1096 キス WITH 1066 判定 WITH 1063 単語 WITH 826 トフ WITH 551 日本 WITH 550 テキ WITH 515 スポ WITH 457 公開 WITH 355 更新 WITH 324 ァイ WITH 319 ンテ WITH 277 結果 WITH 273 ポー WITH 265 トー WITH 239 ーク WITH 236 イル WITH 212 ンク WITH 208 メン の検索結果 200 件中 1 - 10 件目 (0.090841879 秒)
リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...
バラならば、これらの問題はなくなりますが、その場合、一旦溜めてから送る意味は何か残りますかね。誤判定されたcleanなメイルが遅れる分、マイナスな気も。 # あくまで私感ですので... ...
_ (スコア:6180)
無理のある映画といえば、ショーンコネリー(007)が「レッドオクトーバーを追え」で、ロシアを舞台にスコットランド英語(スコティッシュ)全開で大活躍していたのには笑えた、と知り合いのカナダ人が言ってました。 ...
_ (スコア:3047)
mundomicro.comからsourceforge.jpのアカウントに来ているメールがフィッシングっぽい。 www.nicos.co.jpのイメージを使いつつ、http://nicos.concourse.jp:443/へ誘っている感じ。 charset=windows-1252なので、bsfilterが日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 ...
_ (スコア:2682)
だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...
_ (スコア:2661)
1ページぐらいのサイズで取り上げられているので購入。日本語に対応したベイジアンフィルタとしては最も実績がありだそうだ :-) "bm"と入力するとCommand:と聞かれるというのは解せない。チェックしないと。 性能比較を期待していたのだが、それはなかった。 ...
_ (スコア:2661)
utf-8サポート iconvが使えれば、utf-8をeucJPに変換しようとする 本文についてはcharsetを信用しない。signatureがマッチしたらiconvする ヘッダについてはcharsetを信用する。 utf-8なメイルは日本語と判定する。 pop proxy時にlistenするインターフェイスを指定可能 例えば、--pop-proxy-port 127.0.0.1:101 ...
_ (スコア:2659)
日本語メイル中の英単語の扱いに問題があったので、修正。 --exec-spam "command args.."のようなオプションを付けようか迷っている。 ~/Mail/inbox/*に対してbsfilterを実行し、spamについてはformailで X-Spam-Flag: Yesヘッダを追加するというのを想定。 ...
_ (スコア:2648)
普通にインストール出来る。 perl-5.8, p5-Text-Kakasiをportsからmake install マルチプラットホーム版POPFileをget、展開 日本語化パッチ(popfile_jpn_src.zip)をget、展開 日本語化パッチのClassifier, UI, languages, manual, stopwordsで、マルチプラットホーム版を上書き perl5.8.0 -I /usr/local/lib/pe ...
_ (スコア:2629)
_ (スコア:10000)