トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 4621 大バ WITH 1516 bsfilter WITH 1386 バグ WITH 728 指摘 WITH 1 [ WITH 1 ] WITH 1 exit WITH 1 status WITH 1 グを WITH 1 をbb WITH 1 bbs WITH 1 で指 WITH 1 摘さ WITH 1 され WITH 1 れて WITH 1 てし WITH 1 しま WITH 1 まっ WITH 1 った WITH 1 た。 の検索結果 225 件中 151 - 160 件目 (0.744735271 秒)

前へ ... 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 次へ

2003-11-11(Tue) [類似検索]

_[bsfilter] unicode対応

C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...

_  (スコア:2967)

2003-08-16(Sat) [類似検索]

_ツッコミ!! (やまだあきら)

IMAPサーバにもよって、普通にprocmailを使えるようなのもありますし、sieveのようなIMAPサーバ上で実行されるスクリプトを使う必要のあるものもあります。 あと、imapfilterというプログラムはIMAPでアクセスすることによって振り分けることができるようです。 (個人的にはimapfilterのようなものをRubyで作っ ...

_  (スコア:2967)

2003-05-31(Sat) [類似検索]

_[bsfilter] revision 1.31.4.2

MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...

_  (スコア:2967)

2003-05-30(Fri) [類似検索]

_[bsfilter] 次の拡張

どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...

_  (スコア:2967)

2003-05-26(Mon) [類似検索]

_[FreeBSD] メイル経路

現在、自宅ではmewがPOP/SMTPを喋ってプロバイダとメイルをやりとりしているため、デーモンの類が一切、走っていない。 途中でbsfilter + 何かに、SPAMだというマークを付けさせる。 POPで新着メイルをチェックするbiff系ツールを使いたい。 本文中の"From"が、"> From"になるのは許さない。 という条件では、何 ...

_  (スコア:2967)

2006-04-02(Sun) [類似検索]

_[bsfilter] revision 1.78

release-1.0.13になる予定。 --refer-headerオプション追加 複数行のContent-Transfer-Encodingがbase64, 8bitと言っている場合に、base64 decodeする uuencodeしたのを本文に貼り付けてあるっぽいのをスキップする shift-jisなMIME B-encodingをnkfがデコードしてくれないので、iso-2022-jpと書き換えてからnk ...

_  (スコア:2967)

2004-02-26(Thu) [類似検索]

_Invalid Text[bsfilter]

動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...

_  (スコア:2967)

2003-07-28(Mon) [類似検索]

_[bsfilter] 1.33.4系の変更点

Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...

_  (スコア:2967)

2003-05-26(Mon) [類似検索]

_[bsfilter] SPAM認識率向上策

たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...

_  (スコア:2967)

2003-04-20(Sun) [類似検索]

_bsfilter revision 1.13

だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...

_  (スコア:2967)

前へ ... 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 次へ