トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 7748 木茜 WITH 4419 柏木 WITH 2087 連敗 WITH 1516 bsfilter WITH 1 [ WITH 1 spam WITH 1 ] WITH 1 gmail WITH 1 もbs WITH 1 も連 WITH 1 敗。 の検索結果 214 件中 141 - 150 件目 (0.092382122 秒)

前へ ... 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 次へ

2003-07-28(Mon) [類似検索]

_[bsfilter] 1.33.4系の変更点

Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...

_  (スコア:1632)

2003-04-20(Sun) [類似検索]

_bsfilter revision 1.13

だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...

_  (スコア:1632)

2006-05-03(Wed) [類似検索]

_ツッコミ!! (不断)

SourceForge.jp 経由で bsfilter-1.0.14.rc1.tgz を入手しようとしたところ、 avast! Antivirus により、当該ファイルにはトロイの木馬「Win32:Ruby [Trj]」 が含まれているとの警告を受けました。 avast! version 4.7 Professional Build: May 2006 4.7.827 VPS ファイル (ウイルス・データベース) 編集日 : 2 ...

_  (スコア:1632)

2003-03-15(Sat) [類似検索]

_bsfilter revision 1.9

category + "*" + tokenという文字列がハッシュのキーで目覚めが悪かったので、hash[category][token]のように修正 unix from, from, to, cc, subject, received, reply-to, return-path, content-transfer-encoding, content-type以外のヘッダを捨てるように変更 相変わらずMIMEの解釈はしないが、base64、quo ...

_  (スコア:1632)

2003-10-10(Fri) [類似検索]

_[bsfilter] revision 1.35.4.13からgdbmサポート

長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...

_  (スコア:1624)

2003-12-20(Sat) [類似検索]

_[bsfilter] dump_mozdat

えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...

_  (スコア:1613)

2005-06-18(Sat) [類似検索]

_[bsfilter] tokenの使用状況

% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...

_  (スコア:1613)

2003-05-06(Tue) [類似検索]

_[bsfilter] bsfilter 1.19

日本語メイル中の英単語の扱いに問題があったので、修正。 --exec-spam "command args.."のようなオプションを付けようか迷っている。 ~/Mail/inbox/*に対してbsfilterを実行し、spamについてはformailで X-Spam-Flag: Yesヘッダを追加するというのを想定。 ...

_  (スコア:1598)

2003-06-16(Mon) [類似検索]

_[bsfilter] 次の拡張

思案中。1は確定。 拡張じゃないけど、SDBM、Robinson-Fisherを使うのをデフォルトにする。 bsfilterが自力で"X-Spam-Flag: Yes"を付けるようにする? bsfilterが自力で"X-Spam-Score: 0.9"を付けるようにする? --spam-command、--clean-commandオプションで指定したコマンドに、メイルをパイプするようにする? ...

_  (スコア:1598)

2004-03-13(Sat) [類似検索]

_[bsfilter] --ignore系オプションベンチマーク

spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...

_  (スコア:1559)

前へ ... 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 次へ