トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 8246 旦溜 WITH 7748 誤判 WITH 7323 私感 WITH 5926 ヰ) WITH 1071 一旦 WITH 1066 判定 WITH 668 ナス WITH 527 バラ WITH 458 イナ WITH 386 メイ WITH 331 マイ WITH 283 意味 WITH 267 場合 WITH 236 イル WITH 226 問題 WITH 134 ミ!! WITH 122 ツッ WITH 117 ッコ WITH 115 コミ WITH 1 !! WITH 1 ( WITH 1 ) WITH 1 ラな WITH 1 なら WITH 1 らば WITH 1 ば、 WITH 1 、こ WITH 1 これ WITH 1 れら WITH 1 らの WITH 1 の問 WITH 1 題は の検索結果 154 件中 71 - 80 件目 (0.489646152 秒)

前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 次へ

2003-08-17(Sun) [類似検索]

_[bsfilter] IMAP実験

revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...

_  (スコア:717)

2004-03-13(Sat) [類似検索]

_[bsfilter] --ignore系オプションベンチマーク

spam特有のノイズに弱くなるような気がして、--ignore-after-last-atag --ignore-plain-text-partは使っていないのだが、本当にそうなのかベンチマークした。使っても使わなくても一緒、というのが手元のデータでの結論。 TESTHOME="/home/nabeken/tmp/def" OPTIONS="-v --homedir $TESTHOME" rm -r $TESTHOME ...

_  (スコア:717)

2003-07-28(Mon) [類似検索]

_[bsfilter] 1.33.4系の変更点

Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...

_  (スコア:717)

2004-12-14(Tue) [類似検索]

_[bsfilter] bsfilter を試してみた

Ceekz Logsに、日経新聞とその他新聞の判定でベンチする話が出ている。 kakasiよりbigramの方がいいらしい。 ...

_  (スコア:717)

2005-07-18(Mon) [類似検索]

_[bsfilter] release-1.0.8

言語の判定はcharsetを見ない方針で show-processの表示フォーマットを拡張 bdb, qdbmのサポート追加 win9xでFile::LOCK_SH出来ないのに対応 ...

_  (スコア:717)

2003-06-21(Sat) [類似検索]

_[bsfilter] revision 1.32.4.4

--pipe, --insert-flag, --insert-probability追加 デフォルトのデータベース形式をsdbmに変更 デフォルトのspam判定方式をRobinsoh-Fisherに変更 ...

_  (スコア:717)

2003-05-25(Sun) [類似検索]

_[bsfilter] bsfilter revision 1.30

SDBMサポート。デフォルトのmarshalに比べて、-s、-c、spam判定は格段に速い。-uはちょっと遅い。 データベースの肥大を抑える仕組みがそのうち必要になる? ...

_  (スコア:717)

2005-05-05(Thu) [類似検索]

_[net] フィッシング

mundomicro.comからsourceforge.jpのアカウントに来ているメールがフィッシングっぽい。 www.nicos.co.jpのイメージを使いつつ、http://nicos.concourse.jp:443/へ誘っている感じ。 charset=windows-1252なので、bsfilterが日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 ...

_  (スコア:717)

2006-04-02(Sun) [類似検索]

_[bsfilter] revision 1.78

release-1.0.13になる予定。 --refer-headerオプション追加 複数行のContent-Transfer-Encodingがbase64, 8bitと言っている場合に、base64 decodeする uuencodeしたのを本文に貼り付けてあるっぽいのをスキップする shift-jisなMIME B-encodingをnkfがデコードしてくれないので、iso-2022-jpと書き換えてからnk ...

_  (スコア:717)

2003-04-20(Sun) [類似検索]

_bsfilter revision 1.13

だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...

_  (スコア:717)

前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 次へ