トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 7055 語sp WITH 6676 策? WITH 4850 printable WITH 4672 boundary WITH 3967 shift WITH 3033 手先 WITH 3027 合法 WITH 2726 はsh WITH 2604 ル入 WITH 2440 encoding WITH 2247 本文 WITH 2146 jis WITH 1891 spam WITH 1629 subject WITH 1582 freebsd WITH 713 入手 WITH 574 対策 WITH 507 プル WITH 506 何故 WITH 482 本語 WITH 443 スペ WITH 411 残念 WITH 386 メイ WITH 344 ンプ WITH 323 サン WITH 248 ペー WITH 236 イル WITH 183 日本 WITH 140 ース WITH 1 [ WITH 1 ] WITH 1 - の検索結果 212 件中 181 - 190 件目 (0.121591968 秒)

前へ ... 10 11 12 13 14 15 16 17 18 19 20 21 22 次へ

2004-04-10(Sat) [類似検索]

_[bsfilter] サイトメンテ

リンクを更新した。 Solaris での bsfilterで SPAMなトークンをテキストファイルにエキスポートしたもの が公開されているが、日本語としてはありえない単語(漢字)が含まれている。 おそらく、非日本語を日本語と誤判定してnkfに通してしまう、という既知の弱点の結果だ。 ...

_  (スコア:372)

2005-05-05(Thu) [類似検索]

_[net] フィッシング

mundomicro.comからsourceforge.jpのアカウントに来ているメールがフィッシングっぽい。 www.nicos.co.jpのイメージを使いつつ、http://nicos.concourse.jp:443/へ誘っている感じ。 charset=windows-1252なので、bsfilterが日本語と思わず、数値参照をiconvしてくれない。が、spam判定。 ...

_  (スコア:351)

2003-11-11(Tue) [類似検索]

_ツッコミ!! (やまぐち@愛知)

個人的には,C, ja 以外にも対応させる(海外からのspamを考慮する)ならば,やはり内部コードは utf-8 にしてしまった方が幸せかと思います. コード変換ってマッピングが一意に定まらないので,日本語だけでも(判りやすい例だと) eucJP -> SJIS, euc-JP -> utf-8 -> SJIS の変換結果が異なって当たり前とかいう ...

_  (スコア:351)

2003-04-20(Sun) [類似検索]

_bsfilter revision 1.13

だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...

_  (スコア:328)

2003-05-22(Thu) [類似検索]

_[net] へんなメイル3

USから来ているspamと思われるのに、 X-Mailer: MIME-tools 5.503 (Entity 5.501) Content-type: text/plain; charset="ISO-2022-JP" というヘッダが付いている。 ...

_  (スコア:311)

2003-08-11(Mon) [類似検索]

_[spam] 反撃するフィルタ --- Filters That Fight Back

本論とは関係ないところだが、viagraのミススペルが例として使われている。bsfilter -u -dで確認したが、viagraaと1文字追加したのでは満足しなかったのか、viagraalというのも記録されていた。 ...

_  (スコア:305)

2003-05-18(Sun) [類似検索]

_[bsfilter] bsfilter revision 1.26

Invalid Text-cはファイル1個だけ引数に取るオプションであるという仕様は、ヰさんにとっても、たださんにとっても、普通ではないようなので仕様を変更。revision 1.26以降ではたださんの記述通りに使える。 -c、-sは、オプションとしては引数を取らない。コマンドラインとして引数を取る。 -c、-sを指定する ...

_  (スコア:302)

2003-05-30(Fri) [類似検索]

_[bsfilter] 次の拡張

どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...

_  (スコア:263)

2003-10-10(Fri) [類似検索]

_ツッコミ!! (otsune)

些細なtypo指摘です。 s/bsfitter/bsfilter/ ですよね。 あと解説ページにも s/Sapm Detection を基本としている/Spam Detection を基本としている/ も発見しました ...

_  (スコア:169)

2003-05-02(Fri) [類似検索]

_[spam] bsproc

0.2.10が出ているが、相変わらず、疑問なコードがbayespam.rbにある。 def token_freq_dir(directory) hash = {} Dir.open(directory) do |dir| dir.each do |file| next if file =~ /^\./ File.open(directory + '/' + file) do |f| hash.update(tokenizer(f)) 複数ファイル中のtokenの出現回数の合計を求めて ...

_  (スコア:163)

前へ ... 10 11 12 13 14 15 16 17 18 19 20 21 22 次へ