トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 1865 一行 WITH 1516 bsfilter WITH 134 ミ!! WITH 122 ツッ WITH 117 ッコ WITH 115 コミ WITH 1 !! WITH 1 ( WITH 1 かず WITH 1 ずひ WITH 1 ひこ WITH 1 こ) WITH 1 ) WITH 1 の一 WITH 1 行め WITH 1 めは WITH 1 は、 WITH 1 、#! WITH 1 #!/ WITH 1 usr WITH 1 / WITH 1 bin WITH 1 env WITH 1 ruby WITH 1 にし WITH 1 して WITH 1 てく WITH 1 くだ WITH 1 ださ WITH 1 さる WITH 1 ると WITH 1 と幸 の検索結果 194 件中 151 - 160 件目 (0.315351783 秒)

前へ ... 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ

2004-02-26(Thu) [類似検索]

_Invalid Text[bsfilter</strong>]

動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...

_  (スコア:6275)

2003-07-28(Mon) [類似検索]

_[bsfilter</strong>] 1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>.33.4系の変更点

Invalid Text ほんの少し高速化 連続していない漢字(</strong>==1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>文字だけ)</strong>も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、</strong>そのまま判定に使用する。以前は、</strong>ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>文字を削ってProzacで試すよう ...

_  (スコア:6275)

2003-05-26(Mon) [類似検索]

_[bsfilter</strong>] SPAM認識率向上策

ださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>5tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、</strong>-H付きで実行。 - ...

_  (スコア:6275)

2003-04-20(Sun) [類似検索]

_bsfilter</strong> revision 1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>.1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>3

だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...

_  (スコア:6275)

2004-05-14(Fri) [類似検索]

_[bsfilter</strong>] 韓国語、中国語サポート

r1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>62_asianization branchで実験開始。が、spamしか持っていないので、効果が分からない。 euc-kr, ks_c_5601</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>-1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>987を、ko databaseに入れる big5を、tw databaseに入れる gb231</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>2を、cn databaseに入れる export/importのコードはutf-8 ko, tw, cnのデータベースのコードはutf-8 jaのデータベースのコードはeuc- ...

_  (スコア:6275)

2004-02-06(Fri) [類似検索]

_[spam] POPFile日本語化

日本語化関連のToDoが投稿されている。 ISO-2022-JP 以外の文字コードへの対応(パッチとしてすでに公開していますが本家にマージする作業が残っています) base64、Quoted Printable への対応 途中で改行されてしまった日本語の単語への対応 Subject の分かち書き insert.pl の日本語化(</strong>本家にマージする作業が ...

_  (スコア:6275)

2003-03-15(Sat) [類似検索]

_bsfilter</strong> revision 1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>.9

category + "*" + tokenという文字列がハッシュのキーで目覚めが悪かったので、hash[category][token]のように修正 unix from, from, to, cc, subject, received, reply-to, return-path, content-transfer-encoding, content-type以外のヘッダを捨てるように変更 相変わらずMIMEの解釈はしないが、base64、quo ...

_  (スコア:6275)

2003-04-29(Tue) [類似検索]

_bsfilter</strong> revision 1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>.1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>5

-aが実用的でないので改造。 -aの場合、exitしてspamか否かをstatus codeで返す直前に、子プロセスをfork。親がexitしたあとに、子がデータベースの更新を行なう。子の処理時間は一見、見えない。 --synchronous-auto-updateは、</strong>旧-aに相当。forkせずに、データベースの更新をしてからexit。 tokenizerも少し変 ...

_  (スコア:6275)

2006-12-29(Fri) [類似検索]

_[Ruby] ASR-1</strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong></strong>.8.5.6 + bsfilter</strong>

アーカイブ中の bsfilter</strong>.exy(</strong>Visualu Ruby使用)</strong>でexe化できた。 普段、FreeBSDでやっているけれど、こちらの方が楽かも。 ...

_  (スコア:6181)

2003-09-01(Mon) [類似検索]

_[bsfilter</strong>] 起動方法

shで始まってunameを実行してrubyruby_rか切り分ける起動方法が不評。例Gold fever。切り替える規準もいい加減だし、自分としても気持ちのいいコードではない。誰か、いい書き方、教えてくれないかしらん。 /usr</strong>/local/bin/ruby -x path_of_bsfilter</strong> .... で、PATHを追加することなく、cronから起動できると思 ...

_  (スコア:6181)

前へ ... 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ