[SIMILAR] WITH 13814 現回 WITH 7748 bayespam WITH 7080 token WITH 6261 directory WITH 5991 tokenizer WITH 5492 数フ WITH 3722 hash WITH 2830 回数 WITH 2574 出現 WITH 2458 dir WITH 2214 file WITH 2046 致命 WITH 1973 命的 WITH 1765 ル中 WITH 1510 open WITH 1334 合計 WITH 771 を求 WITH 738 複数 WITH 718 疑問 WITH 655 相変 WITH 648 ァイ WITH 594 求め WITH 472 イル WITH 440 の出 WITH 387 ファ WITH 294 最後 WITH 197 コー WITH 147 ード WITH 1 [ WITH 1 spam WITH 1 ] WITH 1 bsproc の検索結果 93 件中 21 - 30 件目 (0.084711579 秒)
最近はデフォルトが"--method rf"なので、tokenizerが拾ってきたtokenを全部使って判定してます。 "--method g"については、15token固定なので、これを可変にという提案がありました。どうしよう... ...
--pop-max-size number numberより大きなメイルは、判定、学習の対象にしない。単にバイパスする オプション名を微妙に変更 単位をバイトに戻した バイパスする際は、pop daemonからMUAへパイプラインで渡す。今までは、メイル全体をbsfilterが受け取った後、MUAに渡していた デフォルト値は30000(byte)。0はサ ...
_ (スコア:2779)
プログラム中に日本語を書くことはないけど、CVSで日本語文書を管理することはある。 '='でdiffを取ったら表示が化けたので、ちょびっとパッチした。ささやかな幸せ。 *** pcvs.el.org Sun Sep 23 05:23:16 2001 --- pcvs.el Fri Jun 28 11:20:13 2002 *************** *** 537,542 **** --- 537,543 ---- ;; t ...
_ (スコア:2749)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:2745)
逃避がてら,sh scriptを見てみました. mvしてからbsfilterしてるのは,ファイルのタイムスタンプをtouchで合わせるためですよね. 個人的にはprocessの起動を減らすため,mvで潰すように修正しようと思います. umaskかけておけば,chmodも要りません. ex. umask 077 bsfilter -a --pipe --... < $target > $target. ...
_ (スコア:2556)
spamcからspamdに聞くのか。やっぱ、そう作るよなぁ。tokenごとのspam確率をdrubyで貰ってみる? ...
_ (スコア:2323)
hashメンバを足そうとしてはまる。Object#hashがあるのでmethod_missingが呼ばれないのかな。 ...
_ (スコア:1726)
管理者として認証にパスしたら、という条件は後で考えるとして、飲み会管理画面からユーザを誘えるようにしよう。 とりあえず、editのときだけ誘えればいいや。 models/event.rbで、membershipと招待フラグ、参加フラグをhashで返せるようにしておく。 class Event < ActiveRecord::Base def memberships mhash ...
_ (スコア:1726)
--add-clean/spamで行われるのはtoken databaseの学習で、確率databaseへの反映には--updateが必要、という設計は失敗だったのかもしれない。 ...
_ (スコア:1643)
_ (スコア:2779)