[SIMILAR] WITH 23966 training WITH 22494 mozdat WITH 14628 export WITH 7748 造" WITH 7620 1token WITH 7380 tokens WITH 6812 synopsis WITH 6789 dump WITH 6279 clean WITH 6066 bsfilter WITH 5991 tokenizer WITH 4362 大筋 WITH 3694 dat WITH 3218 description WITH 2422 control WITH 2296 format WITH 2184 options WITH 1327 プす WITH 1217 mozilla WITH 1185 漢字 WITH 1106 ダン WITH 1060 構造 WITH 1035 出力 WITH 994 カナ WITH 977 形式 WITH 945 spam WITH 942 タカ WITH 837 デフ WITH 764 カタ WITH 723 ンポ WITH 719 仕様 WITH 719 連続 の検索結果 219 件中 1 - 10 件目 (0.120048472 秒)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
MatrixをMatrix的に作ったことに対して、小林がこのような感想を持つことは当然だと思うのだが、なぜかカリカリ絡んでいる"皆様の評価"が多い。 一作目は非常に好き。SF的にはよくあるテーマで、ghost in the shell実写版を作っただけともいえるのだが、training programの中での格闘技、エレベーターホールでの ...
_ (スコア:5737)
exportするフォーマットを変更して、importを大幅高速化。mbox-likeな形式でexportして、importはadd-clean/spamのパスを通すのは、良案だと思ったのだが遅すぎるので廃止。無駄にCPUを使うと、でんこちゃんに怒られそうだし。 ...
_ (スコア:3687)
普通にインストール出来る。 perl-5.8, p5-Text-Kakasiをportsからmake install マルチプラットホーム版POPFileをget、展開 日本語化パッチ(popfile_jpn_src.zip)をget、展開 日本語化パッチのClassifier, UI, languages, manual, stopwordsで、マルチプラットホーム版を上書き perl5.8.0 -I /usr/local/lib/pe ...
_ (スコア:3448)
% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamとcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...
_ (スコア:3202)
Invalid Text BBSでの議論にもとづき、-c、-sでfindするのを止めた。 今後は、-c ~/Mail/inboxでは駄目で、-c ~/Mail/inbox/*とする必要がある。 ~/.bsfilter/bsfilter.confを読むようにした。--config-fileで指定することも出来る。--homedirと、--config-fileで、ハイフンの有無が違うのが、気持ち悪い。--co ...
_ (スコア:3202)
長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...
_ (スコア:2816)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
_ (スコア:2179)
--pop-max-size number numberより大きなメイルは、判定、学習の対象にしない。単にバイパスする オプション名を微妙に変更 単位をバイトに戻した バイパスする際は、pop daemonからMUAへパイプラインで渡す。今までは、メイル全体をbsfilterが受け取った後、MUAに渡していた デフォルト値は30000(byte)。0はサ ...
_ (スコア:2041)
revision 1.34.4系で実験中。コマンドラインなり、bsfilter.confなりで以下のような指定をする。imap-authはcram-md5でもいいはず。 imap-server localhost imap-port 143 imap-auth login imap-user nabeken imap-password 秘密 imap-folder-clean inbox.maybe_clean imap-folder-spam inbox.maybe_spam 使い方 ...
_ (スコア:2029)
_ (スコア:10000)