トップ 最新

迷彩記憶 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 23966 training WITH 22494 mozdat WITH 14628 export WITH 7748 造" WITH 7620 1token WITH 7380 tokens WITH 6812 synopsis WITH 6789 dump WITH 6279 clean WITH 6066 bsfilter WITH 5991 tokenizer WITH 4362 大筋 WITH 3694 dat WITH 3218 description WITH 2422 control WITH 2296 format WITH 2184 options WITH 1327 プす WITH 1217 mozilla WITH 1185 漢字 WITH 1106 ダン WITH 1060 構造 WITH 1035 出力 WITH 994 カナ WITH 977 形式 WITH 945 spam WITH 942 タカ WITH 837 デフ WITH 764 カタ WITH 723 ンポ WITH 719 仕様 WITH 719 連続 の検索結果 250 件中 1 - 10 件目 (0.11536674 秒)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ

2003-12-20(Sat) [類似検索]

_[bsfilter] dump_mozdat

えむもじらの"training.datの構造"を参考に、training.datダンプすdump_mozdatを作った。tokenizer仕様は、大筋連続したひらがな、カタカナ1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...

_  (スコア:10000)

2003-05-19(Mon) [類似検索]

_[時事] 人間の俳優を単なる“素材”にしてしまった話題の映画「The Matrix Reloaded」

MatrixをMatrix的に作ったことに対して、小林がこのような感想を持つことは当然だと思うのだが、なぜかカリカリ絡んでいる"皆様の評価"が多い。 一作目は非常に好き。SF的にはよくあるテーマで、ghost in the shell実写版を作っただけともいえるのだが、training programの中での格闘技、エレベーターホールでの ...

_  (スコア:5737)

2004-04-11(Sun) [類似検索]

_[bsfilter] --export-spam

otsuneさんのところでも、 --export-spamの結果が公開。 "東京都新宿区"のような長い語が切り出されて来るのが、kakasiの特徴。 ...

_  (スコア:3693)

2003-08-09(Sat) [類似検索]

_[bsfilter] revision 1.33.4.3

exportするフォーマットを変更して、importを大幅高速化。mbox-likeな形式exportして、importはadd-clean/spamのパスを通すのは、良案だと思ったのだが遅すぎるので廃止。無駄にCPUを使うと、でんこちゃんに怒られそうだし。 ...

_  (スコア:3687)

2003-09-13(Sat) [類似検索]

_[FreeBSD][spam] POPFile + 日本語化パッチ インストール

普通にインストール出来る。 perl-5.8, p5-Text-Kakasiをportsからmake install マルチプラットホーム版POPFileをget、展開 日本語化パッチ(popfile_jpn_src.zip)をget、展開 日本語化パッチのClassifier, UI, languages, manual, stopwordsで、マルチプラットホーム版を上書き perl5.8.0 -I /usr/local/lib/pe ...

_  (スコア:3448)

2005-06-18(Sat) [類似検索]

_[bsfilter] tokenの使用状況

% bsfilter --show-db-status db C 18545 3683 126378 9828 137071 db ja 60810 8881 47113 1075 96385 (18545 + 9828) / 137071 = 1.06 (60810 + 47113) / 96385 = 1.12 spamcleanの語彙が根本的に異なっているように見える。重なっているのは6%/12%のみ % bsfilter --export-spam s.txt % bsfilter --expor ...

_  (スコア:3202)

2003-05-24(Sat) [類似検索]

_[bsfilter] bsfilter revison 1.29

Invalid Text BBSでの議論にもとづき、-c、-sでfindするのを止めた。 今後は、-c ~/Mail/inboxでは駄目で、-c ~/Mail/inbox/*とする必要がある。 ~/.bsfilter/bsfilter.confを読むようにした。--config-fileで指定することも出来る。--homedirと、--config-fileで、ハイフンの有無が違うのが、気持ち悪い。--co ...

_  (スコア:3202)

2003-10-10(Fri) [類似検索]

_[bsfilter] revision 1.35.4.13からgdbmサポート

長官も何度か止まると言っているので、gdbmをサポートしてみる。 以下で移行可能。 bsfilter --db sdbm --export-clean | bsfilter --db gdbm --import-clean bsfilter --db sdbm --export-spam | bsfilter --db gdbm --import-spam bsfilter --db gdbm -u データベースを縮小するとき(デフォルトでは10000通を ...

_  (スコア:2816)

2004-02-07(Sat) [類似検索]

_[bsfilter] revision 1.38.4.9

デバッグ --update --sub-spamの際、確率データベースに誤った値が入る場合があったのを修正。--update --add-spam --sub-spamであれば、問題なし。 -B|--ignore-body URL、メイルアドレスを除いて、メイル本文を無視する。 --show-process 動作の様子を表示する。左のカラムから、プロトコル、言語、判定結果、 ...

_  (スコア:2371)

2003-05-04(Sun) [類似検索]

_[bsfilter] bsfilter revision 1.18

spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...

_  (スコア:2179)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ