[SIMILAR] WITH 7748 tokendb WITH 7748 toekndb WITH 5518 marshal WITH 5427 database WITH 3394 dump WITH 3033 bsfilter WITH 2390 revision WITH 2239 load WITH 1145 時点 WITH 1067 定義 WITH 945 spam WITH 872 素直 WITH 507 プル WITH 344 ンプ WITH 325 た時 WITH 323 サン WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 . WITH 1 18 WITH 1 token WITH 1 のサ WITH 1 ルを WITH 1 を作 WITH 1 作っ WITH 1 った WITH 1 た。 WITH 1 。疲 WITH 1 疲れ WITH 1 れた WITH 1 。-- の検索結果 235 件中 1 - 10 件目 (0.095929637 秒)
spam token databaseのサンプルを作った。疲れた。 --add-spam等でdatabaseを読み込めるようにした。素直に、TokenDBをMarshal::dump/loadすべきだったか? ToeknDB classの定義が、dumpした時点とloadした時点で異ると嫌なことがおきそうな気がして、それを避けたのだが。 ...
SDBMサポート。デフォルトのmarshalに比べて、-s、-c、spam判定は格段に速い。-uはちょっと遅い。 データベースの肥大を抑える仕組みがそのうち必要になる? ...
_ (スコア:4581)
--max-mail, --min-mail追加。databaseのサイズが制御できるはず。 ...
_ (スコア:4343)
r162_asianization branchで実験開始。が、spamしか持っていないので、効果が分からない。 euc-kr, ks_c_5601-1987を、ko databaseに入れる big5を、tw databaseに入れる gb2312を、cn databaseに入れる export/importのコードはutf-8 ko, tw, cnのデータベースのコードはutf-8 jaのデータベースのコードはeuc- ...
_ (スコア:4300)
現在は以下のようなサポート状況。 rubyについてくるsdbm やっぱりGNUなgdbm FreeBSDだと、ふつーportupgradeでbdb1 marshalだった時代もあった bdb revision 1のみだと寂しいかなぁ。revision 2が使えると嬉しい環境があるのかな? 本当は、valueとしてhashを持てるデータベースを使いたい。 ...
_ (スコア:4239)
--add-clean/spamで行われるのはtoken databaseの学習で、確率databaseへの反映には--updateが必要、という設計は失敗だったのかもしれない。 ...
_ (スコア:4110)
飲み会管理システム = MeetingManager = mm を作ってみよう。 % rails mm 作られたconfig/database.ymlのままで問題はないので、データベース作成 % mysql -u root mysql> create database mm_development; mysql> create database mm_test; mysql> create database mm_production; mysql> quit モデルを作成 % ...
_ (スコア:3691)
Invalid Text BBSでの議論にもとづき、-c、-sでfindするのを止めた。 今後は、-c ~/Mail/inboxでは駄目で、-c ~/Mail/inbox/*とする必要がある。 ~/.bsfilter/bsfilter.confを読むようにした。--config-fileで指定することも出来る。--homedirと、--config-fileで、ハイフンの有無が違うのが、気持ち悪い。--co ...
_ (スコア:3457)
えむもじらの"training.datの構造"を参考に、training.datをダンプするdump_mozdatを作った。tokenizerの仕様は、大筋、 連続したひらがな、カタカナは1token 漢字は1文字で1token となっている模様。 NAME dump_mozdat SYNOPSIS dump_mozdat [--export-clean|--export-spam] training.dat DESCRIPTION dump tr ...
_ (スコア:3146)
_ (スコア:10000)