[SIMILAR] WITH 7748 robinsoh WITH 6955 加デ WITH 6676 更デ WITH 6506 probability WITH 6162 ス形 WITH 4008 insert WITH 2930 定方 WITH 2390 revision WITH 1675 デフ WITH 1556 式を WITH 1516 bsfilter WITH 1445 方式 WITH 1263 タベ WITH 1114 ォル WITH 1066 判定 WITH 977 形式 WITH 743 変更 WITH 721 ルト WITH 552 フォ WITH 455 追加 WITH 428 に変 WITH 413 ベー WITH 332 デー WITH 222 ータ WITH 214 トの WITH 140 ース WITH 1 [ WITH 1 ] WITH 1 1 WITH 1 . WITH 1 32 WITH 1 4 の検索結果 221 件中 41 - 50 件目 (0.065495023 秒)
iconv.dllに関するドキュメントを更新して、release-1.0.10として出す方向。 クラス定数を変数代りに使っていて、複数同時にインスタンシエーションするとヤバいのを修正。 ...
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...
_ (スコア:1690)
Invalid Text に従い、ruby-1.8でも動くように修正したつもり htmlのコメントは捨てるようになっていたが、 コメントの開始と終了が別の行だと捨てない plain textのパートでも、<! >を捨てる というように、いまいち。 MIMEに対応すればいいのだが ネストしてると面倒な気がする robustに作っておく必要があり ...
_ (スコア:1690)
MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...
_ (スコア:1690)
category + "*" + tokenという文字列がハッシュのキーで目覚めが悪かったので、hash[category][token]のように修正 unix from, from, to, cc, subject, received, reply-to, return-path, content-transfer-encoding, content-type以外のヘッダを捨てるように変更 相変わらずMIMEの解釈はしないが、base64、quo ...
_ (スコア:1690)
しつこく更新。 本文中の"From"を"unix from"だと誤解するケースがあるので、--mboxが指定されない限り、"unix from"を探さないように変更。 日本語のtokenizeに入る前に、">>"等の引用マークを削除するように変更。単語の途中で改行され、引用マークが入っても、単語として切り出すように努力する。 ...
_ (スコア:1669)
LIST nのときでも、".CRLF"を待っていたのをデバッグして、revision 1.35.4.11。 UIDL nのときでも、".CRLF"を待っていたのをデバッグして、revision 1.35.4.12。なんで一発で直せないかなぁ。 ...
_ (スコア:1634)
--ignore-plain-text-part htmlのパートがある時、plain textのパートを無視するオプションを追加 mew.tgz BBSでの指摘に従い、bsfilter.el更新 ...
_ (スコア:1615)
Gary Robinson方式導入。サンプルが少ない場合はPaul Graham方式の方が正答率が高くなりそうな気がしないでもない。 Paul Graham方式ではspam確率が0と1近辺に寄るが、Gary Robinson方式では結構ちらばる。ので、--spam_cutoffで遊べる。 Gary Robinson-Fisherは断念。 ...
_ (スコア:1603)
void GraphicWizardsLair( void ); //を見たりすると、デフォルトの値は大切だと思う。 spam-cutoffとして、何かの文献で見た0.95というを使っているのだが、高すぎるように思う。自分では0.6で使っているし、ただのにっきフルスロットルでも同じ傾向らしい。0.8くらいに下げようかしらん? ...
_ (スコア:1599)
_ (スコア:1690)