[SIMILAR] WITH 11368 字目 WITH 7748 力文 WITH 7748 語判 WITH 7748 整us WITH 6859 、nk WITH 6633 tokenize WITH 5991 字一 WITH 5894 き別 WITH 4434 procmail WITH 4279 ト単 WITH 4150 nkf WITH 3613 改行 WITH 2437 字コ WITH 2390 revision WITH 2168 ト内 WITH 2127 単語 WITH 2054 一文 WITH 1928 本語 WITH 1771 文字 WITH 1516 bsfilter WITH 1293 更。 WITH 1272 単位 WITH 1267 コメ WITH 1226 推測 WITH 1185 漢字 WITH 1176 デバ WITH 1066 判定 WITH 965 語が WITH 896 言語 WITH 890 シピ WITH 858 で生 WITH 829 別れ の検索結果 215 件中 101 - 110 件目 (0.250768933 秒)
本論とは関係ないところだが、viagraのミススペルが例として使われている。bsfilter -u -dで確認したが、viagraaと1文字追加したのでは満足しなかったのか、viagraalというのも記録されていた。 ...
LED ZEPPELIN DVD 想像以上に高画質。日本語字幕のフォントの品質からいって、輸入版にも日本語字幕が入っている予感。そっちでも良かったか。 LED ZEPPELIN "HOW THE WEST WAS WON" ライブ3枚組み。 steely dan "everything must go" 最新アルバム。期待通りの音。どの曲も一緒に聞こえるとも言う。 Earth, Wi ...
_ (スコア:795)
プログラム中に日本語を書くことはないけど、CVSで日本語文書を管理することはある。 '='でdiffを取ったら表示が化けたので、ちょびっとパッチした。ささやかな幸せ。 *** pcvs.el.org Sun Sep 23 05:23:16 2001 --- pcvs.el Fri Jun 28 11:20:13 2002 *************** *** 537,542 **** --- 537,543 ---- ;; t ...
_ (スコア:795)
週に1回、2900円の日に買ってみた。ゲーム機以外でFPSをするのはDOOM II以来。1994年から2007年の13年の差は大きい。 ハードはMac mini(Early 2009) Core2Duo 2GHz, NVIDIA GeForce 9400M + 1600x1200 Display Optimal Setting Settingsだと1024x768でanti-aliasingがoffになる等、控えめなセッティング frame ...
_ (スコア:795)
やったこと Mew 4.2.53対応 IMAPについてのデバッグ 今後の予定 mecab-0.90 対応 ...
_ (スコア:791)
KAKASI+NetBSDで障害報告。怪しいのは以下の近辺。 拡張ライブラリの問題で、私には障害再現/デバッグ出来ない予感。とりあえず、MeCabでなくKAKASIで生活してみよう。 Kakasi::kakasi("-oeuc -w", str).scan(/\S+/).each do |token| token.gsub!(Reg_not_kanji_katakana, '') ...
_ (スコア:791)
SPAM判定する際にSEENフラグがセットされてしまうというのは、やっぱり問題だった。 ...
_ (スコア:764)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:764)
いい加減に速度の測定。cleanな日本語メイルについて、bsfilterは"nkf -e | mecab -O wakati | bogofilter"と比べて2倍くらい遅い。英語spamについてはmecabが不要だから、"bogofilter"と比べて8倍くらい遅い。 ...
_ (スコア:742)
HTMLのコメントは対応してあるつもりなんだけど。 ...
_ (スコア:742)
_ (スコア:804)