[SIMILAR] WITH 7748 チ候 WITH 6955 許? WITH 4254 単語 WITH 3556 索語 WITH 3187 味? WITH 2901 の単 WITH 2674 チエ WITH 1450 検索 WITH 1388 履歴 WITH 1364 特許 WITH 1183 無意 WITH 1029 候補 WITH 982 ーチ WITH 780 語で WITH 766 で検 WITH 691 索し WITH 592 同時 WITH 496 指定 WITH 489 ジン WITH 477 サー WITH 453 使用 WITH 376 た人 WITH 309 エン WITH 289 ンジ WITH 283 意味 WITH 277 人は WITH 1 [ WITH 1 net WITH 1 ] WITH 1 ンは WITH 1 は、 WITH 1 、ど の検索結果 72 件中 1 - 10 件目 (0.090526791 秒)
サーチエンジンは、どんな検索語が使用されたか履歴を取っているはず。 この単語で検索した人は、あの単語でも検索しています この単語で検索した人は、あの単語も同時に指定しています とか出せないのだろうか? 出しても無意味? 誰かの特許? ...
しつこく更新。 本文中の"From"を"unix from"だと誤解するケースがあるので、--mboxが指定されない限り、"unix from"を探さないように変更。 日本語のtokenizeに入る前に、">>"等の引用マークを削除するように変更。単語の途中で改行され、引用マークが入っても、単語として切り出すように努力する。 ...
_ (スコア:3193)
だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...
_ (スコア:3192)
無関係な単語を大量に含むspamが増えてきた。人間の目には入らないように、という工夫も無い。それは、spam filter対策として反則だろう。もともとspamは反則なのだが。 ...
_ (スコア:3192)
簡単に言えば、単語に点数つけるってこと? スパムへの対策 ---A Plan for Spam bsprocをインストール SPAM保存してないからなぁ。 ...
_ (スコア:3192)
目次だけ読んでおけばいいような気もした。インターフェイス、ウェブ、アプリという単語は釣りっぽい。 ...
_ (スコア:3192)
_ (スコア:10000)