[SIMILAR] WITH 2985 nabeken WITH 1665 愛用 WITH 1176 デバ WITH 545 ッグ WITH 333 バッ WITH 134 ミ!! WITH 122 ツッ WITH 117 ッコ WITH 115 コミ WITH 1 !! WITH 1 ( WITH 1 ) WITH 1 グあ WITH 1 あり WITH 1 りが WITH 1 がと WITH 1 とう WITH 1 うご WITH 1 ござ WITH 1 ざい WITH 1 いま WITH 1 ます WITH 1 す。 WITH 1 。ra WITH 1 racc WITH 1 - WITH 1 mode WITH 1 用し WITH 1 して WITH 1 てお WITH 1 おり WITH 1 りま の検索結果 274 件中 241 - 250 件目 (0.440082939 秒)
漢字にマッチしなくなってたのをデバッグ メイルのヘッダ中のtokenは、ヘッダごとにカウント Receivedのタイムスタンプは、いい加減に捨てる。Message-Id、Date等も捨てる それっぽいのは、base64 decodeする でも、MIMEの解釈はしない 20文字以上のtokenは捨てる tokenizerがぐちゃぐちゃになったので、要修正 ...
そろそろリリースしよう。release 1.0.0に対する変更は以下のはず。 --mark-in-token # で落ちるバグ修正 --export-probability 追加(デバッグ用) --insert-revision 追加 --header-prefix 追加 --imap-auth loginc 追加。LOGIN命令でIMAP serverに接続 --imap-auth auto 追加。適当にIMAP serverに接続。デフォ ...
_ (スコア:3523)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:3196)
だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。 日本語の単語の1文字目と2文字目が、改行で生き別れ 日本語がbase64されていてると、 漢字一文字が生き別れ JISの場合、nkfがかからなかったかも 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも ...
_ (スコア:3196)
薬事法違反(脱法ドラッグの販売など)容疑 合法ドラッグの販売がどう薬事法に引っかかるのか分からない。 ...
_ (スコア:1481)
笑いと泣きのネタは様式を守っているわけで、オチがばれていると指摘するのは的外れ。 ...
_ (スコア:1481)
バッドノウハウ関係のページを見ていたら、マウスが使えなくなったのは、バッドノウハウ。抜き差ししても、rebootしても復活しなかったのはスーパーバッド。エアコンのリモコンの電池を入れて復活したのはグッドノウハウ。買い置きしておいたのはスーパーグッド。どこにしまったか忘れたのはテリブルバッド。 e ...
_ (スコア:905)
_ (スコア:3637)