_ TV端子交換
ケーブルモデム対応のため、全戸交換。2年遅いし、J-COMはDIONより2000yen/month高い。ビジネスになるのか?
だいたいパート単位でStringにしてから、nkf、tokenizeするように変更。以下のケースが救えるはず。
- 日本語の単語の1文字目と2文字目が、改行で生き別れ
- 日本語がbase64されていてると、
- 漢字一文字が生き別れ
- JISの場合、nkfがかからなかったかも
- 日本語が短すぎて、nkfが入力文字コードの推測に失敗してたかも
- htmlのコメント内に改行があると、
- コメントが捨てれなかった
- 単語がコメントで生き別れ
その他の変更。
- big5、euc-krを日本語と認識するケースがあったようなので、言語判定をちょっと調整
- usage中のprocmailレシピをデバッグ