2003-11-11(Tue) [長年日記]

_1 [bsfilter] unicode対応

C社からutf-8 + base64なメイルが来るので対応検討中。

  • 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか?
  • iconvの引数のcode setは、OS非依存か?
  • eucJPに変換できないutf-8が来たら、どうするか?
  • utf-8 + quoted-printableもありそう
  • subjectが、utf-8 mime b or q encodingなのにも対応が必要
  • charsetでutf-8と名乗りつつ、実はiso-2022-jp / eucJP / shift-jisのケースはないのか?
  • 内部コードはeucJPという設計は、正しかったのか???

_2 [bsfilter] bsfilter は重〜い

分かってはいるのですが...

_3 [時事] 三菱自工:最終赤字110億円を予測

R34亡き後、四角い車を作るのは三菱だけ、ということで、デボネア復活だ。

本日のツッコミ(全1件) [ツッコミを入れる]
_ やまぐち@愛知 (2004-01-20(Tue) 19:42)

個人的には,C, ja 以外にも対応させる(海外からのspamを考慮する)ならば,やはり内部コードは utf-8 にしてしまった方が幸せかと思います.
コード変換ってマッピングが一意に定まらないので,日本語だけでも(判りやすい例だと) eucJP -> SJIS, euc-JP -> utf-8 -> SJIS の変換結果が異なって当たり前とかいう問題がありませんか?

[]