ケータイ絵文字

ケータイ絵文字をデータベースに格納するにはどうればいいんだろうか。

問題となるのがソフトバンク。ShiftJIS でも、Unicode でもドコモやAUとコードが重なっている。

http://memokami.com/up/presen/DeNA-tips.pdf
DeNA社の資料を見ると、DeNA社では、Webコードに変換して格納しているみたい。

ただこれだと、 > などのタグ文字が入ってくるので、 htmlspecialchars とかとの相性が悪いような気がするんだけど、どうなんでしょうか?

絵文字変換(htmlspecialchars($str)); ←>が破壊される
htmlspecialchars(絵文字変換($str)); ←PC用の絵文字をimgタグで出すと imgタグが無力化される

仕方ないので、 ソフトバンクの絵文字を {emoji:#s番号#} なんて規則に変換してお茶を濁しといた。
htmlspecialchars された Webコードを解析できるようにしてもよかったような気もする。
それとも、Unicodeの重ならない別領域に再マップしなおすとかやるのかな?
まぁ、動いたからいいかwww

それと、長すぎる書き込みを省略したときにmb_strimwidth 何か使うと、どっちにしろぶっ壊れるよね。
自力でポチポチやるしかないのかな?