ケータイ絵文字
ケータイ絵文字をデータベースに格納するにはどうればいいんだろうか。
問題となるのがソフトバンク。ShiftJIS でも、Unicode でもドコモやAUとコードが重なっている。
http://memokami.com/up/presen/DeNA-tips.pdf
DeNA社の資料を見ると、DeNA社では、Webコードに変換して格納しているみたい。
ただこれだと、 > などのタグ文字が入ってくるので、 htmlspecialchars とかとの相性が悪いような気がするんだけど、どうなんでしょうか?
絵文字変換(htmlspecialchars($str)); ←>が破壊される htmlspecialchars(絵文字変換($str)); ←PC用の絵文字をimgタグで出すと imgタグが無力化される
仕方ないので、 ソフトバンクの絵文字を {emoji:#s番号#} なんて規則に変換してお茶を濁しといた。
htmlspecialchars された Webコードを解析できるようにしてもよかったような気もする。
それとも、Unicodeの重ならない別領域に再マップしなおすとかやるのかな?
まぁ、動いたからいいかwww
それと、長すぎる書き込みを省略したときにmb_strimwidth 何か使うと、どっちにしろぶっ壊れるよね。
自力でポチポチやるしかないのかな?