読者です 読者をやめる 読者になる 読者になる

1.8.7でUTF-8文字列をUNICODEのコードポイント文字列へ変換する

Ruby

最初のやりかたがあまりにもひどいので、String#to_unicodeを作ってみた。

class String
  def to_unicode
    self.split(//u).map{|s|s.size>1 ? "\\u%04x"%s.unpack("U*")[0] : s}.join
  end
end
> "aaあ".to_unicode
=> "aa\\u3042"

うむ。よさそうだ。