Hatena Blog Tags

サロゲートペア

(コンピュータ)
さろげーとぺあ

Unicodeをコンピュータのファイルやメモリ上で表現する方式として代表的なものにUTF-16というものがある。この方式では、16ビット=65536個の文字を表現することができる。

しかしUnicodeではさらに多くの文字が収録されているので、65536文字に収まりきらず、16ビットでは全ての文字を表すことができない。そこで、一部の領域をサロゲート専用とし、このサロゲート2つで1の文字を表すこともできるようにした。これをサロゲートペアと呼ぶ。

この存在によってUTF-16は固定長の文字コード(文字符号化方式)ではなくなってしまった。

このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ネットで話題

もっと見る

関連ブログ