Hatena Blog Tags

Shift_JIS

(コンピュータ)
しふとじす

Internet Assigned Numbers AuthorityIANA)に登録されている日本語の文字集合を符号化する文字符号化方式で、マルチバイト文字と1バイト文字を切り替えることなく扱えるようにした形式。
JIS X 0201の英数字記号、カタカナ、JIS X 0208を再配置し、JIS X 0208の漢字、記号などが使え、JIS X 0208の附属書1で規定されている。
Shift-JISとかかれることがあるが、これは間違い。また、以前はx-sjisという表記も行われていたが、IANAに登録された現在では使うことは避けるべきである。
類似のものにWindows-31JCP932があるが、これらはShift_JISよりも扱える文字集合が多い文字符号化方式である。「(株)」などのいわゆる機種依存文字を使うためには「Windows-31J」などを指定する。

この文字コードは0x5c(バックスラッシュ、「\」「¥」)を含む文字があるため、問題を起こしやすい、これによる問題の例としては、Shift_JISでCGIを組んだとき、0x5c(俗に言う駄目文字)

―ソЫ?噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭?薌
を含んだ文字が文字化けするなどといった現象が生じる。
また特定のバイトを取り出しても、それが厳密に1バイト目か2バイト目かを判断できないため、日本語を扱うソフトウェアを作る際の厄介な問題となっている。
本来は制御文字コードが配置されるはずの場所にも文字が割り当てられているなどの点で、文字コードにこだわりを持つ者から敬遠されている。

このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ネットで話題

もっと見る

関連ブログ