Hatena Blog Tags

シフトJIS

(コンピュータ)
しふとじす

JIS X 0208を再配置したもので、マルチバイト文字とJIS X 0201(英数字記号・1バイト文字)を切り替えることなく共存できるように工夫した文字コードJIS X 0208の附属書1で規定されている。
MS-DOSWindowsMacintosh、一部のUNIXなどで使われている。

この文字コードは0x5c(バックスラッシュ、「\」)を含む文字があるため、問題を起こしやすい、これによる問題の例としては、Shift_JISでCGIを組んだとき、0x5c(俗に言う駄目文字)を含んだ文字が文字化けするなどといった現象が生じる。
また特定のバイトを取り出しても、それが厳密に1バイト目か2バイト目かを判断できないため、日本語を扱うソフトウェアを作る際の厄介な問題となっている。
本来は制御文字コードが配置されるはずの場所にも文字が割り当てられているなどの点で、文字コードにこだわりを持つ者から敬遠されている。

このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ネットで話題

もっと見る

関連ブログ