2009/09/09(水)20:39
文字コードのメモ
一般的な文字コード
EUC-JP
Shift-JIS
ISO-2022-JP
UTF-8(Unicode)
UTF-16(Unicode)
符号化文字集合(CCS Coded Character set)
エンコーディング(CES Character Encoding Scheme)
符号化文字集合
JIS X 0201 + 0208 + 0212(JIS漢字コード(情報交換用符号化漢字集合))
→EUC-JP、Shift-JIS、ISO-2022-JP
UCS2(Universal Character Set coded in 2 octets)(ISO-10646)
→UTF-8、UTF-16
エンコーディング
ワイドキャラクタ → すべての文字に対して同じバイト数を使う
マルチバイトキャラクタ → 文字の種類によって使うバイト数を変える
シフトJISに関する各種情報
IANA登録名Shift_JISWindows-31J規格名JIS X 0208Microsoft CP932JAVAのコンバータ名SJISMS932SDK 1.4.0以前のエイリアス名-Shift_JISSDK 1.4.1以降のエイリアス名Shift_JIS-
変換元の文字コードShift_JIS
EUC_JP
ISO-2022-JPWindows-31JWAVE DASHU+301CU+FF5EDOUBLE VERTICAL LINEU+2016U+2225MINUS SIGNU+2212U+FF0DCENT SIGNU+00A2U+FFE0POUND SIGNU+00A3U+FFE1NOT SIGNU+00ACU+FFE2
Microsoftコードページ932
コード ページのアーキテクチャ