読書と技術となんか色々のログ

2009/09/09(水)20:39

文字コードのメモ

[etc] 資料(12)

一般的な文字コード EUC-JP Shift-JIS ISO-2022-JP UTF-8(Unicode) UTF-16(Unicode) 符号化文字集合(CCS Coded Character set) エンコーディング(CES Character Encoding Scheme) 符号化文字集合 JIS X 0201 + 0208 + 0212(JIS漢字コード(情報交換用符号化漢字集合)) →EUC-JP、Shift-JIS、ISO-2022-JP UCS2(Universal Character Set coded in 2 octets)(ISO-10646) →UTF-8、UTF-16 エンコーディング ワイドキャラクタ → すべての文字に対して同じバイト数を使う マルチバイトキャラクタ → 文字の種類によって使うバイト数を変える シフトJISに関する各種情報 IANA登録名Shift_JISWindows-31J規格名JIS X 0208Microsoft CP932JAVAのコンバータ名SJISMS932SDK 1.4.0以前のエイリアス名-Shift_JISSDK 1.4.1以降のエイリアス名Shift_JIS- 変換元の文字コードShift_JIS EUC_JP ISO-2022-JPWindows-31JWAVE DASHU+301CU+FF5EDOUBLE VERTICAL LINEU+2016U+2225MINUS SIGNU+2212U+FF0DCENT SIGNU+00A2U+FFE0POUND SIGNU+00A3U+FFE1NOT SIGNU+00ACU+FFE2 Microsoftコードページ932 コード ページのアーキテクチャ

続きを読む

このブログでよく読まれている記事

もっと見る

総合記事ランキング

もっと見る