1135386 ランダム
 ホーム | 日記 | プロフィール 【フォローする】 【ログイン】

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

カテゴリ

カテゴリ未分類

(51)

ロックマン

(83)

 ゲームギア MEGAMAN

(4)

 ロックマンXover

(48)

 激突カードファイターズ

(13)

FLASHゲーム!

(10)

ホームページ

(32)

スパークスター・ロケットナイト

(5)

魔導物語・ぷよぷよ

(25)

モンスターメーカー

(3)

甲竜伝説ヴィルガスト

(5)

コープスパーティー

(23)

パズル&ドラゴンズ(パズドラ)

(9)

ATARI LYNX

(4)

ゲームポケコン

(1)

Xbox360

(35)

 カオスヘッド

(12)

 シュタインズゲート

(21)

 ロボティクスノーツ

(3)

 インスタントブレイン

(8)

 キャサリン

(13)

 DanceEvolution

(17)

 ライズオブナイトメア

(8)

 ファントムブレイカー

(6)

ニンテンドーDS・DSiウェア・3DS・Wii

(21)

 ドラゴンクエストXオンライン

(30)

 PXZ(プロジェクトクロスゾーン)

(6)

 ドラクエモンスターズ テリワン3D

(16)

 善人シボウデス

(6)

 熱血硬派くにおくんすぺしゃる

(6)

 スーパーマリオ3Dランド

(4)

 ラビ×ラビ

(10)

 邪聖剣ネクロマンサーNIGHTMARE REBORN

(13)

PSP・PSN・PS3・PS Vita

(17)

 ToHeart2 ダンジョントラベラーズ / 2

(19)

 ファンタシースターポータブル2

(24)

MD・GG・SS・DC

(4)

WS・WSC

(3)

NEOGEO・NGP・NGPC

(2)

FC・SFC・GB・GBA

(10)

PCゲーム

(5)

その他ゲーム(掘り出し物探しなど含む)

(50)

可愛いは正義☆

(33)

食べ物

(30)

音楽・ゲームサントラ

(24)

アニメ

(4)

漫画・雑誌

(51)

知的好奇心

(67)

仕事関係

(37)

プログラム

(8)

コンピュータ

(8)

プロフィール

Mura-bal

Mura-bal

カレンダー

楽天カード

コメント新着

マイケル村田@ 個人的にお勧めなゲームギアタイトル(マイケル村田) 燃費がアメ車級の消費で有名なゲームギア…
名無し0112@ Re:PCゲームの「ロックマンX4」をやってみた!(02/09) やってみたんですがセーブができませんで…
グルーク@ 私のクルーク様の道のりは長い 私のクルーク様までの道のりは長いです赤…
Mura-bal@ クルークさん来ない… >いろいろさん >連鎖の形を考える練習…
いろいろ@ 最後に不覚にも クスッときてしまいましたw 連鎖の形を考…
2012/03/16
XML
カテゴリ:プログラム
ごちゃごちゃいじってたらハマったのでメモメモしておきます猫

今までホームページのHTMLファイルを文字コード「Shift-JIS」で記述していたのですが,新しいホームページではHTML5に挑戦してみようということで,これを機に文字コードを「UTF-8」に統一しようというのがそもそものキッカケの話題ひらめき

というのは,HTML5の仕様を策定しているW3CではUTF-8を推奨しています.

と言っても,Shift-JISでも他のEUCなどの文字コードでもサーバとHTMLファイルや設定ファイル内で共通の文字コードを使用していれば,普通にブラウジングして表示する分には問題ないと思いますけどね~(たぶん).

で,HTMLファイル自体はどちらでも良いのですが,HTML5で追加されたアプリケーションキャッシュという機能に使われるマニフェストファイル(.manifest)は,UTF-8で保存してね,というのが仕様みたいです.

HTML5を色々遊ぶには,あらかじめUTF-8で統一するスタイルの方が今のところは都合が良さそうですね~.

ということで,Shift-JISからUTF-8の変換をひたすら行ってみたウィンク

でで,各ファイルを文字コードUTF-8で保存して動かすと,PHPファイルがエラーを吐いた!

しかも,ソースコード内には特に何も記述していない1行目を指しておる…雫

ででで,色々やった結果,ソースコード自体に何を記述してやってもエラーが出るぞ,と.

試しに文字コードを変更するとエラーが出なくなった.

ぬーん…??

調査した結果,UTF-8にはBOM(Byte Order Mark)が付いているUTF-8と付いていないUTF-8があり,全国的にUTF-8と言われるのはBOMなしの方なのに,私はBOMありの方を使っていたのです!!

BOMとは,バイト列の順序のことで,対象のデータ列をリトルエンディアン,ビッグエンディアンのどちらで取得すれば良いのかを示すフラグのようなものですが,UTF-8ではバイト単位で処理するため,処理系ではバイトオーダーを考慮する必要はありません.

しかし,「このデータはUTF-8で符号化しています」というのを明確にするため,付けているようですひよこ

愛用しているテキストエディタの「TeraPad」では,BOMありの方を「UTF-8」,BOMなしの方を「UTF-8N」と表記しており,テキストデータの保存時に選択できるようになっています(アプリケーションごとに表記は異なると思われます).

これ,同じように使ってた人多いんじゃないかなぁ??雫

この両者の方式でそれぞれ保存して,バイナリエディタで開いて比較すると,BOMありのUTF-8の方に"EF BB BF"という文字列が先頭に付与されているのが確認できます.

今まで何も気にせずに普通に「UTF-8」を選んでしまっていたよぉ~失敗

Perlのソースコードで先頭に書くおまじないのシェバンでも上記のBOMありだと不都合が起こりそうですね.

という訳で,一般にUTF-8といえばBOMなしのものを指しますが,使用しているアプリケーションによっては保存時の名称が異なるようなので注意が必要ですね!!

使用するテキストエディタによって,BOM付きの符号化方式を選択することが出来る場合は,特に意図がなけばBOMなしのUTF-8を使うと良いかなぁひらめき


【送料無料】 プログラマのための文字コード技術入門 WEB+DB PRESS PLUSシリーズ / 矢野啓介 【単行本】


【送料無料】 文字コード「超」研究 改訂第2版 / 深沢千尋 【単行本】





お気に入りの記事を「いいね!」で応援しよう

最終更新日  2012/03/16 11:34:06 PM
コメント(2) | コメントを書く


サイド自由欄


© Rakuten Group, Inc.