9687207 ランダム
 ホーム | 日記 | プロフィール 【フォローする】 【ログイン】

HIRO.F's Scrawl

PR

サイド自由欄

カレンダー

カテゴリ

日記/記事の投稿

コメント新着

奥大山で出会った130マンハッタン@ Re:2か月ぶりにエンジンかけて、島根に向かいます(07/20) フェンダーにタイヤが、当たるのは足回り…
ゆきこ@ 日本にとって大切な参院選 初めまして、こちらのブログとは場違いな…
ゆきこ@ 日本にとって大切な参院選 初めまして、こちらのブログとは場違いな…
HIRO.F@H/K AGES@ Re[1]:80's Meeting 2019 #80sMeeting(05/30) いまさらさんへ 告知ありがとうございま…
いまさら@ Re:80's Meeting 2019 #80sMeeting(05/30) 今年は行けるかな〜〜〜? とりあえず、ブ…
HIRO.F@H/K AGES@ Re[1]:GK71B CLUB 開設17周年(04/29) いまさらさんへ 本当に、いつも助けても…
いまさら@ Re:GK71B CLUB 開設17周年(04/29) おめでとうございます🎉🎊㊗️ 次の山は20周…

バックナンバー

購入履歴

星乃充電器と延長ケーブルのお得なセット!【在庫有り・即納】6V/12V切替式バイク充電器+延長ケーブル■SAE端子■【スーパーナット 星乃充電器 オプティメート4デュアル 対応】【新品】【あす楽対応】
【本物】 本棚 耐震突っ張り本棚 幅60 奥行26 耐震 薄型 60 スリム 大容量 壁面収納 壁面 オシャレ おしゃれ 天井 突っ張り つっぱり オープン 転倒防止 地震対策 送料無料本棚 耐震突っ張り本棚 幅60 奥行26 ホワイト ブラウン 木製 耐震 薄型 60 スリム 大容量 壁面収納 壁面 オシャレ おしゃれ 天井 突っ張り つっぱり オープン 転倒防止 地震対策 コミック ディスプレイラック ウォールナット 白 ラック シェルフ 耐震本棚 鉄心 鉄芯
【メール便無料】★当日発送★1.4規格はもう古い!最新規格2.0対応! HDMIケーブル 0.5m 50cm 4K 3D対応テレビ対応 19+1配線で安心のリンク対応HDMIケーブル 価格に自信有!【HDMI ケーブル 0.5m】当日発送 新規格!2.0規格対応HDMIケーブル 【送料無料】 0.5m 50cm Ver.2.0 ★1年相性保証★ 3D対応 ハイスペック ハイスピード iphone 19+1 業務用 各種リンク対応 PS3 PS4 レグザリンク ビエラリンク フルハイビジョン 金メッキ仕様 各種リンク対応
HDMIを映像はコンポ-ネントに音声はRCA(アナログ)同軸デジタル(SPDIF,コアキシャル)に変換するアダプター。プレステ等をアナログテレビに出力!TSdrena HDMI → コンポーネント(ビデオ+ アナログ音声・同軸デジタル音声) 変換コンバーター[相性保証付き] HAM-CHICA2
HDMI入力を最大4つに分配するスプリッター。プレステ等のゲーム機の映像をPCとTVに繋いでゲームの実況用に 店頭でのサイネージにも最適!TSdrena HDMI 4分配器 [相性保証付き] HAM-HIA14-K
2016.07.15
XML
カテゴリ:ALTO
全回からの続き。。。

Jul 9, 2016 DPX-U730BTのUSB再生不良

Jul 14, 2016 DPX-U730BTのUSB再生不良 続報

この前は、「ソ」「スポ」がフォルダーにあるとだめってことで、アルファベットに変更してみたけど、だめで。。。。

で、色々考えてみた。。。


と、一つ気がついたのは、Sift-JISのダメ文字問題。。。

スポって二文字が気になるが。。。

ソってのは、いわゆる有名なSift-JISのダメ文字ですね。。。

「\」フォルダやファイル名の区切り文字と同じ0x5Cが12バイト目にある。。。

げ!それって、むちゃくちゃ、ひっかかる文字たくさんあるんじゃないのか??

で、調べてみると

Shift_JISのダメ文字

Shift_JIS(cp932) の文字コードで、2byte目が0x5c のエスケープ文字 \ になっているものの俗称(だめ文字、駄目文字)
エスケープ文字は使用するフォントやロケールにより¥記号またはバックスラッシュで表示されます。
ダメ文字を含む文字列やパス、ファイル名を処理する場合には文字化け、検索不可など様々な不具合が起きることがあります。

ダメ文字には ー ソ 十 表 など、使用頻度の高いものもあるので cp932を扱う場合には注意が必要です。
また広義には2byte目が 0x7c のパイプ文字 | になっている文字や、2byte目が正規表現などのメタ文字と重なる文字も含む場合もあります。
ダメ文字問題は正規表現をはじめとする様々な言語、システムで制御用のメタ文字として扱われる文字と同じバイト列が、SJISの漢字の2byte目に含まれていることにより起こります。
特に 0x5c や 0x7c は様々なシステムで制御文字として扱われるので、文字化けや検索出来ないなどの問題が起こりやすくなります。

具体例

たとえば cygwin/GNU grepでは「表現」のように cp932のダメ文字 "表" を含む文字列を、固定文字列(fgrep)では検索できますが、正規表現ではgrepできません。
「表現」というダメ文字を含む日本語を検索しているつもりなのに、grep側からは正規表現で検索しているとみなされてしまうためです。

「表現」の cp932でのバイト列は、 95 5c 8c bb です。
0x5c の¥記号は正規表現ではエスケープ文字なので 0x8c をエスケープして、 95 8c bb というバイト列を探す事になりますが、これは当然見つかりません。





ダメ字一覧

j52.jpg


で、この中で一番やばいのが下の二つ

2byte目が0x5c \ のダメ文字

2byte目が0x7c | のダメ文字

j53.jpg


ということで、この情報をサービスに伝えると

前回の報告から、確認した内容は、全角カタカナの「ソ」「ポ」(スポ2文字ではなく、ポがだめ)カタカナは、それ以外は大丈夫。アルファベットは大丈夫。全角-がだめ

とのこと。。。

なるほど。。。

他が大丈夫ということで、やはり0x5cと0x7cがだめなよう。

なので、色々検索して、変更しました。。。アニソンとか、ステレオポニーとか、十七歳の地図とか。。。

で、また再度挑戦。。。



前回よりも長く。。。なんで、前にひっかかってたところは、超えた模様ですが


だめでした。。。



一晩徹夜で、FLAC作ってたので、また試してみよう。。。






最終更新日  2019.04.12 01:28:42
コメント(0) | コメントを書く
[ALTO] カテゴリの最新記事

Copyright (c) 1997-2019 Rakuten, Inc. All Rights Reserved.