20921262 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

HIRO.F's Scrawl

HIRO.F's Scrawl

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

Free Space

Calendar

Category

Recent Posts

Comments

ashif@ Re:また、ブローカーが。。。#130Z(10/20) この投稿を削除していただきますよう、よ…
ashif@ Re:また、ブローカーが。。。#130Z(10/20) こんにちは、autorec traders です。誤解…
HIRO.F@ Re:Γの車載工具購入しました(03/07) オークションID:e264342413 商品:スズキ…
HIRO.F@H/K AGES@ Re[1]:9月5日は富沢祥也選手の命日です。(09/05) PQuoraさんへ この時期は、YAMAHA系の方…
とんがらし芥川@ Re:カレー工房ギャー × とんがらし芥川 死神養成辣油 初級、上級(09/16) ご注文いただきましてありがとうございま…

Archives

Shopping List

2~3泊の出張に。耐水素材がうれしい3WAYビジネスバッグ大人仕事用通勤通学入学祝い就活ブリーフケース[200-BAG065WP]【サンワダイレクト限定品】【送料無料】【5/1限定!抽選で100%ポイント還元 】3WAYビジネスバッグ 15.6インチワイド 耐水素材 大容量31.8リットル A4書類収納 2?3日出張対応 自転車通勤に最適 リュック パソコンバッグ メンズ PCバッグ マルチビジネスバッグ 人気 仕事用 ブリーフケース
純正品と互換!100%交換保証!SB3L-A■バイクバッテリー■【YB3L-A互換】■コスパ最強!総販売数100万個突破!GM3-3A FB3L-A互換■【100%交換保証】スーパーナット(液入済)
星乃充電器と延長ケーブルのお得なセット!【在庫有り・即納】6V/12V切替式バイク充電器+延長ケーブル■SAE端子■【スーパーナット 星乃充電器 オプティメート4デュアル 対応】【新品】【あす楽対応】
本棚 耐震突っ張り本棚 幅60 奥行26 耐震 薄型 60 スリム 大容量 壁面収納 壁面 オシャレ おしゃれ 天井 突っ張り つっぱり オープン 転倒防止 地震対策 送料無料 AKU1004501本棚 突っ張り 耐震 突っ張り耐震本棚 幅60 奥行26 ホワイト ブラウン 木製 サンゴ 薄型 60 スリム 大容量 壁面収納 壁面 オシャレ おしゃれ 天井 つっぱり オープン 転倒防止 地震対策 コミック ディスプレイラック 白 ラック シェルフ 鉄心 鉄芯 サンゴスター 床頭台
GSPWOER 当日出荷 2.0対応 HDMIケーブル 0.5m 50cm 4K 3D対応テレビ対応 19+1配線で安心のリンク対応HDMIケーブル 価格に自信有HDMIケーブル 0.5m 2.0規格 4K 3D 送料無料 50cm Ver.2.0 ARC対応 ハイスペック ハイスピード iphone 19+1 業務用 企業用 ゲーム レグザリンク ビエラリンク フルハイビジョン 金メッキ
Jul 15, 2016
XML
カテゴリ:ALTO
全回からの続き。。。

Jul 9, 2016 DPX-U730BTのUSB再生不良

Jul 14, 2016 DPX-U730BTのUSB再生不良 続報

この前は、「ソ」「スポ」がフォルダーにあるとだめってことで、アルファベットに変更してみたけど、だめで。。。。

で、色々考えてみた。。。


と、一つ気がついたのは、Sift-JISのダメ文字問題。。。

スポって二文字が気になるが。。。

ソってのは、いわゆる有名なSift-JISのダメ文字ですね。。。

「\」フォルダやファイル名の区切り文字と同じ0x5Cが12バイト目にある。。。

げ!それって、むちゃくちゃ、ひっかかる文字たくさんあるんじゃないのか??

で、調べてみると

Shift_JISのダメ文字

Shift_JIS(cp932) の文字コードで、2byte目が0x5c のエスケープ文字 \ になっているものの俗称(だめ文字、駄目文字)
エスケープ文字は使用するフォントやロケールにより¥記号またはバックスラッシュで表示されます。
ダメ文字を含む文字列やパス、ファイル名を処理する場合には文字化け、検索不可など様々な不具合が起きることがあります。

ダメ文字には ー ソ 十 表 など、使用頻度の高いものもあるので cp932を扱う場合には注意が必要です。
また広義には2byte目が 0x7c のパイプ文字 | になっている文字や、2byte目が正規表現などのメタ文字と重なる文字も含む場合もあります。
ダメ文字問題は正規表現をはじめとする様々な言語、システムで制御用のメタ文字として扱われる文字と同じバイト列が、SJISの漢字の2byte目に含まれていることにより起こります。
特に 0x5c や 0x7c は様々なシステムで制御文字として扱われるので、文字化けや検索出来ないなどの問題が起こりやすくなります。

具体例

たとえば cygwin/GNU grepでは「表現」のように cp932のダメ文字 "表" を含む文字列を、固定文字列(fgrep)では検索できますが、正規表現ではgrepできません。
「表現」というダメ文字を含む日本語を検索しているつもりなのに、grep側からは正規表現で検索しているとみなされてしまうためです。

「表現」の cp932でのバイト列は、 95 5c 8c bb です。
0x5c の¥記号は正規表現ではエスケープ文字なので 0x8c をエスケープして、 95 8c bb というバイト列を探す事になりますが、これは当然見つかりません。





ダメ字一覧

j52.jpg


で、この中で一番やばいのが下の二つ

2byte目が0x5c \ のダメ文字

2byte目が0x7c | のダメ文字

j53.jpg


ということで、この情報をサービスに伝えると

前回の報告から、確認した内容は、全角カタカナの「ソ」「ポ」(スポ2文字ではなく、ポがだめ)カタカナは、それ以外は大丈夫。アルファベットは大丈夫。全角-がだめ

とのこと。。。

なるほど。。。

他が大丈夫ということで、やはり0x5cと0x7cがだめなよう。

なので、色々検索して、変更しました。。。アニソンとか、ステレオポニーとか、十七歳の地図とか。。。

で、また再度挑戦。。。



前回よりも長く。。。なんで、前にひっかかってたところは、超えた模様ですが


だめでした。。。



一晩徹夜で、FLAC作ってたので、また試してみよう。。。





お気に入りの記事を「いいね!」で応援しよう

Last updated  Apr 12, 2019 01:28:42 AM
コメント(0) | コメントを書く
[ALTO] カテゴリの最新記事



© Rakuten Group, Inc.