ブログを作る※無料・簡単アフィリ    ブログトップ | 楽天市場
1938721 ランダム
【文字コードは常に戦場】ユニコー… (パソコン・家電)楽天ブログ 【ケータイで見る】 【ログイン】

ホーム 日記 プロフィール オークション 掲示板 ブックマーク お買い物一覧

PR

カレンダー

キーワードサーチ

お気に入りブログ

猫がDJになる 「… 生活info.暮らしを楽しむさん

「IT活用サポー… IT活用サポーターのりばしてぃ さん
ねぼすけの読書感… ねぼすけ2004 さん
LUKEの日記 luke2004 さん

カテゴリ

バックナンバー

モバイル

>>ケータイに
このブログの
URLを送信!

 

ガジェット観察日記

<< 前へ次へ >>一覧コメントを書く

2011.08.02 楽天プロフィール Add to Google XML

【文字コードは常に戦場】ユニコード戦記 今日どんな本をよみましたか?(198820)」
[ 書籍 ]    




ユニコード戦記

ユニコード戦記


 ぼくにとって、国際標準化活動へのかかわりを深めていくということと、英語によるコミュニケーション能力を高めていくということとは、ほとんど不可分のことだった。(138ページより)

著者・編者小林龍生=著
出版情報東京電機大学出版局
出版年月2011年06月発行

コンピュータの文字コードといえば、いまやユニコード(Unicode)が標準になった感があるが、本書はその経緯を記した技術書というより、標準化組織の内情を日本人の立場から時系列に記したドキュメンタリーになっている。
小学館で「ドラえもん」の担当編集者だった著者は、40 代にして ATOK を有するジャストシステムに転職。それからユニコードの国際会議に参画し、やがて国際符号化文字集合の責任者になってゆく。
本書で印象的だったのは、ユニコードが少数民族の文字まで扱おうとする一方で、その議論に参画するには英会話能力が必須だということ。著者はこれについて、「経済や産業発展のためには、国際標準(まさにグロスタ!)に則った産業基盤の育成が欠かせないわけだが、それはある種の諸刃の剣で、先進工業国がつくった枠組みを盲目的に受け入れる以外に、グローバル化した社会の中での経済や産業の発展はありえないという矛盾がある」(183 ページ)と語る。
また、ほとんど海外へ行ったことがない著者が、40 代で一念発起して英会話能力を磨く姿には頭が下がる。ただし、「大切なのは、英語のスキルではなく、伝えるべきメッセージをはっきりと持っているか否か」(33 ページ)と釘を刺している。
欧米との仕事意識の違いについても言及している。「とくに欧米人が日本人に対してよく抱く疑問は、権限を委譲されているならば、なぜその場で自分で判断しないのかということ。持ち帰って検討するなら、子供の使いと同じではないか」(60 ページ)などがそれだ。

ユニコードは、あくまで表記文字を標準化するもので、会話言語を扱うものではないということにも留意すべきだ。ユニコードでは、シフト JIS で扱えなかったような漢字まで扱えるが、方言は考慮されていない。

本書の後半で、異体字や東南アジアの少数民族の表記文字に関する話題が登場する。少数民族の表記文字を先進国が標準化していいものなのだろうかという著者の疑問は、大手システムベンダ/SI が BtoC システムを開発するときにも同じことが言える。
日本の汎用コンピュータは、名前に使われる異体字(渡辺の「辺」や斉藤の「斉」など)を表記するために各社固有の文字コードを使っているが、これをオープン化/Web 化する際にシフト JIS や EUC-JP にすると、異体字が完全に無視される。異体字の名を持つ人の中には、それにこだわりを持っている人が少なからずおり、こうしたシステム変更に対してクレームをつけてくる。
その気持ちはよくわかる。私の名前の 1 文字も、JIS第一水準に収録されているにもかかわらず人名漢字であるために、カタカナで宛名表記してくる人/組織/会社が多い。技術者としては、システムの仕様と言い逃れをするのではなく、エンドユーザーのクレームにもっと耳を傾けるべきだと思う。
著者は「システムの設計は、一般にユーザーの存在と要求を前提として行われる。われわれ、システムを提供する側には、ユーザーの要求に応える義務がある」(97 ページ)と指摘するが、「しかしまた、潜在的なものも含めて、あらゆるニーズを満たすシステムも、これまた、一般的には存在しない」とも言っている。システム開発の匙加減が難しいのは、こうした背景があるからだ。

私の経験でも、システム設計で文字コードが議論になることが多い。設計段階で文字コードが決まってしまうと、あとで変更するのはまず不可能だからだ。
判断が厳しいのは、せっかくフロントエンド系にユニコードを導入して異体字が扱えるようにしても、宛名を印字するバックエンド系が汎用コンピュータだったり、(本書でも解説されている)「16 ビット固定長ユニコード」という誤った設計のフレームワークが採用されている場合である。
いずれにしても、こういう文字に絡む議論が起きている現場では、多少時間がかかっても本書の読書会を行うことをお勧めする。
また、関連書籍として『パソコンは日本語をどう変えたか』(Yomiuri PC編集部)、『異体字の世界』(小池和夫)、『プログラマのための文字コード技術入門』(矢野啓介)も参考になるだろう。








最終更新日  2011.09.25 18:54:36
コメント(0) | コメントを書く





■コメント

お名前
タイトル
メッセージ
・メッセージ本文は全角で800文字までです。
・書き込みに際しては楽天ブログ規約の禁止事項や免責事項をご確認ください
・ページの設定によっては、プルダウンで「顔選択」を行っても、アイコンが表示されません。ご了承ください。


<< 前へ次へ >>一覧コメントを書く一番上に戻る


Powered By 楽天ブログは国内最大級の無料ブログサービスです。楽天・Infoseekと連動した豊富なコンテンツや簡単アフィリエイト機能、フォトアルバムも使えます。デザインも豊富・簡単カスタマイズが可能!

Copyright (c) 1997-2012 Rakuten, Inc. All Rights Reserved.