|
テーマ:プログラムの話(234)
カテゴリ:プログラミング
著作権の切れた書籍をWebで公開している青空文庫というサービスがあります。
これを無線LANとWebブラウザを内蔵しているPSPで見られたら、外出先でも電子ブックとして使えてどんなに便利だろうと思ってアクセスしてみました。 ところがPSP内蔵のWebブラウザはXHTMLで導入されたルビタグ(<ruby>~</ruby>)をサポートしていないため、「蠍(さそり)」のように漢字の横に括弧でルビが表示され、これが非常に見にくいです。 そこで青空文庫所蔵の文書からルビをすべて削除するフィルタリングサービスを作ってみました。 →青空文庫ゲートウェイ (使い方) 例えば宮沢賢治の銀河鉄道の夜を読みたい場合は、上記の青空文庫ゲートウェイにアクセスして、作者ID=81、文書ID=43737を入力すればフィルタリングした文書を読むことができます。 実装はPHPで行いました。 コードの核の部分だけ以下に示します。
$filename には、文書のURLを代入しています。ただこのスクリプトではすべてのルビタグが削除されず、残ってしまうものがあります。正規表現にマッチしない場合があるようですが原因は調査中です。 今後もデバッグを続けていきます。 お気に入りの記事を「いいね!」で応援しよう
Last updated
2006年02月01日 17時17分21秒
コメント(0) | コメントを書く
[プログラミング] カテゴリの最新記事
|