TRL
TOP PAGE東京基礎研究所採用情報研究分野プロジェクト関連情報IBM基礎研究所
English page is here.
XMLオーサリングツール構築技術: XML Authoring Tool Technology
Webコンテンツ適応を支援するアノテーション・エディタ


研究の概要

HTMLコンテンツの配信とWebブラウザによる閲覧を中心とするインターネットの 利用形態は急速に広まっています.特に,小型携帯端末/携帯電話/ゲーム機にも Webブラウザが搭載されるようになり,Webコンテンツへのアクセス方法は ますます多様化しつつあります. クライアント端末の表示能力や通信機能は一様でなく,小型形態端末では デスクトップPCに比べて低速な通信手段と小型の表示画面しか装備されない 場合が一般的です.そのため,カラー表示を前提としてデスクトップPC用に 作られたページは,小型端末では表示サイズを縮小したり色数を減らす といった変形が必要となります.このようにWebコンテンツを利用環境に 適応させることはトランスコーディングと呼ばれます.

図1: 外部アノテーションによるWebコンテンツ適応
外部アノテーションによるWebコンテンツ適応

インターネットを介してアクセス可能なHTMLページは膨大な量に及びますが, そのほとんどはデスクトップPCに表示することを想定して作られています. そのような既存のHTMLページを変更することなく様々な利用環境に適合する ように変形するには,コンテンツ適応のための注釈(アノテーション)を 外部的に与えることが有効な方法となります [Hori 2000]. トランスコーディングのためのソフトウエア(コンテンツ適用エンジン) をプロキシ・サーバ上に配置することによって,アノテーションの指示に 従って様々なタイプのクライアント端末向けに元のHTMLページを変形して 配信することが可能となります(図1).


アノテーション・エディタ

外部アノテーションはXML文書として生成・更新されますが, 外部アノテーションのオーサリングにはアノテーション文書の作成だけでなく, 注釈対象となるHTML文書の断片を指示する(XPath)表現を編集する必要があります. 外部アノテーション編集のために開発された専用エディタ (アノテーション・エディタ [Abe 2002]) の画面コピーを図2 に示します. アノテーション・エディタは,アノテーション記述のための様々な語彙に対して カスタマイズ可能なだけでなく,アノテーションの編集を容易にする個別の 操作画面を適宜エディタに組み込むことができるように設計されています. なお,図2 の画面コピーは基礎研究所から製品開発部門に技術移転された アノテーション・エディタのプロトタイプです(そのため,IBM WebSphere トランスコーディング・パブリッシャー V4.0 とともに出荷された 製品版 アノテーション・エディタの外観とは若干異なっています).

図2: アノテーション・エディタ画面
アノテーション・エディタ画面

図2 の画面コピーで左上に表示されているメイン・ウィンドウは2つの サブ・ウィンドウに区分されています."Target Document"と示されて いる左側のサブ・ウィンドウは,注釈対象となる文書(通常はHTMLページ) を表示するための領域です."Annotation Document"と示されている 右側のサブ・ウィンドウはアノテーション文書(XML文書)を編集する ための領域となっています.図2 の右側には注釈対象となっている HTMLページがブラウザ上に表示されています.このブラウザ・ビューを 通して注釈対象箇所の選択ならびに該当箇所を指示する(XPath)表現を 生成することができます.


アノテーションに基づくHTMLページ・クリッピング

デスクトップPCで表示することを想定して作成された製品紹介のページ の例を図3(a) に示します.このページには製品仕様の詳細だけでなく, 検索フォームやメニューなど多くの内容が表示されています. このHTMLページをデスクトップPCからではなく,インターネット対応の 携帯電話からアクセスすることを考えてみます.この製品紹介ページは 様々な画像ファイルや入れ子になったHTMLテーブル・タグを用いて デスクトップPCに適した表示となるようにレイアウトされています. ところが,そのような豊富な内容は表示領域の限られた携帯電話では かえって表示が煩雑になり操作性が損なわれます(また,通信サービス形態に よってはより多くの通話料が課金されることにもなります).

図3: アノテーションに基づくドキュメント・クリッピング
アノテーションに基づくドキュメント・クリッピング

このような状況では,デスクトップPC用の内容から小型ディスプレイでの 表示に適した内容だけを取捨選択することが有効です.例えば, もとの製品紹介ページから製品名称と価格の部分だけを取り出して リストとして表示することを考えてみます. このようなコンテンツ抽出(ページ・クリッピング)のための注釈は, アノテーション・エディタ(図2)で生成・編集することができます. 注釈にはページ・クリッピングのためのアノテーション語彙 [図3(a) に示されたkeep, remove等]を用いますが, アノテーションとして付与された指示は,コンテンツ配信時に ページ・クリッピングのためのコンテンツ適応エンジンによって解釈され, もとのHTMLページから指定された内容だけが抽出されます[図3(b)]. さらに,HTMLからcompact HTMLに変換するモジュールを適用することによって, デスクトップ用のHTMLコンテンツをインターネット対応(例えば i-mode) の携帯電話で表示可能なcompact HTMLの形式に変換することもできます[図3(c)].

アノテーションに基づくページ・クリッピングの詳細については,IBM develpersWorks から公開されている 関連記事 もご覧下さい.

[Abe 2002]
M. Abe and M. Hori: A visual approach to authoring XPath expressions. Markup Languages: Theory & Practice, Vol. 3, No.2 (to appear).
[Hori 2000]
M. Hori, G. Kondo, K. Ono, S. Hirose, and S. Singhal: Annotation-based Web content transcoding. Proceedings of the 9th International World Wide Web Conference (WWW9), pp. 197-211, Amsterdam, Netherlands (2000/05).

IBM Research
IBM Home Page日本IBM検索お問い合わせプライバシー著作権商標
Last modified 10 Jan. 2002