本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

YggdrasillとXMLデータベース

(株)メディアフュージョン XML企画営業グループ 前場 大輔 氏


印刷業界におけるXML利用の進展

2002年5月のテキスト&グラフィックス研究会ミーティングから,メディアフュージョン(http://www.mediafusion.co.jp/)の前場大輔氏による同社のXMLデータベースエンジンYggdrasillの解説を報告する。

印刷業界におけるXML利用の第1は,入稿データをXMLデータで扱うことで,顧客からのデータがXMLである場合と,顧客のデータを印刷会社がXMLデータ化する場合がある。前者は顧客のXML化が進んでいるわけだが,SGMLでデータベース化しているデータをXMLに変更する事例も多い。後者は印刷会社が自社の作業の効率化や継続的な受注を見込んで行うものである。

印刷業界におけるXML利用の第2は,XMLの特性であるワンソースマルチユースを活用して1つのデータからマルチアウトプットを可能とするシステムを構築することである。
第3はEDIシステムの構築である。従来は,たとえ電子データであっても郵便や宅配便による入稿が主だったが,最近ではWebを利用して電子的な入稿・受発注を行うシステムになりつつあり,それにXMLを利用する印刷会社が増えている。

データベースエンジンYggdrasill

Yggdrasillはメディアフュージョンが開発した純国産のデータベースエンジンで,XMLにネイティブに対応しているのが最大の特徴である。
同社は設立当初からXML関連の開発を行ってきたが,XMLを扱えるデータベースエンジンがなかったため,2000年に開発に着手し,2001年6月にYggdrasill 1.0 for Windowsを発売,12月には1.5にマイナーバージョンアップを行うとともにLinux版を発売,2002年3月にはEnterprise EditionとSolaris版の発売を開始した。

現在広く普及しているリレーショナルデータベース(RDB)はテーブル構造を利用してデータを格納している。従って,RDBにツリー構造のXMLデータを格納するにはツリー構造をテーブルにマッピングしなければならない。しかし,YggdrasillはXMLにネイティブに対応しているため,そのツリー構造のままXMLデータを格納・取り出しできる。テーブル構造へのマッピング処理がないので高速検索・登録が可能である。

また,XMLデータの構造が変更されると,RDBではテーブル構造から作り直さなければならないが,Yggdrasillはデータを再登録するだけで対応できる。
Yggdrasillの内部構造は,XMLをドキュメント単位に格納するポケットと,そのポケットを収納するバスケットから成っている。この内部構造によって,ツリー構造のXMLデータをそのまま格納し,そのまま取り出すことができる。

Yggdrasillの特徴

YggdrasillはXMLデータをそのまま格納するため,DTDなどのスキーマ定義を必要としないWell-Formed XMLにも対応できる。また,この特徴によって,データ構造の変更が容易で,システム運用後の改修作業も容易である。いずれもデータを再登録すれば変更や改修内容が反映される。

また,Yggdrasillは国産のデータベースエンジンであることから,2バイト文字を基本として開発されている。従って,中国語,韓国語などを含む漢字文化圏でのデータベースエンジンとして利用できる。既に中国語環境,韓国語環境での動作も確認している。最近では海外に生産を外注する企業が増えており,それらの企業から中国,韓国だけでなく,インド,バングラデシュなどでの使用の話もきている。

YggdrasillはW3Cの勧告となっているXPathを用いており,構造の統一性がなくても,また,複数の条件を指定した複雑な検索でも高速な処理を実現している。社内の実験結果では150万ノードで容量60MBのXMLドキュメントの検索時間が50msec,550万ノードで容量220MBでは150msec,850万ノードで容量340MBでは250msec程度であった。検索結果はXMLドキュメントで返される。なお,正規表現による検索もサポートしている。

検索速度はデータ構造などによっても異なるので,Yggdrasillの購入前に実際に使用するデータを用いた検索時間テストを行うよう推奨している。テスト環境のない顧客のために弊社内でテストを行うこともある。テスト結果によっては,テストデータを借用し,データ構造,テスト方法などを聞き,弊社内でテストや検討を行い,検索速度向上のためにデータ構造の変更などのコンサルテーションも実施している。

Yggdrasillによるシステム構築

Yggdrasillを中心にXMLによるマルチユースシステムを構築することで,蓄積したXMLデータをXSLTでHTMLに変換してWebでの公開に使用したり,組版ソフトを使って印刷物の作成に使用できる。また,クライアントがWebで入力したデータをXMLにしてデータベースに蓄積するなど,YggdrasillとXMLによってマルチユースな展開が可能になる。

このようなシステムを構築すれば,顧客データ,入稿データなどの複数データを一元管理し,必要な時に必要なデータを瞬時に検索して利用できるようになる。また,顧客がWebを利用してデータの入稿や変更を直接行うことで,印刷会社側での入稿や登録・変更作業などの手間もなくなる。

さらに,XMLを活用することでこれまでできなかったサービス展開が可能となり,攻めの営業展開も期待できる。ASP事業を提供している印刷会社の例では,ASPで写真や日記などをWebで公開していた顧客から,公開していた情報をオンデマンド印刷で出版する依頼を受けるようになった。

Yggdrasillによる開発事例

文部科学省国文学研究資料館で開発した「欧州所在日本古書総合目録」は,欧州各国の大学図書館・市立図書館・美術館・博物館などに所蔵されている「日本の和装本」のすべてを収容しており,Web(http://asuka.nijl.ac.jp/xml/korn/index.html)で検索できるシステムである。

「道遊ネット(DO YOU NET)」は,北海道の観光情報をXMLで収集し,発信する実証実験サイトである。実証実験が終了したので今は見ることができないが,その小樽市の観光情報データベース部分でYggdrasillが使われた。実証実験の概要は,http://www.mlit.go.jp/hokkaido/2/doyoynet.htmで見ることができる。

凸版印刷のシラバスシステムは,印刷物で配布していた大学の受講カリキュラムをWebで管理・閲覧可能にするもので,Yggdrasillを組み込んだパッケージ製品で販売され,関西の大学で使用されている。

「行政書士業務支援システムe-agent」は,行政書士を対象に,クリックスが運営するASPサービス(http://www.e-agent.ne.jp/)で,行政書士業務に必要な情報やノウハウを総合的に提供するとともに,Web上で各種申請書の作成を可能にしている。

最近では,2002年4月末に地震システムの構築会社にLinux版を納入した。この会社では,衛星を使用して収集した地殻変動データ(このデータは,既に国際的な規格でXML化されている)のうち,一定の基準値以上のデータをデータベースに蓄積・管理するシステムを構築している。
(テキスト&グラフィックス研究会)

■出典:JAGATinfo 2002年8月号

2002/08/15 00:00:00


公益社団法人日本印刷技術協会