本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

インターネット情報のアーカイブ-国立国会図書館の取り組み

日本全国の出版物を収集し,保存している国立国会図書館は,収集範囲をインターネット上の情報へと広げている。その取り組みが電子図書館プロジェクトである。

電子図書館のコンテンツには「紙の図書をデジタル化した資源」と「インターネット上の資源」の2種類がある。紙をデジタル化したものにいては(1)近代デジタルライブラリー,(2)貴重書のデジタルアーカイブ,(3)国会会議録の全文データベース,(4)電子展示会というコンテンツなどがインターネットで公開されている。

近代デジタルライブラリーは明治期に刊行された和図書のうち約5万5千冊がデジタル化されたものである。電子展示会はテーマ性のあるコンテンツを集めて公開している。例えば「日本国憲法の誕生」は単なる資料の羅列ではなく,憲法が作られた背景や関係した人物,関連資料について詳しく解説しており,充実した歴史資料の展示会なっている。

インターネット上の資源の収集についてはWARPDnaviがある。ウェブの情報収集の方法については,紙の本と同様に納本制度審議会で議論された。その結果,本のように義務的に納入する納本制度とは別の制度による必要があるものの,内容を選別することなく,自動収集や送信によって行うのが適当であるとの内容が答申された。

「WARP(Web Archiving Project)」では,(1)電子雑誌,(2)政府ウェブサイト,(3)協力機関ウェブサイトという3つのコレクションを収集し,公開している。国会図書館の職員が収集対象を探し出し,該当するサイトの運営者から,コレクションに加えるための許可を得る。さらに著作権などの処理が済むと,該当サイトのデータを国会図書館のサーバへすべてコピーする。本が納本されるように,データがサーバに保存される。すでに,ネット上には無くなってしまったが,国立国会図書館のサイトにアクセスすれば閲覧できる電子雑誌もあるという。

データベースなどを組み合わせたサイトの場合は機械的に収集することが難しい。その場合は Dnavi(Database Navigation Service)でデータベースの入口まで案内する。

将来的には,国立国会図書館で日本のインターネット上のデータを広く保存するという計画がある。現在,容量が19TBあるといわれている日本のウェブのデータを定期的(例えば年に1〜2回)にコピーするということがありうるが,現在,本当に全部保存するのか,包括的自動収集は官公庁や団体のサイトだけにしたほうがよいのでは,などの議論の最中だという。国立国会図書館では,実現に向けて,著作権制限も含めた法整備やシステムなどの検討を進めている。

 仕事や研究にインターネットの情報は欠かせない。しかし,デジタル情報はもろい。パッケージ系コンテンツはアプリケーションが古くなると閲覧できなくなる。インターネット上の情報は,いつまでもそのサイトがあるという保証はない。20年30年レベルではなく100年,200年のスパンで長期保存できる環境を目指しプロジェクトが進められている。(文責編集)

通信&メディア研究会

2005/07/18 00:00:00


公益社団法人日本印刷技術協会