「最近の図書館システムの基礎知識」を読んで考えたこと

最近の図書館システムの基礎知識

 『専門図書館』264号(2014年3月)に掲載された林豊氏の「最近の図書館システムの基礎知識―リンクリゾルバ、ディスカバリーサービス、文献管理ツール」という記事を読んだ。

 最近、図書館情報学に関する情報収集のお仕事にほんの少しだけ関わり始めたこともあって、ふだんあまり意識的には読まないシステム系の論文も、勉強しないままではいけないなと思っていた矢先。このテーマで、しかも林さんの執筆とあればこれはと思い、さっそく読んでみた。

 『専門図書館』は色々な特集をしているが、今回は「図書館システム2014」と題する特集で、林さんの記事の後には、各社の製品紹介が続々と続く。ちょうど巻頭論文+総説のような感じになっていて、もうなんというか大御所のようであると思ったりした。さすがすぎる。

 同記事で紹介されているのは、2000年代以降増えてきた電子リソース*1を管理・提供するシステム、さらに検索システム、文献管理ツール、次世代型図書館システムの4つのカテゴリーに属するシステムの概要である。後半の二者は軽く触れている印象だが、どんなものがあるかの商品名くらいは、私も覚えておかねばと思った。

 内容については、私があやふやな知識でまとめるより、そもそもリンク先の方が詳しく書いているし、論文ではなくて解説記事だとご本人もおっしゃっていたところでもある。本文もいずれ一定期間を経過後にオープンになるのではと思われるので、興味を持たれた方には是非実際に本文を読んでいただくのを強くお勧めして、私が面白いなと思ったところを以下にまとめたい。

 物凄くわかりやすく、参考になったのは、やはり検索システムのところであった。これは以下のリンク先にある発表資料が示す通り、林さんの得意中の得意分野なので、当然だし、読み応えがある。

 本文では、物理的資料だけでなく、電子リソース、オープンアクセスの文献まで図書館で提供できるようになったという前提の上で、このように述べられる。

OPAC以後の検索システムは両者のギャップを埋める方向に進んでいる。しかし、提供可能な資料は増大する一方であり、この差を完全に埋めることは今後も不可能であろう。各図書館では、導入・維持コストを考慮したうえで、必要十分なレベルのシステムを検討することが大切である。また、検索範囲に加えて検索機能やユーザインターフェースの問題もある。従来型のOPACは、利用者が直感的に使えないとしばしば言われる。検索範囲を拡大していけばいくほどに、利用者が情報の海のなかから目当てのものを効率良く探し出せるようにサポートする機能が強く求められるようになる(p.4)。

 すげえ「不可能」って言い切った。というちょっとした感動があるのだが、しかしこれは当然だとも思う。

 以前は、検索によって得られた結果がリプレースのたびに変わって不安定な印象を持つこともあったのだが、資料が増えるということは新しいものが上に積み重なることを意味するわけではない。図書館は古書だって場合によっては購入するし、寄贈で欠本になっていた個所が埋まることも稀にあるし、そもそも未整理だったものが遡及入力されてOPACで検索できるようになることもあり得る。前に調べたからなかったのが、数年後に調べてもないとは限らない(図書館によっては物凄く汚損・棄損された資料は除籍されることもあるし、亡失も完璧に防ぐことはできないので、論理的には逆も起こりうる)。

 それはどの時代についても言える、というのが図書館のキモなのかもしれない。


変わる検索スタイル

 ディスカバリーサービスとも呼ばれる最近の検索システム*2の特徴は、林さんによれば、次のようにまとめられる。

  1.  シンプルなキーワード検索画面
  2.  物理・電子リソースの統合検索
  3.  検索語の推薦(もしかして?を返してくるもの)
  4.  検索結果の絞り込み
  5.  関連度順ソート
  6.  情報の充実した検索結果一覧の画面
  7.  書影・目次・あらすじなど充実した書誌情報
  8.  関連資料の推薦(Amazonのレコメンドのようなもの?)

 そこでは「前もって緻密な検索語を組み立てるのではなく、シンプルなキーワードでざっくりと検索してから、(膨大な)検索結果をさまざまな機能で絞り込んでいくという利用スタイルが意識されている」(p.4-5)ことになる。

 林さんによると、ディスカバリーサービスも、北米を中心に2005年ごろからおこってきた、と書いてあるので、来年で10年になるわけだ。それなりに長いトレンドといってもいいかもしれない。

 また、細かすぎるためかあまり触れられていないが、検索ロジックについても、根本彰・岸田和明編『シリーズ図書館情報学②情報資源の組織化と提供』(東京大学出版会、2013年)などもあわせて読むと、新しい動きがいくつもあることがわかる。

 単語の一致だけでなくて、その類義語や関連語を複数使って検索したりとか、全文検索技術として研究されているバイグラムのようなものもある。バイグラムでは、例えば歴史学用語を検索するにあたり、「国民主義的対外硬派」みたいな語を、「国民」「民主」「主義」「義的」「的対」「対外」「外硬」「硬派」のように二文字ずつ区切っていって、それぞれの語で検索をかける。こうすることで検索漏れを防ぐ機能を実装しているOPACもある*3

 

日露戦後政治史の研究

日露戦後政治史の研究

 それから、ウェブスケールディスカバリーサービスの紹介も面白かった。これは、

統合検索(リアルタイム検索)の欠点である検索速度の遅さを改善するために、世界中の出版社と交渉し、検索対象のデータベースから事前にタイトル単位・論文単位のメタデータやフルテキストを収集して検索インデクスを構築しておくという手法の製品が登場した(p.5)。

 とされており、「何だそれは頭良すぎるだろう!」と思って調べてみると、先日筑波大学附属図書館のOPACリニューアルで導入されたSerials Solutions社のSummonがこれにあたるらしい。

 事例で挙げられているのは初期の導入館だった九州大学だが、「収録されたメタデータは現在では数億件から数十億件という規模に達している」(p.5)と書いてあって、そんな大袈裟なと思って九大附属図書館のHPを見たら本当に

論文/記事情報(海外) 世界中の6,800以上の学術出版社、94,000以上のジャーナルからの論文/記事 約8億件

 と書いてあったので度肝を抜かれたのであった(国内が800万件だから、桁が違う)。

 この規模の想像できないような文献世界を相手にして、色々な利用者の要求をできるだけ汲みつつ、何とか情報ニーズを満たせるような検索システムを構築しているというのが実情なのだ。

 ところで、こういうOPACの話や検索の話は、図書館員もそうだが、大学で教鞭をとっている人にもちゃんと伝わっているのであろうか。というのは、新しいディスカバリー系のインターフェースは、私自身が当初かなり戸惑ったし、いまでも周りにいる人文系の研究者の間では、少なくとも絶賛されるような事態に至っていない。しつこく聞いてみると、むしろどうも不評のようでもある。そのことと検索システムのギャップについて、最後に考えてみたい。


歴史研究にとって検索とは何か

 そういうのを考えたきっかけは、たまたま最近読んだ本にある次のような一節からだった。

 歴史家がコンピュータを使いはじめてから、少なくとも四半世紀が経つ。一世紀以上前に原稿をタイプで打ち込むようになったときには、研究や執筆の構成、スタイル、手順にも、またテーマにも変化は見られなかった。だがコンピュータを使うようになってからも変化がなかったとは言い切れない。人間の知性とコンピュータの関係について論じた本はいまではたくさん出版されている。この問題について私は何も知らないが、歴史家という職業の現状と将来を憂う者として、二つの点を指摘させてほしい。

 一つは、歴史を書くにせよ他の文学作品を書くにせよ、コンピュータ上で文を書くと文体が改善されるという証拠はどこにもないことである。むしろ逆になるケースも見受けられる。もう一つは、より重大な問題で、コンピュータで入手可能な情報に研究者が依存しがちになることである。この種の「情報」は言うまでもなく大量に存在し、しかも驚異的に簡単に入手できる。だがそうした情報は信頼できるのだろうか。答えはイエスでもあればノーでもある。それらは、誰ともわからない人間の手でどこかのコンピュータに入力されたものだ。「データバンク」と称するものの中には、書籍、論文、史料の所在も含めて重要な情報が欠落し、しかも欠落したままだろうと予想される代物がいくらも存在する。この事実に、コンピュータを使う多くの人が気づいていない(原文の引用や参照をインターネットに頼り切り、レポートに切り張りする学生を見るだけでも、このことは明らかだ)。検索可能であることと証拠として依拠できることとは同じではない。キーを叩くと画面上に現れるものが、必ずしも「現実」に存在するとは限らない。

 いま述べたことの多くは、「史料」の問題にかかわってくる。これについてはすでに触れたが、ここでは一部の歴史家が取り上げた論点を吟味することにしよう。社会史、ジェンダー史、宗教史といったものでは、史料が乏しく断片的だという問題があり、歴史家はつぎはぎ細工をしたうえで結論をひねり出さなければならない。これに対して近年の政治史や国際関係史では、まったく逆の問題に直面する。社会や政府のさまざまなレベルで材料が大量にありすぎるのだ。通話記録、テレタイプ、eメール……。これらの中には検索可能なものもあれば、可能でないものもあるが、いずれにせよ信頼できるのだろうか、あるいは完全なのだろうか。また、中央情報局(CIA)のような情報機関で保存している記録は、どこでどんなものが検索できるのだろうか、そもそも検索できるのか、できるとして信頼できるのだろうか*4

 大変長い引用で恐縮である。著者は1924年生まれなので、なんだ老人の小言か。といって片づけられてしまいそうなのだが、しかし歴史という学問と出版であるとか、同書に対して私自身はかなり共感できる個所が多かったので、ここも立ち止まって考えてみたいのである。

 著者がいら立っているのは、検索できるものが歴史研究で使える史料の全てではない、ということなんだろうと思う。

 すなわち、「検索可能であることと証拠として依拠できることとは同じではない」。ごく一部の人にしか通じないかもしれないが、しかし例えば、相当の理由がない限り、日本近代史の論文で、いくら検索がしやすいからといって、読売新聞データベースからしか引用せずに世相を語っているのはNGという判断はある。第一、新聞記事から世相を語りたければ、(割と私の好きな)『明治世相編年事典』なり『新聞集成明治編年史』なり、あるいは索引から検索しやすいところでいえば、『明治ニュース事典』『大正ニュース事典』なりが現に存在しているのだから。

明治世相編年辞典

明治世相編年辞典

 そういう意味では、歴史研究の質は、普通にシステムを使って検索できるものと、それでは辿りつけない史料の塊をどれだけ知っているかの組み合わせで決まるということになってくるのだろう。そして検索では辿りつけない史料の塊が何なのかという話になってくるとき、俄かにレファレンス・サービスはやはり大事だということになってくる。


 もうひとつ、検索が研究の全てを規定してしまうわけではないと思うのだが、ちょっと思わせぶりな分析概念を拵えるところから始まって、人文系はそもそも緻密な検索語を作るのが基本的に大好きな人が多いように見えることも、何がしか検索システムに対する人文系の意識を規定しているように思える。いくつかの文献を読みながら検索語を抽出して「このパターンならこういう結果が出るはずだ!」と思いながら検索をかける利用スタイルが、あくまで私の想像だが、かなり多いと思うのである。

 絶対の自信を持って選び抜いた検索語に「もしかして?」がついたときのイラっとする感じは、わかるような気がするし、また、利用側がこのようなアイデアで調べた先行研究はないだろうと思って念のため検索をかけたら、よく把握できないロジックで、なんだか見てみないと当たりか外れかもわからない結果が複数出てきた。見てみたら全部無関係のテーマだった。というのは利用者の時間を節約するどころか浪費させているわけなので、その点でうまくいかない悲劇であるかもしれない。

 いずれにせよ、一見、「なにそれ繋がるの?」という風に見える論題に接したとき、この主題とこの主題を組み合わせるのかという意外性の驚きが人文系の論文の妙味の一端を構成していることは疑えず、それが私の周りの人文系ユーザからまれに漏れ聞こえてくる、ディスカバリーサービスの不評と繋がっているような気はする*5

 戯画的に付け加えるなら、自分がこのようにしてみたい、やってみたいと内発的に思ったことを、システムに規制される形で実現できないことを何か「疎外されている<私>」みたいな形で発見してしまい、そのような問題を哲学的な次元で議論したがる人も、人文系には一定数いると思われるが、まあそれはともかく、検索のスタイルも、十年一日同じようにやっていて良いわけではないということ否めないのだろう。

 「図書館は成長する有機体である」といった人がある。その解釈はさまざまであろうけれど、持っている資料が有機的に増えていくならば、それを探すツールもやはり変質を免れないし、さらにそれを提供する側はもとより、使う側も、そうした発展のサイクルの影響を不可避的に蒙りながら進んでいくしかないということなのだと思う。

 端的にいえば、真面目に研究を続ける気があるならば、検索はその都度やるよねと、調べる側が問われているのだ。図書館員にではなく、増え続ける資料に。

 OPACは検索のための道具で、道具はしょせん道具なのだが、気がつくと留守の間に勝手に室内を動き回る掃除機のようになっているかもしれない。そんなことまでする必要はないと言い続けても、大勢では掃除機の古い紙パックが生産中止になってしまうように、結局道具である以上、耐用年数があるということなのだろう。

 

 成長や進化という言葉を安易に形容詞に使うのはよくないかもしれないが、従来型OPACで十分な検索結果が得られているのだからそのままでいい。余計は改変をするな!というのは、知らないところでどんどん友達づきあいが増えていく子供の成長を受け入れられないために、上から馬鹿にし続けないと立場を失ってしまう親のようである――そう想像して、それはカッコ悪いなと思って、過去にそんなことを思ったり言ったりしたことのある気がする自分をちょっと反省した。

 何もそんなことまで考えなくとも、という著者のあきれ顔が浮かぶが、考えるきっかけをくれた林さんに感謝である。

*1:大まかに「電子ジャーナル、電子ブック、データベース、デジタル化資料など」と分けられている(p.2)。

*2:検索範囲が図書館の書庫の中にある物理的資料だけでなく、契約データベースに入っている論文などの電子リソースも含むことから、もはやOPAC=Online Public Access Catalog、オンラインで見られる図書館の蔵書目録という意味ではないだろうという含意からとくにディスカバリーと呼ばれるらしい(p.4)。

*3:大変どうでもいい話。この検索式によるOPACは、間に助詞などが入る場合は大変重宝するのだが、他方こんなこともある。以前、かねてから個人的に調べている明治時代の出版社「博文館」を検索しようと窓に放り込んだところ、未知の文献が大量に出てきて、「なんだこれは!」と胸をときめかせてみると、未知の文献の全部が伊藤「博文」のことが書いてある吉川弘「文館」の本だったために凄まじい脱力感を味わったことがある。伊藤ならまだ明治時代だから許せるような気もするが、「博文」というお名前の研究者が著者として返された場合の関連度順とは何なのか、微妙に考えさせられる事例ではある。

*4:ジョン・ルカーチ、村井章子訳、近藤和彦監修『歴史学の将来』(みすず書房、2013年)149~151頁。原書は2011年刊

*5:検索結果のロジックが見えにくいことについて不満を持つ(歴史)研究者については、後藤真電子書籍・デジタル化の課題と展望 コンテンツの電子化がもたらす新たな情報発見の可能性 歴史資料を用いた事例を題材に」『現代の図書館』51(4)(2013.12)が少しだけ言及している。