続・片言隻語
第9回 デジタル技術革新下の図書館:生成AIと図書館
(第8回 「図書館は如何に「チャットGPT」に対応すべきか」はこちら)
最近、急速なAI(人工知能)技術の進歩に呼応して、「チャットGPT」に代表される文章や画像を人工知能で自動的に生み出すシステムである「生成AI」等への関心が高まり、本年の4月末には高崎市で、先進7ケ国(G7)のデジタル技術相の会合がもたれ、デジタル新技術の適切な活用に向けたルール整備のために五つの原則が合意された。5月に広島市で開かれるG7サミットでの討議に際しても取り上げられ、技術やリスク評価の基準を少なくともG7各国では揃える方向を目指すと見込まれる。
その五つの原則とは次の通り。
①法の支配の下に置くこと。
②人権尊重の方策にたがわぬこと
③適正な手続きの下で活用されること。
④民主主義社会の発展に反しないこと。
⑤デジタル技術革新やAI進歩の機会を活用すること。
以上の五原則の下で、具体的にはどのような生成AIについての取り組みが要請されたり、規制がなされるかはもとより、その試案の公表すらなされていない段階ではあるが、図書館として考慮しておくべき問題点の幾つかを私案として紹介しておきたい。
(1)法の支配の下に置くこと。
現在の法治主義の下にある社会で、常識的な原則が最初に示されていることの意味を考えたい。この原則が五原則の最初に来ることの意味は、法は法でも「生成AI」を対象に新規立法を行うということではなく、新規立法が仮に必要であるとしても、その大前提に現行の法制の枠内でまずは対応を考え、その上でなお不備があるなら、新規立法と言うことになるのであろう。となれば、先ず現行の法制での知的所有権が問題になると思われる。
「生成AI」が より、その技術的完成度を高めるには、本来人間・個人の持つ自然な感情、思考、行動などの表現である発話、文章、動作などの記録データを用いて、可能な限り多数のパターンを学習することで、どのような条件の下で、どのような表現に結び付くかの学習をすることが必要になる。この学習の材料となる記録データが人間の既存の著作物であるなら、知的所有権で守られていることになるので、完成度の高い生成AIの研究に対し、どこまでそれらデータの知的所有権が解放されるかが、今後のAIの技術的進歩・完成度(速度と応用可能性など)を左右することになるのであろう。いずれにせよ「生成AI」で知的所有権を主張するためには、その「生成AI」としてのシステムが既存の法体系の中で公序良俗に反することなく、第三者に不利益を与えることのない事を、そのシステムの作成者が立証する責任を有し、それが出来て初めてその生成されたシステムについての権利を主張できる体制が最低限必要である。したがって、今後一層知的所有権問題への関心が高まるであろう。
(2)人権尊重の方策にたがわぬこと。
人権と言う観点では、先ずはプライヴァシーの保護と言うことになるであろう。そのデータには生成AIの操作対象とする既存のデ-タと、生成AIを適用した成果として新規に作成されたデータの両側面がある。即ち、生成AIアプリを個人や個別組織の非公開データにアクセスさせないと言うプライヴァシーの保護や、人知では総合化できない、時間的地理的、言語や文化的な文脈等に分散されて公表されている特定課題に関する断片的情報を丹念に生成AIが拾い集めて構造化することで、一定の秘匿されてきた情報が浮かび上がるような情報生成の成果として、結果的に個人や組織の意図しない秘密や機密を暴露することに繋がる成果となる場合もある。これが個人のプライヴァシーに関係する場合は、通常、そのプライヴァシーは法で守られているが、国家や組織統治の観点では特に安全保障上は当該関連諸機関に於いて日常業務として後半に分散されて公表することで秘匿された情報の収集と分析は最も基本的な情報業務ではある。ともかく、学習材料にせよ、AIソフトの活用結果にせよ、個人のプライヴァシーは尊重されることは言うまでもない。
(3)適正な手続きの下で活用されること。
生成AIはデジタル革命により、近未来の人類社会がより良い高度な社会を構成するためのイノヴェーションを起こすためにはその導入・活用は不可避である。そのためには一定の規制の下での活用は不可避であり、生成AIなどは危険だからとして忌避することはできないが、国内外での情報成果物の円滑な流通のために最低限、物理的形式上の標準化等のルールや約束事が不可欠となる。その具体例としては、すでに、科学技術情報分野では学術論文の形式等の標準化が国際標準化機構(ISO)や学会等で制定されており、国内では、旧科学技術庁や後継の文部科学省傘下で、 科学技術情報流通技術基準(SIST:Standards for Information of Science and Technology)が制定されている。これ等をベースに今後は更なる適正な手続き、規則等の数々が制定されるであろう。
(4)民主主義社会の発展に反しないこと。
本稿で取り上げているこの五原則は5月のG7サミットに備えてのG7諸国のデジタル・技術相会合での合意事項であった。
したがって、その新技術開発、技術革新の採用の大前提は言うまでも無く、現在世界政治体制上きわめて緊迫している自由民主主義諸国と専制権威主義諸国との対立構造下での技術開発競争を前提にしている。その中でも、特に、「民主主義の発展に反しない」ことを取り上げた理由には、G7諸国の情報空間が今や、専制権威主義諸国をはじめとする諸外国からのプロパガンダや工作情報、偽情報等が氾濫し、混乱を極め、従来、一般市民・主権者の情報源であり、判断基準でもあった、主要なマス・メディアがその混乱に巻き込まれ、権威を失墜し、SNSなどによる情報の大混乱が生じることやその惧れが挙げられる。
何よりも、この「チャットGPT」で顕在化した生成AI問題の根幹は「特定個人の思想、思考によるアルゴリズムで創られた人工物に、第三者である人々の思考や行動が影響を受け、支配される社会の到来を容認するのか?」にある。覇権主義、専制権威主義を排し、自由民主主義を選択している社会は多少の混乱や、統治の非効率性を容認しても、特定個人の思想や思考に縛られない社会の健全性を人類の歴史から学び、それを守りたいのである。
この状況の解決策の一案としては、マス・メディアが社会の情報流通の主導権を握る以前の出版流通体制の再評価を行い、出版に於ける「編集者」の機能、図書館における「司書」の機能を生かして情報混乱の主要な原因ともなっている「フェイク・ニュース」や「プロパガンダ」を排除すべく、それができるように流通する情報を選別・加工して、正常な情報選択を可能にする標識付与や、情報流通への「プラット・フォーム」としての図書館等の再構築を提案したい。ただ、それだけでは現状のデジタル環境下での爆発的なデジタル情報の流通量には対処できない。そこで、直ちに実行可能な一案として、現状のフェーク・ニュースや、プロパガンダの氾濫はある程度は放任せざるを得ないにしても、それと並行して、好む人には、何がフェーク・ニュースで、何がプロパガンダであるかが見極められる情報流通のプラット・フォームを最低限、創る必要があるのではないか。
(5)デジタル技術革新やAI進歩の機会を活用すること。
「チャットGPT」に代表される「生成AI」はデジタル技術革新の、より核心に近く、デジタル技術革新の実現上不可欠であることから、この第五の原則は言わずもがなである。ただここで注意を喚起したいのは、わが国で、デジタル革命が始まったのは昨日・今日のことではなく、すでに前世紀の1970年前後から。「コンピュータ革命」の名のもとに始まっていた。その間にコンピュータ技術も進歩すれば、その応用が深く文化にも浸透するだけでなく、文化そのものを変化させた。即ち、単にコンピュータの応用ではなく「イノヴェーション」が起きたのである。
カリフォルニア大学名誉教授で、図書館情報学が専門のマイク・バックランド博士によれば、図書館は情報技術の進化に連れて、伝統的な紙の本の蔵書から成る図書館から、「機械化図書館」、「デジタル図書館(バックランド博士の表現では”electronic library")」と進化すると言う。(See: バックランド.図書館サービスの再構築. 高山・桂訳.勁草書房, 1994、129p.)機械化図書館とはいわゆる「コンピュータ化された図書館」であり、その図書館は運営やサービスの隅々にまでコンピュータ技術が適用され、業務の生産性は高く、合理化されてはいるが、そのサービスの基本は紙に印刷された本で構成された蔵書にある本を閲覧室で読んでの学習を想定しており、それが伝統的な図書館思想でもある。デジタル図書館はデジタル出版物(紙の出版物のデジタル化された情報資料を含む)をベースに図書館サービスを展開することを意味し、ヴァーチャルな(virtual realityに基づく)方式(リモート・アクセスの活用や、AIの活用等)での図書館サービスを展開して、人間文化に変革をもたらす結果を招来するものであるから、生成AIを応用する図書館サービスは言うまでもなくこの範疇に属する。それ故、人間社会に無害な生成AIは積極的に図書館にも活用されることになるであろう。
このようなデジタル化の影響が高まる中で、生涯学習の拠点であるはずの図書館に取って、何よりも心掛けるべき課題の一つが、全ての図書館利用者を対象に、図書館が提供するデジタル化資料を含む全ての情報資料にアクセス可能とするデジタル・リテラシー教育を始めることではないだろうか。これなくしてはせっかくのデジタル化により実現するイノヴェーションもその恩恵は限られた一部の利用者に限定されたものにならざるを得ない。今こそ図書館はそのデジタル・デバイド対策としてのデジタル・リテラシー教育の実施にその存在感の発揮し、デジタル技術革新の成果の発揚に貢献すべきであろう。
既に国会では生成AIによる偽情報の拡散対策のための議員連盟が立ち上がったようであるし、ビジネスの世界では会社により、生成AIの活用により事務系業務の合理化が図れるとの見通しの下に、事務系職員数の見直しを始めた会社もあるようである。
いずれにせよ、2023年5月の広島におけるG7首脳会合で、AI(人工知能)技術の開発・採用に関して、政治的視点からどのような方針、原則が示されるかが注目される。