シュプリンガーネイチャー、初の机械生成书籍を出版
2019年4月、シュプリンガーネイチャーは化学分野において机械生成书籍、を出版しました。これは、急成长を见せるリチウムイオン电池関连の多数の研究论文を横断的に集积した自动要约に基づいて、最新の研究概要を取りまとめたものです。シュプリンガーネイチャーとドイツのフランクフルトにあるゲーテ大学の研究者の协力のもと、1年半の歳月をかけてアルゴリズムが开発されました1) 。
プロジェクト責任者であるシュプリンガーネイチャーのDirector Product & Metadata Management、Henning Schoenenbergerに、機械生成書籍を制作した理由と、今後の学術出版のコンテンツ制作に与える影響について聞きました。
さらに、番外编としてこの机械生成书籍を日本でご绍介した际のお客様からのフィードバックもまとめました。合わせてご覧ください。
1. 機械生成書籍出版の経緯
机械生成书籍について、また、机械生成书籍出版の経纬について説明してください。
机械生成书籍とは、コンピューター処理によって自动的に生成された书籍です。既存のコンテンツやデータリソースに基づいて、アルゴリズムがコンテンツを再构筑したり新たに生成したりします。アルゴリズムは书籍で扱う内容を决める一连のパラメーターに基づいて実行されます。
自然言語生成は急速に進化しており、人工知能関連技術によって、科学的コンテンツ自動生成という有望な可能性が生み出されています。私たちは現在の技術レベルを検証するため、1年半前にゲーテ大学のApplied Computational Linguistics labと共同研究を開始しました。今回、初の機械生成書籍を出版したことで、この分野における一つのマイルストーンに到達したと言えるでしょう。
このプロトタイプの出版を通じて、私たちは机械生成による研究コンテンツの可能性と限界を探ることを目指しています。技术が进歩する中、机械生成コンテンツが学术出版にもたらす可能性、意义、潜在的リスクについて、広く议论を唤起することが主な目的です。潜在的な意义を考虑しながら新たな出版のフレームワークを提供することは、世界的な出版社である私たちの责任だと考えています。こうした议论を行うには今が最适のタイミングでしょう。
2. 機械生成書籍と、人による書籍の違い
机械生成书籍と人间が执笔した书籍にはどのような违いがあるのでしょうか。
今回のプロトタイプは研究者、専门家、学生に情报を伝える新たな方法を模索しています。最新のコンピュータアルゴリズムを用いて、厂辫谤颈苍驳别谤尝颈苍办で閲覧できるシュプリンガーネイチャーの出版物から関连のあるものを选び、トピック顺に并べ替えて、论文の简洁な要约を作成しました。整合性のある章や节に対して类似性に基づくクラスター化処理を行い、最新论文の横断的な自动要约を作成したのです。
人间が执笔する书籍に比べ、机械生成书籍のテキスト作成プロセスははるかに速く、极めて短期间で概要、レビュー、新たな洞察を提供することができます。
3. 機械生成書籍がもたらすベネフィット
化学分野における最新研究の概要はグーグルなどの検索エンジンを利用して入手することもできますが、机械生成书籍は学生と研究者にどのようなメリットがあるのでしょうか。
机械生成书籍は膨大な数の论文から构造化された抄録で、この分野において氾滥している情报を効率的に管理するうえで研究者や学生に役立ててもらうことを目的に作成されています。検索エンジンを利用する际、ユーザーが直面し、解决しなければならない主な课题のひとつが情报の管理です。机械生成书籍であれば、大量の文献を読むことなく、信頼できる要约を得ることができます。また、読者は必要に応じてオリジナルソースのドキュメントを简単に特定?确认し、必要なトピックをさらに详しく调べることもできます。検索エンジンの结果は信頼性のある情报かどうかの判断が难しいですが、机械生成书籍を読めば、シュプリンガーネイチャーのコンテンツプラットフォームである厂辫谤颈苍驳别谤尝颈苍办に掲载されている情报を得ることができますし、これらはすべて科学的な精査に耐えうる信頼性のある情报に限られています。
この新しい技术をさらに応用するための取り组みも进めています。研究件数とデータ量が急速に増える中、研究者がより速く、より完全な形で関连する研究を抽出できるような仕组みを提供できる日も近いかもしれません。
4. 機械生成技術が学術出版プロセスにもたらす影響
机械生成コンテンツは、今后、学术出版のコンテンツ制作プロセスにどのような影响を与えるでしょうか。
将来的にはコンテンツ制作の选択肢が増えると考えています。最初からから最后まで人间の手で创り出されたコンテンツから、人间と机械の両方がさまざまに関与して作られた融合型のテキスト、さらには完全に机械によって生成されたテキストまで、さまざまなタイプが登场するでしょう。学术出版において、研究者は执笔者として今后も重要な役割を果たすと思いますが、多くのコンテンツがアルゴリズムによって生成されるようになれば、研究者の役割は大きく変わる可能性があります。ある意味、机械生成コンテンツの発展は、过去数百年にわたって进められてきた製造业のオートメーション化とさほど変わりはないでしょう。製造业の场合、オートメーション化によって工场労働者が减ると同时に、设计者が増える结果となってきました。现段阶で今后の进展を予想するのは困难ですが、おそらく科学コンテンツ制作においても同様に、执笔者が减ってテキスト设计者が増えていくのではないでしょうか。
シュプリンガーネイチャーは化学分野での経験をもとに、今后、他の分野でもパイロットプロジェクトを立ち上げる计画です。当社初の机械生成书籍は机械生成コンテンツのさらなる発展の基盘となり、学术出版の未来を筑くうえで役立つ贵重な知识やフィードバックをもたらしてくれると思います。
【番外编】今后、机械生成书籍が日本の研究にどのような影响を与えうるのか?
第21回図書館総合展 教育?学術情報オープンサミット2019のフォーラムでは、機械生成書籍が出版された経緯や今後の展開について詳しく紹介された後、研究に与える影響について活発な議論がなされ、主に以下の通りまとめられました。
- 新たなテクノロジーを通して、人间ができる以上の情报量を扱うようになる。また、横断的に効率よく、整理された情报を把握することができるようになる
- 基础研究において、まだ解明すべき问题に活用できる可能性がある
- 研究者の行动の変化が考えられる。効率的な情报収集を通じて、本をいち早い研究成果の発表の场として活用できる可能性がある
- 図书馆が研究者のニーズや动向をより早く把握し、提供すべき情报をより効率よく选択できるようになることで、ファカルティ?リエゾンとしての役割が强化される
参加者の皆様から顶いたご意见や感想を一部ご绍介します。
- 础滨が得意とする分野を知り、活用することで効率化される分野は多くあると思った
- 础滨等の最新技术が学术コミュニティに寄与できる可能性を具体的に挙げており、兴味深かった
- 别叠辞辞办の出版に対する技术的、意识的変化が今后の情报のあり方をどのように変えていくのかを想像することができ、とても兴味深かった
- 研究における叠辞辞办の意义?可能性を明确に説明された
- 情报过多の时代において人の力で情报収集が难しくなっていること、そのために础滨の力を借りるという点に兴味を持った
また図书馆が今后取り组むべきこととして以下のアイデアをお寄せいただきました。
- 1. 研究者のニーズを把握する 2. 最新の技術情報を集め、できる所は取り入れる 3. 技術の活用によって効率化できるところを見極める
- 研究データ管理(オープンサイエンス)、础滨に与えるデータセット情报の评価、选书など
- 研究のライフサイクルに必要な情报を网罗的に収集し整理する
- 研究者のニーズを収集の上、整理しどう研究力强化につなげるかを主导的に検讨推进すること&苍产蝉辫;
- 出された情报の整理、违う角度からの指标の提示など
フォーラムの详しい内容は狈补迟耻谤别ダイジェストのおよび动画2)でご覧いただけます。
1) プレスリリース
2) 動画:第21回図書館総合展 教育?学術情報オープンサミット2019
小泉周氏のインタビューはこちら