生成AI 日本は機械学習パラダイス 著作権の「緩さ」が「強さ」になるかも
話題の人工知能、生成AIの気鋭が日本に集まっています。
世界の最先端の研究者が日本に拠点
まず2023年4月 OpenAIのサム・アルトマンCEOは日本にオフィスを開設すると発表しました。OpenAIは2022年11月に公開した人工知能チャットボット「ChatGPT」を開発し、世界の注目を浴びている会社です。アルトマンさんは岸田首相と会い、日本政府と協力してChatGPTのユーザーのプライバシーや安全を守ると確約しましたが、日本のオフィスを通じて優秀な人材を集め、AIモデルの進化を目指すそうです。
米グーグル出身の著名な人工知能(AI)研究者らも、東京都内を拠点に生成AIの開発企業を設立するそうです。会社名は「Sakana(サカナ)AI」で、日本語の魚からつけたそうです。設立したのはライオン・ジョーンズさんとデビッド・ハさんの2人。ジョーンズさんは2017年にグーグルが発表した深層学習モデル「トランスフォーマー」に関する論文の共同執筆者の一人で、このモデルは米オープンAIの対話式AI「Chat(チャット)GPT」をはじめ、多くの生成AIの開発に用いられています。
OpenAIもSakanaも日本での人材確保が狙いのようです。米国などは過熱するAIブームによって人材の争奪戦が激しく、研究開発に支障をきたしているようです。AIの研究開発では出遅れている日本は、ようやく生成AIを巡る話題や企業の研究も本格化し始めました。世界最先端の人工知能研究者の目から見れば、多くの宝が眠っている山に映っているのでしょう。
新聞協会などは著作権保護を求める
もっとも、生成AIは、多くの文献や論文を学習して質問者に対する「回答」を制作するため、著作権の侵害が懸念されています。先行する米国ではハリウッドの脚本家や製作者らが映画などのシナリオ作りなどの仕事を奪うとして抗議行動が広がっており、人間と人工知能の衝突が次第に顕在化し始めています。
日本でも日本新聞協会など4団体が生成AIの活用について「著作権の保護に関する検討が不十分な現状を大いに危惧する」とした共同声明を発表しました。声明を出したのは日本雑誌協会、日本写真著作権協会、日本書籍出版協会、日本新聞協会の4団体。
声明では、日本の著作権法では生成AIによる学習から記事や写真などの著作物が守られていないことを問題視。生成AIが著作物を学習しても権利者に対価が還元されないうえ、権利侵害するようなコンテンツが生成・拡散される可能性があり「技術の進化に合わせた著作権保護策があらためて検討されるべきだ」と法改正を念頭に要請しています。
著作権の保護はとても大事です。ところが、冒頭に紹介したOpenAIやSAKANAなど世界最先端の研究者が日本に拠点を持つきっかけは、生成AIに関する著作権の「緩さ」にあるようです。
「日本は世界で一番、明確かつ広く、自由」
慶應義塾大学が発行する三田評論6月号の「AIと知的財産権」特集で座談会でこんな記述がありました。奥邨弘司・慶應義塾大学大学院法務研究科教授が以下の通り、語っています。長くなりますが、引用します。
日本ではもともとテキストマイニング、データマイニングのための権利制限規定がありました。辞書を作る際とか、写真の顔認識技術を開発したりする際などの情報解析のためであれば、必要な範囲で他人の著作物をコンピューターで無断で利用できるという規定です。
この規定そのままで、AIの深層学習に適用できるかについてはいろいろ議論があったのですが、平成30年(著作権法平成30年改正)に、機械学習全般を含む情報解析に際して、必要な範囲で他人の著作物を自由に利用できるという規定が整備されました。
そのため、日本では現在、AIに機械学習をさせるためであれば、ネット上のものも書籍も、入力=複製することについては著作権法上問題がないという状態になっています。そういう点から、日本は「機械学習パラダイス」とも言われ、世界で一番、明確かつ広く、機械学習に関して著作物の自由な利用を認めていると言われます。
ただ、以上は学習過程の話でして、生成過程を経て、今、852話さんがおっしゃったように、既存の作品とよく似たものがAIから出力されるケースについては、別の議論となります。
この発言を受けて、君嶋祐子慶應義塾大学法学部教授が次のように説明しました。
OpenAIのCEO、サム・アルトマンさんが来日され、日本にオフィスをつくりたいと宣言された理由の1つは、日本の著作権法が、機械学習について制限規定をきっちり設けているのでやりやすいからと言われています。つまり、訴訟リスクを減らせるという企業のメリットがあるのかと思います。平成30年改正がこういった事態を予測して立法されたとすれば、素晴らしいことです。
しかし、そうは言っても、データとして入れ込むなら何でもいいということではなく、著作権の制限の範囲内として許されるということです。著作権には複製権や公衆送信権等、様々な権利が含まれていますが、この制限規定はあらゆる著作権の行使に関して、原則として権利侵害にならない場合を制限列挙しています。同時に、著作権者の利益を不当に害するものであっては駄目だという例外も規定しています。
奥邨、君嶋両教授のお話を読むと、OpenAI 、Sakanaが実際に日本へ進出した理由が納得しました。当初、予想もしなかった結果が待ち受けていたともいえますが、このまま日本の「機械学習パラダイス」を守り続けた方が、日本の人工知能研究と事業化に大きな貢献が期待できる気がします。後でChatGPTに質問した方が良いのでしょうか。