2023年2月22日
「新しいBing」や「Generative AI」が旧来型検索やクリエイターエコノミーに与える影響とかを考えてみた(ChatGPT)
「ChatGPT」や「新しい Bing」などの「AI チャットボット」や、いわゆる「Generative AI(生成系AI)」について、WEBサイトの運営者である私の立場から、今(2023年2月時点)、感じていることを書き散らかしておきます。
中でも特に、「旧来型検索」サービスを脅かすのではないか、と世間で騒がれる「新しい Bing」を念頭に、クリエイターエコノミーへの影響なども含め、思いを巡らせていきます。
考えが広範囲に及んでしまったため、今回は箇条書きです。よろしくどうぞ。
(※ 書き溜めているうちに実現してしまったこともありますが、そのまま公開します。)
- (現時点のオープンドメインを対象とした)AI チャットボットは、人間が事実確認や修正を行う前提のツール。
- 現状でも、整った文章の作成やリライト、文章の概要把握、要約、また、特定分野における要素の網羅性の確認補助ツールとして使える場面がある
- アイディアプロセッサや、プログラミングのサンプルコード作成にも使えるケースはある
- 言語学習やフィクションのライティングなどには特に向いているかもしれない。ある種の生産性ツールという位置づけ
- 現時点の AI チャットボットは、「事実からなる学習データセットからでも誤った情報を出力する可能性がある」という、倫理上の問題を抱えている
- 中期的に、AI チャットボットは、(大人の事情から)センシティブな分野では回答できない場面が増え、至るところで中庸な回答に終始するようになる可能性がある。そうなると、飽きられてしまうかもしれない
- 恣意性のあるフィードバックや学習データセットによる「AI 汚染」が広まる懸念がある
- さらには、AI が出力する偽情報を AI が学習してしまう、悪いループが発生する懸念もある
- AI から学習データセットとして認知されるコンテンツを所有しているかどうか、で、ネット上での新たな影響力の格差が生まれる可能性がある
- 回答対象を既知のドメイン知識に絞ることで、AI の嘘つきぶりを改善するアプローチはありうる。ただし、回答率は下がる
- 少なくとも、「AIチャットボット」+「旧来型検索」へ投げられるクエリの総量は、半年前の「旧来型検索」のクエリ総量より増加する。また、これにより、スマホ・PC利用のアイボールシェアの内、この分野が占める割合は増加する
- 当面の間は、「新しい Bing」のクエリ総量が増えれば、裏付け取り目的から、Google 検索のクエリ数も増えるだろう
- ただしその場合、「情報探索」のファサードとして Google でなく、Bing が認知・選択された格好となる。これは、Google にとってブランド毀損につながる問題。先のクエリ数の増加も Bing >> Google となる
- 裏付け取りのため、Bing の旧来型検索を使うユーザーは、その精度の悪さに驚くだろう。一方で、普段と異なる検索結果を楽しむ時期も少しだけあるかもしれない
- Google が AI チャットボットを現在の検索窓に統合するなら、慎重に UI を設計しなければならない。失敗すれば、「旧来型検索」もろともユーザーの信頼を大きく損ね、かなりの問題となるだろう。現在の「新しい Bing」のインターフェイスは、(Bing の旧来型検索機能がユーザーからあまり期待されていないことも踏まえた上での)1つの落とし所となっている。
- AI チャットボット、あるいはその利用を契機として生み出される旧来型検索クエリは、WEBサイトにとって新規流入増加要因の1つとなり、今まで参照されなかったコンテンツが参照されるようになる。ライトなコンテンツほど増分が多そう
- ディスプレイ広告の単価に効く要因は UU >> PV なので、短期的、かつ、単純に考えれば、サイト運営者視点の単価面ではポジティブ要因。(中期的にはネガティブとなるシナリオはありうる)
- しかし、ディスプレイ広告市場は Google 一強ではなくなりつつある状況。Google の業績悪化は少なくとも AFC の分配悪化に繋がりやすいため、他社広告の売上比率が低いサイトは悪化要因の方が強く出るだろう。緩和効果も多くはなさそう
- 広告出稿側の動きは、未来を決める重要な要素。AI チャットボットとの会話から直接コンバージョンする率が高ければ、全てを持っていかれる可能性はある。ただ、現状、動画であれなんであれ、消費者は裏取りしてからコンバージョンするケースが少なくない。そして、AI チャットボットの回答の信頼性は現時点でさほど高くない
- もし、この流れが変わってテキスト媒体への広告出稿が大きく減少する場合、AI がどのように学習データセットを確保するのか、どのようにエコシステムを維持するのか、という問題が出てくる。将来、AI チャットボットが広く使われるようになるなら、後述のコンテンツクリエイターの権利保護問題と絡めて、収益分配の話が持ち上がるかもしれない
- 少し逸れるが、そういった環境下に置かれるテキスト媒体側は、対策として広告収益に依らない運営を模索するようになるかもしれない。それは、Brave Rewards のような投げ銭・チップかもしれないし、個人なら、note の有料記事などへの移行もあるだろう。媒体外収益があるオウンドメディアは金銭面で強いかもしれないが、AI チャットボットにより自社サイトへの誘導が減るならそこは問題視されるだろう。無いシナリオとは思うが、コンテンツに無料でフルアクセスできる文化自体が変容する可能性だってないわけじゃない
- AI チャットボットと会話をしていると、時に、AI とのチャットに耽ってしまうことがある。対話型 AI がアイボールシェアを奪う対象は、乾いたテキスト媒体だけでなく、画面の向こうに人の顔が見えるところの可能性もある
- 「Generative AI」による「AI 生成コンテンツ」は、現時点では、品質面でさほど驚異とは感じない。昨年から AI ライティングツールを導入しているが、正直、ゼロから書いたほうが早い。ただ、アイディア出しや、推敲・校正、抑えるべき要素の網羅性確認には役立つ印象
- 「Generative AI」は、創作活動をする人にとって、品質面での足切りラインとして意識されるだろう。例えば、文才のない人が、敢えて「Generative AI」が得意とするコタツ記事を、ゼロから人手で書く必要性は薄い。少なくとも書き手はそう判断するようになるだろう
- 読者からすれば、無料で読めるテキストの品質の底上げにはなるため、(それが楽しい世界かどうかは不明も)少なくとも、読むに耐えない文章に触れる機会は減るだろう。これは、テキスト媒体全体の品質向上には寄与するだろう
- 写真・図がなければ理解できない文章や、写真を多用する体験談・ローカルレポート的なコンテンツは、権利上の問題から AI による侵食は現時点では少なそう。ただし、(人が制作する)動画コンテンツとの競合はある
- コンテンツクリエイターの権利保護問題。仮に、将来、自分のコンテンツを AI の学習データセットとして利用されない権利が(法的にも技術的にも)担保されるようになったとしても、権利関係に無頓着な人間が(場合によってはAIライティングツールを使って)リライトした類似コンテンツが学習データセットとして利用されることにより、規制の実効性は損なわれる。テキスト媒体を中心に権利保護の声が上がったとしても、大きなうねりになることはない
- 最終的には、利用者が投下した時間・労力に見合った結果を得られるか、が問題。現状の AI チャットボットが、「正しい学習データセットからでもウソの情報を生成する」技術的な問題を抱えていること、そして、その解消はオープンドメインでは技術的難易度が高いとみられること、また、学習データセット自体にも「事実でない情報」が含まれること、そして AI チャットボットの出力からは「事実でない情報」の背景が(出典を参照しない限り)伺い知れないことは問題。
- 「旧来型検索」の検索結果を例に取ると、「事実でない情報=(役に立たない)ウソ」とは必ずしも限らない。古い情報や、外れた未来予測の記述を未来から見た場合など、様々。古い情報から段階的に新情報へ渡り歩きながら探索する、などのユースケースもあり、一概に古い情報が役に立っていないわけでもない。
- 旧来型検索と AI チャットボットの良いとこ取りができる立ち位置にいるのは OpenAI / Microsoft よりも Google。ただし、具体的な製品が出てきて、市場から評価されなければ意味はない
- Google の弱点は規模の大きさ。想定ユーザー数が桁違いに多いため、計算機資源の浪費を嫌う傾向がある。計算機資源の最適化が進みすぎている事や、また、計算機資源の消費に見合うだけの売上増加が見込めるか、という問題も出てきそう
- 多くの人がAIを意識している、というだけで世界はもう変わっている
- Google 検索を使いこなせなくても、チャットボットとなら会話できる層はいる
→ Googleの検索窓に疑問文を入力する人は少なくない
→ その手の人には、回答の信頼性がより重要となりそう。ましてや、Microsoft のような大手の名のもとに放り出す回答ならなおさら - Google は、すでにクローズド AI ベースで長年ビジネスをしてきた会社
→ かなり以前から、「我々の AI は他社とは違う」と標榜。推論性能の違い
→ そこそこ前から、広告クリエイティブの自動生成・最適化なども実運用に載せている。AI はマーケティング分野への応用が儲かる、という判断 - 方針の違いは大きい。Google はクローズド AI。OpenAI は AI をオープン活用
→ Google から OpenAI へと AI 技術者が流出 - GPT-3 / GPT-4 の推論性能はかなり高い
→ Google の技術的優位性が揺らぐ、との見方はある意味正しい - Google は、ユーザーのコンテキストと、そこに役立つ情報・そうでない情報を見分ける情報にリーチできる
→ チャットボットとの連携でプロダクトとしての質を上げられるか - 不十分・不正確な情報や認知は、「Personal Agency」における重要な1要素である「先見性」に悪影響を及ぼし、(その人が自分の人生をコントロールできる能力の阻害因子となるため)人生の幸福度を下げることに繋がる。だから、賢い人ほど、嘘や怪しい情報に敏感であるし、逆に、先見性があり、未来を言い当てる人には一目置いたり、場合によっては神聖視することすらある。また、ある時点において事実とされていない情報を見て、これは古い情報だ、とか、悪意ある嘘であるとか、純粋に間違っていると判断したり、また、時にはフィクションとして楽しんだり、あるいは、未だ証明されていないだけで将来事実として知られるようになるだろう、と推測したりもする。AI チャットボットは、事実でない幻影を返すにせよ、我々ホモサピが持つそういった「事実でない情報でも、その位置づけを自分なりに解釈する」特性を活かせる形で結果を出力できるようになると、もっとうまくやれるようになるのかもしれない。
- 我々は誤りやフィクションを楽しんだり、そこからすら何かを学べる生き物だ。AI チャットボットや Generative AI は、どうであれ、道具として定着し、その性能を高めていくだろう。我々は恐らく、これらの新しい道具に正しさだけを求めていない。インスピレーションを得たり、意外性だって貪欲に利活用する。なんなら、「何でも答えます。ただし嘘かもしれません」の方がむしろよく利用されるかもしれない。そこに対して、広告出稿側がどう出るかは、気になる所だけれども
- 回答の信頼性向上だけにフォーカスするなら、特定のドメイン知識に絞った特化型 AI チャットボットがたくさん作られて、なんなら各社・各個人が自分用 AI をそれぞれ使うようになる未来が先で、オープンドメイン型 AI チャットボットの信頼性向上はその後を追う形になるかもしれない
- そう考えると、権利の問題さえなければ、実は Kindle の書籍データを持っている Amazon が面白い立ち位置にいるのかもしれない。Humata.ai みたいな感じのそのまた先の世界。書籍を読むのではなく、書籍に聞く。まるでファンタジーのような世界観。その際、権利者に利益還元される仕組みがあればコンテンツクリエイターは救われるだろうが、案外、その世界線は遠い気がする
- コンテンツ評価の基準は恐らく変わる。ページビュー、再生数、滞在時間、検索者ニーズとの適合性、という現在の評価基準に対し、AI との対話での被参照数という重めの要素が加わるだろう。論文の被引用数のように
- もう、難しいコトを分かりやすく書く必要性は薄まりつつあるのかもしれない。複雑な考えを複雑なまま書いても、それを読み解いてくれるツールがあるのだから。平易にリライトする中で失われてしまう情報は少なくないわけだし。そしてそれは、AI が見る「幻影」と同根なのかもしれない
- AI チャットボットの普及に伴ってテキスト媒体が被る影響は、分野によって大きな差が出るかもしれない。例えば、「おすすめの高還元率クレカを教えて」という質問文は、技術サポートに製品トラブルの対処を求める文章と比べ、かなり簡単に書ける。手軽に質問文を書けて、満足な回答が得られる(回答が正確、あるいは、回答の正確性が求められない)領域なら、AI チャットボットに出典サイトとして提示されたとしても、滞在時間は(従来型検索と比べて)減少するだろう
- 結局、立ち返る先は「N=1」なコンテンツなのかもしれない、と思ったりもするも、人間は GAI ほど versatile ではないので、何かあったらまず、最初に思い浮かぶのは、やはり「AI チャットボット」という話になるかもしれない。そして、「この件、あの人ならどう考えるだろう」と、顔を思い浮かべてもらっていた人ほど、AI の影響を受けやすいかも。それもこれも、「AI チャットボット」の有益性が認められ、継続利用されることが前提にはなるけれども
- と、まぁ、人間もかように「(少なくとも現時点では)事実でないこと」を大量に書く生き物なわけであります