ここ数年のAI技術の進化は目覚ましいものがあり、その中でも次世代のAI技術として大きな注目を集めているのが、「ジェネレーティブAI」と呼ばれる生成AIの分野です。「ChatGPT」の登場によって、まさにジェネレーティブAIは未踏の領域に入ったと言えるかもしれません。この記事では、ジェネレーティブAIとは何か、どのような歴史をたどり、どんな仕組みになっているのかについて解説します。
ジェネレーティブAI(生成AI)とは?
インプットしたデータをもとに、まったく新しいデータやアイデアを生み出す
ジェネレーティブAI(生成AI)とは、コンピュータが学習したデータをもとに、新たなデータや情報をアウトプットする技術のことです。インプットしたデータをそのまま分析・集計するのではなく、まったく新しいデータやアイデアを生み出すことができるのが、ジェネレーティブAIの大きな特徴です。
【関連記事】これからのマーケティングには生成AIが不可欠!マーケティングの課題とAIによる効率化の事例
【関連記事】画像生成AIでマーケティングが進化する!ディープラーニングによる画像生成の歴史と活用事例
ジェネレーティブAIの歴史
ジェネレーティブAIが、これまでどのようにして進化してきたのか、その軌跡をたどります。生成AIはここ数年で急に脚光を浴び始めたので、歴史が浅いのではと思っている人もいますが、実はジェネレーティブAIには70年に及ぶ長い歴史があります。しかし研究は進んでも、実用化という点ではほど遠く、近年急速にコンピュータが進化したことで、より複雑な生成AIモデルを開発できるようになりました。
1950年代にすでに「AI」の基礎はあった
今日のAI技術の基礎は、すでに1950年代にありました。1950年にイギリスの天才数学者、アラン・チューリングが論文を発表し、機械が人間と同等の知能を持つことが可能かを試す「チューリングテスト」を行ったのです。このテストは、今日もAI研究の重要な指標となっています。その後、1956年のダ-トマス会議を皮切りに、AI研究がスタートしました。
1960年代に生成型AIの研究が本格的に始まる
生成型AIの研究が本格的にスタートしたのは、1960年代に入ってからです。ジョセフ・ワイゼンバウムが、世界初の対話型 AI 、チャットボット「ELIZA(イライザ)」を開発しました。これは、生成型AIの祖先ともいえるものです。人間の心理療法士を模倣して設計しており、ユーザーが入力した情報を解釈するために、事前にルールを定めておき、それに沿った回答をするという単純なプログラムでした。
生成型AIの研究が活発化
それからしばらく停滞期が続いていましたが、1986年に世界で初めてニューラルネットワークを利用した生成型 AI プログラム、「Backpropagation(バックプロパゲーション)」が開発されたことで、AIの研究が再び活発化しました。ニューラルネットワークとは、人間の脳の神経細胞を模倣した計算機の構造のことです。これによって、ネットワークを使ってテキストや画像を生成することができるようになりました。
チェスの大会でAIが人間を破る
1997年には、IBM が開発したスーパーコンピュータ「Deep Blue」が、チェス世界チャンピオンを破るという出来事がありました。今ではAIが人を破るというのは当たり前のように報道されていますが、当時はAI が人間の能力を超えられる証として、世界中のメディアから注目を浴びました。
2000年代に入って機械学習が急速に進化
機械学習が急速に進化したのは、2000年代に入ってからです。2006 年にジェフリー・ヒントンとそのチームが、「深層学習(ディープラーニング)」を提唱した。ディープラーニングの登場はAIの歴史のターニングポイントともなり、音声認識や画像認識、自然言語処理の分野も大きく進歩しました。2012年には、「ディープニューラルネットワーク」を利用した画像認識モデルも開発され、高い精度で画像の識別が可能になりました。
Googleが「トランスフォーマー・モデル」を導入
ディープラーニングの登場とともに、AIの驚異的な進歩を支えてきたのが、2017年にGoogleが導入した「トランスフォーマー・モデル」です。これによって、テキストの内容をより深く理解して生成できるようになり、自然言語処理の技術が急速に進みました。このトランスフォーマー・モデルが成功したことによって、「GPT-3」や「Bard」など、数多くの改良されたジェネレーティブAIが開発され、AI の民主化が大きく進みました。
【参考】ジェネレーティブAIとは
ジェネレーティブAIの仕組み
データの分析は主に「ディープラーニング」の手法を使う
ジェネレーティブAIのデータ分析は、主に「ディープラーニング(深層学習)」という手法を用いて行います。ディープラーニングとは、人間が自然に行うタスクをコンピュータに学習させる、機械学習のひとつです。一般的なデータ分析は、入力データと出力データの関係を直接分析しますが、ディープラーニングの場合はその間に中間層があります。「DNN(ディープニューラルネットワーク/Deep Neural Network)」と呼ばれるもので、ちょうど人間の脳神経のような仕組みになっていて、そこでデータの背景にどんなルールがあるか、一定のパターンはないかといったデータの特徴を抽出します。AIがまるで人間のように考え、新しいアイデアやクリエイティブなものを生み出せるのは、そのためです。
【参考】ディープラーニング(深層学習)
「画像」「テキスト」「動画」「音声」の生成ができる
ジェネレーティブAIは、画像の生成からテキストの生成、動画の生成、音声の生成まで、さまざまな種類のデータを生成することができます。これらの機能を活用することで、業務を効率化したり、新しいアイデアを生み出すなど、ビジネスや私生活に活かすことができます。
・画像の生成
画像生成AIは、「Stable Diffusion」や「Midjourney」などが世界的に有名です。テキストでどんな画像が欲しいかを指示するだけで、そのイメージに近い画像を自動生成することができます。たとえばホームぺージに載せたいイメージ画像を、画像生成AIに任せることで、クリエイティブな作業時間を短縮することができます。
・テキストの生成
「ChatGPT」や「Bard」に代表されるのが、テキスト生成AIです。機械学習と自然言語処理技術を使って、人間が理解できる自然なテキストを生成することができます。Web上のテキストボックスに質問や要望(プロンプト)を入力すると、AIがその内容を解析して、適切な答えをアウトプットしてくれるので、「キャンペーンのアイデアが思い浮かばない」というときなどに最適です。
・動画の生成
動画生成AIは、生成AIの中でも開発の難易度が高く、現在は数秒ほどの動画を生成できるレベルに留まっています。しかし、2023年3月には「Gen-2」と呼ばれる動画生成AIも登場し、盛り上がりを見せています。今後の技術革新に期待したいところです。
・音声の生成
音声やテキストを入力することで、新たな音声を生成することができるのが、音声生成AIです。たとえば一人の声をコンピュータに大量に学習させておくと、話してほしいことをテキストで入力するだけで、その人とまったく同じ声質で自由に音声をアウトプットすることができます。AIスピーカーや、電車の車内アナウンス、音声翻訳機などにも、音声生成AIが使われています。
【参考】生成AI(ジェネレーティブAI)とは?仕組みやChatGPTとの関連性を解説
進化を続けるジェネレーティブAI
ジェネレーティブAIは、1960年代から現在までの間に、大きな進歩を遂げてきました。そしていまも、着々と進化を続けています。量子コンピュータが実用化されれば、さらに飛躍的に技術が向上することもあり得るでしょう。新たなアルゴリズムの開発によって、いままで思いもつかなかった技術が生まれるかもしれません。今後のジェネレーティブAIの成長に、期待したいものです。