話題沸騰!GPTの歴史とChatGPTの可能性、そして利用時に気をつけるべきこととは

2022年12月に登場したChatGPTは、最新のAI(人工知能)が手軽に使えるチャットサービスです。まるで人間と対話しているかのような自然なやり取りができることから話題となり、公開からわずか2ヶ月でユーザー数1億人を超えています。開発元のOpenAIに対し巨額の投資を行ったマイクロソフトが、自社検索エンジンBingにその技術を搭載するなど注目を集めています。一方で、ChatGPTが生成する文章は正確性が常に保証されるわけではなく、また不適切な文章が生成されてしまう可能性もあります。この記事ではChatGPTが生まれるまでの経緯と活用事例、そしてChatGPTを利用する際の注意事項について解説します。

GPTとは?OpenAIが開発した大規模言語モデル

ChatGPTのGPTとは、サンフランシスコの人工知能研究所OpenAIが最初に開発した自然言語処理(NLP)技術のことです。OpenAIは2015年にイーロン・マスク氏らアメリカの企業家や投資家など、有力な人物が創業に関わって設立されました。2017年にグーグルが発表したトランスフォーマーと呼ばれるディープラーニング(深層学習)の手法を用いて、既存の技術を改良したものがGPTです。  

大規模言語モデル(LLM)とは

大規模言語モデル(Large Language Model, LLM)とは、自然言語処理(NLP)や人工知能(AI)の分野で使用される強力なモデルのことです。LLMは、巨大なデータセットを使用してトレーニングされ、膨大な量のテキストデータを学習し、言語の特徴や文脈を把握する能力を持っています。

LLMは、文章生成、翻訳、質問応答、要約、文法チェックなどのタスクに利用されます。また、自然な対話や文章生成においても高い性能を発揮し、人間が書いているかのような表現や文体で文章を生成することが可能です。

【参照】atmarkIT「AI・機械学習の用語辞典」

GPTとは

GPTは2018年にOpenAIが発表した初期段階のモデルで、Generative Pre-trained Transformerを略したものです。BookCorpusという名の、さまざまなジャンル約7,000冊を含む書籍データセットで事前学習した後、ファインチューニングと呼ばれるタスクに適した処理をしていく2段階モデルが特徴といえます。GPTは2つの構造を持つトランスフォーマーのデコーダー部分だけを使う、パラメータ数1億1,700万個の大規模言語モデル(LLM)です。 

GPTの歴史

GPTリリースの1年後、2019年にGPT-2が発表されました。GPT-2ではより多くのテキストデータから事前学習を行い、パラメータ数を15億個と大幅に増やします。さまざまなタスクにおいて事前学習したモデルだけで高い性能を示し、常識的な推論の出力を得られるまでになりました。2020年に発表されたGPT-3は、45TBもの膨大なテキストデータを学習に用いています。パラメータ数も1,750億個と巨大な規模となり、アルゴリズムを高速化させることで性能が向上しました。ほとんどのタスク処理において人間と同等以上の能力を発揮し、大きなブレークスルーとなりました。2022年にGPT-3.5にあたるChatGPT、そして2023年にGPT-4が発表されています。

GPT-3の特徴と活用事例

GPT-3はインターネット上のさまざまなテキストデータを学習します。文章の生成や要約、校正、プログラミング、デザイン、物語の生成、機械翻訳が可能です。さらにどのような文章や単語が続くのか高い精度で予測し、より人間らしい文章が生成できるようになりました。 

GPT-3の特徴

GPT-3は桁違いに膨大なテキストデータを用いて学習することで、ファインチューニングを必要としない言語モデルを作り出しています。また少ない事例で学習させる方法、Few-shot Learningを使い、タスクごとに行っていたパラメータの更新をせずに多くの処理ができるという特徴があります。GPT-3はこれらの特徴のおかげで、意味の通った自然な文章生成ができるのです。 

GPT-3の活用例

2020年マイクロソフト社がGPT-3の独占ライセンスを取得し、同社のクラウドサービスMicrosoft Azure上で利用できるAPI(申請制)として公開しました。GTP-3を使ったサービス事例として、アプリケーションの構築を支援するプラットフォームMicrosoft Power Apps、顧客からのフィードバックの内容を確かめるツールViable、仮想人物と現実のユーザーとの自然な会話が作れるシステムFable Studioなどがあります。

GPT-3は汎用性が高く、既に多くのアプリケーションに使われています。その一方で、攻撃的な言葉を含む文章や、フェイクニュースを生成してしまう可能性があるといった問題点もあります。 

自然な会話を実現!ChatGPTの可能性

OpenAIはGPT-3での問題を解決するために、人間のフィードバックを学習させ、問題のない回答を返せるようにしたInstructGPTというモデルを考え出しました。これを対話型に特化して、コアエンジンをGPT-3.5にしたチャットボットがChatGPTです。AIの学習も兼ねて無料で開放していること、ユーザーからの曖昧な質問にも意味や文脈を踏まえた受け答えができることから大きな話題となりました。 

ChatGPTの特徴

最大の特徴は会話形式でやり取りができるということです。自然な応答ができるほか、それ以前の会話の内容を踏まえた回答をすることができます。また倫理に反した質問への回答に制限を加えているため、より安全に利用することができます。パラメータ数はGPT-3の2倍、3,550億個もあります。無料版ではGPT-3.5モデル、有料版ChatGPT Plusでは最新のGPT-4モデルが利用可能です。 

ChatGPTの活用方法

ChatGPTを活用できる分野は多岐にわたり、私たちの仕事や生活に大きな影響を及ぼす可能性があるものとして注目を集めています。ChatGPTは情報収集、文章の要約、ブログ記事の作成、作詞、小説や脚本を書くことなどさまざまな用途で利用できます。また企業のカスタマーサポートの自動化、データ分析、マーケティング戦略など使い方によっては作業時間の短縮、効率化のメリットが期待できるでしょう。カスタマーサービスにおいては、自動応答やチャットボットの作成に役立てることができます。またFAQなどのナレッジベースの構築にも有効です。

【関連記事】チャットボットでコンタクトセンター業務を効率化!~チャットxロボット~

ChatGPT利用時に気をつけるべきこと

ChatGPTはその精度の高さからあまりに自然な文章を生成するため、フェイク記事に悪用される懸念があります。また著作権侵害や情報流出のリスクもあるため、利用する際には十分注意が必要です。 

情報の正確性

ChatGPTは情報収集を目的として作られたものではありません。そのためChatGPTが答えられるのは学習データから推論できる範囲の質問に限られます。またChatGPTは2021年9月以降の出来事を学習していないため、それ以降の出来事について正確に回答することはできません。

さらに、ChatGPTはハルシネーション(幻覚)と呼ばれる「本当っぽい嘘」をついてしまうことが明らかになっています。そのためChatGPTの出力はそのまま信用せず、内容に誤りがないかどうかを確認する必要があります。

【参照】日経XTECH「チャットボットAIの返答は全て「幻覚」、最大の難関はハルシネーションの善悪問題」

倫理と法規制の問題

ChatGPTは大量のテキストデータから学習しており、その中には偏見や不適切な内容が含まれている可能性があります。その結果、AIが不適切なコメントを生成してしまうリスクが存在します。これは企業の評価や信頼性に悪影響を及ぼす可能性があります。OpenAIは人間の倫理や価値観に合致するようなモデルの調整を進めていますが、それでもなおユーザーはAIが生成する出力に対して注意を払い、そのリスクを理解した上で利用する必要があります。

さらに、AIに関する法規制は国や地域により大きく異なり、また日々議論と改訂が進行中です。そのため、AIを活用する企業は、AIに関する法規制の最新情報を把握し、それに従った対応が求められます。

【関連記事】AIが人を差別する?AI倫理の課題、そしてAIに善悪の判断はできるのか

情報漏えいのリスク

ChatGPTは、ユーザーが入力した情報を学習データとして利用しています。2023年4月、OpenAIは対話履歴を削除できる設定を追加すると発表しましたが、個人情報や会社の機密情報などを安易に入力しないよう注意しましょう。 

ChatGPTの可能性に注目!

ChatGPTは、最先端のAI技術を利用したサービスとして、多くのユーザーから支持を受けています。その速度と自然な文章生成能力により、私たちの業務や日常生活の煩雑な作業を効率化し、新たな価値を創造できると期待されています。しかし、正確性の保証ができないことや、見分けが難しい「もっともらしい嘘」を生成する可能性など、いくつかの弱点も存在します。そのため、使い方を誤ると思いがけない問題を引き起こす可能性があります。最新のテクノロジーをどう活かすのか、それもまた今後の課題となっていくでしょう。 


この記事を書いた人

ビジネス・テクノロジスト 貝田龍太