※本稿は、テック系メディアサイト『iX+(イクタス)』からの転載記事です。
ChatGPTの仕組み
人間同士の対話と区別がつかないほど自然で滑らかなやりとりを実現したチャット生成AIが、ChatGPTです。多岐にわたるさまざまなテキストデータを学習したことで、膨大な知識量が格納され、子供向けの物語から披露宴のスピーチ、さらにはコンピュータプログラムまでも生成します。言葉で表現できるほぼ全ての領域において、流暢で卓越した回答を提供する能力は、人間には模倣しがたいレベルであり、汎用AIの実現は急速に進んでいると言われています。
とはいえまだ発展途上の技術であり、さまざまな懸念も指摘されていますが、研究開発が進むことで克服されていく可能性があります。最もよく指摘されるのが、情報検索のような使い方をした際に、必ずしも正しい回答が得られるわけではないという点です。質問に関する知識が学習されてない場合や、学習に利用したデータの偏りによって誤った回答を生成する場合があります。また、何よりも、ユーザーの問いかけの仕方に大きく影響を受けます。ChatGPTは、知識が構造的に整理され正確な情報が引き出される仕組みではないため、むしろデータベースのような検索やカウンセラーのような用途には向かないと考えられます。
仕組みを簡潔に説明すると、ユーザーからの入力文に対して確率的にもっともらしい文を生成しているだけとも言えます。言葉は通常、文法に基づいて単語同士が繋がるものですが、「ある単語の後にはこの単語が来る確率が高い」というように、単語同士の繋がりを確率で表現することも可能です。恐ろしく膨大で多様なテキストデータから単語と単語の関連性を学習すれば、その確率的な結びつきの分布には文法の規則も含まれることになります。ただ単に単語同士の確率を学習しただけでは、ChatGPTのような振る舞いは実現できないと思われるかもしれませんが、膨大なデータを学習することでこれが可能となったのです。
しかし、これだけでは倫理的に問題のある回答をしてしまう可能性があります。そこで、ChatGPTでは確率分布が獲得された後、人手でトレーニングを施すことで、倫理的に受け入れがたい回答が出ないような安全対策が施されているのです。