No305 chatGPTに関する私の考え方

ここ数ヶ月、chatGPTというものが世間でひどく話題になっています。筆者も実際に使ってみて、その精度の高さに驚いた口です。と同時に、新しい技術が出てきた時によくある「人工知能が世界を支配する」といった見当外れな話も出てきていますので、技術屋の目線での筆者の考え方を表明しようと思います。さて、最初に申し上げておきますが、筆者はAIについてはほぼ素人です。そのため、大ウソを書いている可能性があります。もし、間違いなどありましたらご指摘をいただけますと嬉しいです。また筆者の将来予測はゲタで天気予報する（例えが古いな）程度にしかアテになりませんので、その点も割引いてお読みください。

1. chatGPTとは？

もう今更感がハンパないのですが、chatGPTについて簡単に紹介しておきます。これはGPTと呼ばれる深層学習（これ自体がわかりにく言葉ですね。なんだか睡眠学習みたいだし...）ソフトウェアの応用の一つです。深層学習（ディープラーニングの方が通りがいいかな）では、大量の情報を処理させることで相関関係を学習させます。 GPTでは、これを言語モデルに適用しています。ここでいう「言語」コンピュータサイエンス一分野である「計算論」で使われる専門用語で、一般で言う言語のことではありません。計算論の世界では、個々のデータのことを「アルファベット」それを連結したデータを「文字列」その文字列の集合を「言語」と呼ぶことになっています。日本語や英語の文章はもちろん言語に属しますが、一定のルールに従うものは全て「言語」と呼びます。ですので、モールス信号も言語、タンパク質の配列も言語、山の稜線も言語と言えます。 GPTは自然言語の会話に限らず、言語モデルを利用する様々な応用で使われはじめています。実際にタンパク質の言語を解釈できる「ProtGPT2」というものがあるそうで、chatGPTは第3世代のGPT3をベースに自然言語でのやりとりが行えるように学習をさせたものです。

2. 過去のAIブームと現代

ちょっと話がそれますが、1970年代や80年代にもAIブームというのがありました。当時は「文法を完璧に理解させれば、あらゆる翻訳ができる」と考えられていました。これが「こりゃムリだ」となった事例の一つを紹介しておきます。英語に次のような諺があります。 Time flies like an arrow. これは直訳すると「時は矢のように飛んでいく」で「光陰矢の如し」のことです。ところが、これにはものすごい別解があります。「時バエたちは矢を好む」ここで笑った方は普通の人です。確かに文法解釈は間違っていませんが、明らかに変です。ところがこれって文法的な誤りで説明できないんです。これは80年代あたりに当時のAI研究者が頭をかかえた難問だったそうです。結局、研究をすればするほど「文法だけ理解させたってムリ。その単語の持つ属性や意味を理解させないと...」となり、それを現実的なハードウェアで処理することができずに当時のAIブームは去りました。この単語や文の意味を数値化するための理論がその後にいろいろと出てきます。その一つが上述の言語モデルだったり、「深層学習」だったり「ニューラルネットワーク」だったりします。ものすごく大量のデータで言語モデルを構築させれば、time の次に fliesと来た時のflyが「ハエの複数形」であることはまずなく、「飛ぶ」の三人称単数現在であるとわかります。こうなれば、正しい翻訳が行えるわけです。

3. chatGPT

さて、このchatGPTですが、一度は体験されることを強くオススメします。なかなか立派な回答を返してくれるのに驚かれると思います。　https://chatgpt.org/ このサービスは無料ですが、最初に利用者登録が必要です。実際のやりとりの例を少し紹介します。筆者：　タマネギを育てていたらネギボウズができてしまいました。　これは取った方がいいのかな？ chatGPT：　ネギボウズは、タマネギの花のつぼみのことです。　普通に食べられるわけではないため、タマネギを食べるために育てている場合は、ネギボウズを取り除くことをおすすめします。　しかし、タマネギを観賞用に育てている場合は、花を楽しみたい場合もあるため、そのまま残すこともできます。観賞用にタマネギ育てるかい！など少々間抜けなところはご愛敬として、実に正しい回答です。もう一ついきましょう。（こちらは極めて技術的な質問）筆者：　httpdのログから不正アクセスのログを抜き出したいのですが、　bashのスクリプトを教えてもらえませんか？ chatGPT：　以下は、Apacheのアクセスログから不正アクセスのログを抽出するためのBashスクリプトの例です。　（スクリプト本体は省略）　このスクリプトでは、ApacheのアクセスログファイルのパスをACCESS_LOG変数に設定し、HTTP_STATUS_CODES変数に不正アクセスに該当するHTTPステータスコードを...（以下省略）これもまた実に適切な回答内容でした。

4. chatGPTは何が驚異なのか？

chatGPTがスゴいのはこちらの質問の意図を理解し、それに合った適切な回答を返してくれる点です。 Googleでは単語でしか検索できず、適切なサイトは自力で選ぶ必要がありました。それに対して、chatGPTは自然な問いかけができ、自然な回答を返してくれる点が異なっています。筆者は、Macintosh（マニアックなことを言えばLisaとかALTO）がデビューした時を思い出します。それまでコンピュータと言えば、（普通の人にとって）文字だけの画面にナゾのコマンドを叩くと、ナゾの返答を返すだけの機械でした。ナゾのコマンドとその返答を理解する人だけが使えるナゾの機械でした。それが、マウスで場所をクリックしメニューからコマンドを選べば意図が伝えられるようになりました。 Macintoshの功績は多々ありますが、最大の功績はインターフェースを誰もが使える次元に引き上げたことです。今回のchatGPTにはそれと同じ匂いを感じます。今回のchatGPTの成果を利用すれば、今のSiriやAlexaのような音声認識システムとは全く別次元のインタフェースが実現できるように思います。 chatGPTが驚異的なのはもう一点あります。極端にローコストであることです。この点について、筆者はあまり理解できていないのですが、他社のソフトウェア（エンジン）に比べて１ケタ以上安価に構築できるらしく、同業他社が廃業せざるを得ないレベルなのだそうです。安価であることは技術が受け入れられる最大のポイントになりますので、この点でもchatGPTは驚異的だと言えます。

5. え？chatGPTは人工知能なんでしょ？

それは大きな誤解だと思います。筆者はchatGPTはマンマシンインタフェースを強烈に進化させる技術だと考えています。確かに回答を要約する技術は大したものですが、内容は誰か（人間）が考えた文章の焼き直しに過ぎません。これはあたりまえのことで、chatGPTに自ら考える（新たに意味のあるものを作り出す）能力などないからです。繰り返しになりますが、chatGPTができるのは、「与えられた自然言語の文章を分解して、評価値を得ること」だけです。評価値というのは、一つの値のことではなく、数億種類のパラメタの集合体です。 chatGPTは、全ての文をこの評価値で数値化しています。例えば、上のタマネギの文であれば、園芸、育成、土壌、農業、タマネギ、ネギボウズといったパラメタにはきっと値が付き、政治、天文、ファッション、といったパラメタの値はゼロでしょう。なお、上記のパラメタはわかりやすくするための例です。実際にはパラメタはchatGPTのアルゴリズムで決めるため、人が見てもサッパリわからない付け方になっていることでしょう。筆者が質問した評価値と近い回答を要約して、最も評価値の一致度が高い結果を返しているものと思います。つまり、chatGPTはこちらの質問などちっとも理解していなくて、評価値が近いものを表示しているだけだということです。 chatGPTが何も生み出していないというのはそういう意味です。ですから、chatGPTを人工知能とは呼べないと筆者は考えるわけです。

6. まとめ

chatGPTという会話システムが話題となっています。これは言語モデルを極めて正確にしかも驚くほどローコストで構築したスゴいソフトウェア（エンジン）です。ですが、これには思考能力などありません。ただ単に入力された内容を評価し、評価値（パラメタ群）の近いものを表示しているに過ぎません。ただ、その評価値が恐ろしく精密にできているため、まるで人が回答したかのような適切な内容を返してくれるわけです。その意味でchatGPTは人工知能などではありませんし、chatGPTが世界を支配する可能性もありません。ですが、この応用分野は非常に広範囲にわたります。メーカのサポー