みなさん、おはようございます!タカハシ(@ntakahashi0505)です。
こちらの記事は、タカハシが音声メディアVoicyの「スキルアップラジオ」にて放送した内容から、ピックアップしてお届けします!
今回のテーマは、OpenAI「GPT-4」を発表、GPT3.5との違いを解説です。
なお、以下で実際にお聴きいただくこともできます!
では、よろしくお願いいたします!
OpenAI「GPT-4」発表
今日は、ニュースをお伝えします。「OpenAI「GPT-4」発表 精度向上、司法試験で上位10%」この記事です。
これまでChatGPTには言語モデルとしてGPT-3.5が採用されていましたが、その言語モデルの新バージョンが発表されました。
いくつかの素晴らしい機能が紹介されていますが、我々一般のユーザーが現時点で試せるのは一部の機能のみなので注意してください。
マルチモーダル
まず1つ目マルチモーダルです。これは、複数のデータ種別を組み合わせて処理ができるというものです。
これまではテキストだけでしたが、画像を入力要素として与えることができるようになりました。
デモでは、Webサイトの手書きのラフスケッチを画像として与えて、Webサイトを構築するHTMLやJavaScriptのコードを生成して、実際にWebサイトが生成される様子が報じられています。
もっと身近な例でいうと、冷蔵庫の中の写真を撮影して、それを与えることで、料理アイデアを提案してくれるものも紹介されていました。
※画像入力に関しては、現在一部ユーザーのみの限定機能となっています。
入出力できる文字数が8倍
入出力できる文字数が、これまでの8倍になりました。
具体的には2万5000語までの文章を扱えるようになり、大量の長文を入力できるし、長文を生成できます。
性能の向上
3番目は、性能の向上です。
米国の司法試験模擬試験では、上位10%程度の成績で合格したという話です。GPT3.5では下位10%の成績でした。
日本語性能もGPT-4では、英語のGPT-3.5より上回っているという話もありました。
プロンプトインジェクション対策
あと4番目プロンプトインジェクション対策です。これは嘘をついたり、でっちあげたりが少なくなる対策です。
事実に基づいた回答をする確率が40%高まったと言われています。
武器の製造方法など、安全面から許可していない質問に答えてしまうことも8割減ったそうです。
GPT-4を扱う2つの方法
開発者向けには、順次APIを通じた有償提供を開始していくそうです。
ノンプログラマー的には、GPT-4を使う方法は2つあります。
1つは、BingChatです。これまでもGPT-4を使っていたというのがマイクロソフトから正式に発表されています。
あとは有料のChatGPT plus(月額20ドル)です。
※現在、4時間ごとに100件のメッセージを受け取るのが現時点では上限となっています。
GPT-4の機能として力を味わえるところは、性能の向上とプロンプトインジェクション対策の部分のみです。
ただ、精度が上がったというところが注目に値します。
信頼性については100%ではないにせよ、前よりは格段に上がっていることが期待されます。
GPT-4は優秀なアシスタント
GPT-3.5では入社したばかりのバイト君、Webサイトを適当にコピペしてきてねみたいな依頼の仕方でした。
GPT-4になると、あらゆるジャンルの専門性を網羅している優秀なアシスタントがいきなり入ってきて、無限に使える状態です。
うまくほしいものを出させるテクニックが必要になりますが、ここまできたら仕事の切り替えが必要になるかなと感じています。
ひとまずこの仕事はChatGPTに依頼してみようというスタンスで依頼して、上手くいった方法を取り入れていく。そして、今までのやり方を柔軟にアンラーニングしていく必要がありそうです。
また、画像入力・大量文字の入出力も順次オープンになると思うので、そのときにはもう一段ギアが上がるのではないかと思います。
ということで、OpenAI「GPT-4」正式発表というニュースをお伝えしてきました。
GPT-3.5に比べると、性能・信頼性が上がってきています。
僕もGPT-4を触りだしていますので、具体的にどこが変わってきたのか、何か分かればお伝えしていきます。
まとめ
ということで、今日はVoicy「スキルアップラジオ」の放送からOpenAI「GPT-4」を発表、GPT3.5との違いを解説」をお届けしました。
タカハシのVoicyの放送はこちらからお聴きいただけます。
チャンネルのフォロー、コメント、SNSでのシェアなどなど、楽しみにお待ちしております。
では、また。