この記事は、GPT-4の特徴や性能、利用方法などについてChatGPTとBingAIを使ってまとました。表現上、一部の文言はリライトしています。記述に関してはBingAIでGPT-4の情報を集めて、ChatGPTで文を整えたり、要約したりしました。
GPT-4とは
GPT-4は、OpenAIが開発した次世代の大規模言語モデルです。GPT-3やChatGPTに比べて、精度や推論能力や創造性が向上しており、多様なタスクに対応できます。また、テキストだけでなく画像も入力として受け付けることができるマルチモーダルなモデルです。
GPT-4の特徴
マルチモーダルモデルでは、テキストだけでなく画像も入力として受け付けることが可能です。これにより、画像からキャプションや分類や分析を生成することができます。また、扱えるテキストの量が大幅に増え、約25,000ワードまでの長い文章やドキュメントを入力として受け付けることができます。
GPT-4は、専門的・学術的な試験において人間レベル以上のパフォーマンスを発揮し、司法試験などで受験者の上位10%に入るスコアを記録しています。また、より創造的かつ微妙な指示を処理することができ、歌詞や脚本などのクリエイティブな作品を生成したり、ユーザーのライティングスタイルを学習することができます。
GPT-4は、有害なアドバイスや脆弱性のあるコード、不正確な情報については拒否するようにトレーニングされており、安全性・事実性を重視しています。内部・外部の事実性評価でも、GPT-3.5よりも高いスコアを記録しています。
以下に特徴をまとめました。
- 100兆個のパラメータを持ち、ChatGPTよりも大規模で高性能な言語モデルです。
- テキストだけでなく画像も入力として受け付けることができます。画像を見てコメントしたり、レシピを提案したりすることができます。
- 事実性や安全性や倫理性に配慮して開発されており、不正確な情報や有害なアドバイスを回避する能力が高くなっています。人間からのフィードバックを活用して品質を向上させています。
- 司法試験や数学オリンピックなどの難易度の高いテストで高いスコアを記録したり、ラフなスケッチからウェブサイトを生成したり、税務計算を行ったりすることができます。
- 主要なプログラミング言語はすべて習得しており、自然言語の指示からコードを書くことも、コードを理解して挙動を答えることも可能です。
- AからZまでアルファベット順に単語を使ってシンデレラのあらすじを説明するなど、創造的で面白い文章を生成することができます。
GPT-4の性能
GPT-4は、多くの専門的・学術的なベンチマークで人間レベルのパフォーマンスを発揮するとされています。例えば、司法試験や大学入試共通テストにあたるSATなど、多数の試験において、受験者の上位10%内など、人間を超える結果を出したと報告されています。
また、GPT-4は、テキストだけでなく画像の入力も受け付けることができ、画像からキャプションや分類や分析を生成することができます。例えば、「この画像に合ったキャプションを考えてください」という指示に対して、「A young woman is holding a microphone and singing on a stage. She is wearing a red dress and has a smile on her face. She looks confident and happy.」(若い女性がマイクを持ち、ステージで歌っています。彼女は赤いドレスを着ていて、顔に微笑みを浮かべています。彼女は自信に満ち溢れ、幸せそうに見える 翻訳 DEEPL)
という回答を生成することができます。
ChatGPTとの比較
項目 | GPT-4 | ChatGPT |
パラメータ数 | 100兆個 | 175億個 |
入力タイプ | テキスト、画像 | テキストのみ |
出力タイプ | テキスト、動画(予定 | テキスト、コード |
タスク対応範囲 | 広範囲(司法試験、生物学オリンピック、作曲、脚本など) | 狭範囲(会話型テキスト生成) |
安全性・整合性 | 高い(不許可コンテンツの応答率が82%低く、事実に基づいた回答を出す確率が40%高い) | 低い(不許可コンテンツの応答率が高く、事実に基づかない回答を出す確率が高い) |
項目 | GPT-4 | ChatGPT |
---|---|---|
モデルの種類 | マルチモーダルモデル(テキストと画像の入力を受け付ける) | テキストベースの言語モデル |
扱えるテキストの量 | 32,768トークン(約25,000ワード) | 2,048トークン(約1,500ワード) |
推論能力 | 専門的・学術的な試験で人間レベル以上のパフォーマンスを発揮 | 現実的なシナリオでは人間レベルに近いパフォーマンスを発揮 |
利用方法 | ChatGPT PlusやAPI経由で利用可能。一部のパートナーサービスでも利用可能 | ChatGPTやAPI経由で利用可能。一部のパートナーサービスでも利用可能 |
SQuAD
SQuADは、自然言語理解(NLU)タスクのための評価基準です。Wikipediaの記事から抜粋された文章に対して質問をするという形式で、正しい答えを文章中から抽出する能力が測定されます。各質問では0から100までの正答率(exact match)とF1スコアが測定されます。
バージョン | GPT-3 | ChatGPT | GPT-4 |
---|---|---|---|
1.1 | 86.8/93.2 (EM/F1) | 80.8/88.5 (EM/F1) | 90.5/95.6 (EM/F1) |
2.0 | 76.6/83.9 (EM/F1) | 70.3/79.2 (EM/F1) | 81.7/87.9 (EM/F1) |
GPT-4の利用方法
GPT-4は、多様な用途に利用できるマルチモーダルモデルです。GPT-4の利用方法には、以下のようなものがあります。
ChatGPT Plus:月額20ドルで利用できる有料版のChatGPTです。GPT-4は、テキストと画像の両方を入力として受け付け、キャプションや分類、分析を生成することができます。
API:OpenAIが提供するAPI経由で、GPT-4が利用できます。ただし、料金や利用条件はまだ発表されていません。
パートナーサービス:OpenAIが協力している企業や団体が提供するサービスやプラットフォームで、GPT-4が利用できます。例えば、英会話アプリ「スピーク」では、ユーザーが話した内容の語彙や文法のフィードバックを行う機能「AI講師」にGPT-4を活用しています。また、新しいBingでは、検索結果や要約文などにGPT-4を活用しています。
まとめ
OpenAIが開発した言語モデル、GPT-4は、画像も含めたマルチモーダルな入力に対応しており、高い推論能力や創造性、安全性・事実性を備えたAIです。
ChatGPT Plusでは、有料の利用料金を支払うことでGPT-4を利用でき、テキストと画像の両方を入力として処理することができます。
また、BingAIでは、検索結果や要約文などにGPT-4を活用しています。これらの特徴により、GPT-4は様々な用途に応用可能な高性能なAIとして注目されているのです。
出典:GPT-4 (openai.com)
新しい Bing が OpenAI の GPT-4 上で稼働
GPT-4(Wiki)
GPT-4 VS ChatGPT
Yahoo Finace