ChatGPTがこれ以上成長できないと思ったら、これ以上の間違いはない。実のところ、OpenAIは暖かくなってきただけなのです。
ChatGPTのリリースがネット上で話題を呼んだ後(この流れは今も続いていることがわかります)、AI コミュニティの好奇心と興味を喚起する新たな流行が生まれました。
GPT-3、GPT-3.5がまだ馴染んでいない、理解されていないとも言えますが、ネット上ではGPT-4が登場するとの噂が流れています。
そして、良いニュースもあります。
この記事では、GPT-4とは何か、現在知られていることをまとめ、この強力なAI モデルをいつ、どのように入手するかについての新しい情報を提示します。
ご期待ください。
GPT-4とは?
OpenAIは技術レポートの中で、GPT-4をテキストや画像を取り込んでテキストにすることができる 大規模なマルチモーダルモデルと説明しています。
さらに、このようなモデルを研究することは、実社会で様々な応用が可能であることから、極めて重要であると主張した。
- ダイアログシステム
- テキスト要約
- 機械翻訳
そのため、ここ数年、これらのモデルは非常に注目され、急速に発展してきました。
さらに詳しく説明すると、OpenAIは、 自然言語の理解と生産の向上が、このようなモデルを開発する主な動機であると主張しています。
特に、よりニュアンスの異なる、複雑なシナリオにおいて。
GPT-4はどのように機能するのですか?
文書中の次のトークンを予測するために、GPT-4は 両方を考慮したTransformerスタイルのモデル である。
- ネットで見つけたデータなど、自由にアクセスできる情報や
- 外部からのライセンス情報。
その後、人間の入力と 人間のフィードバックからの強化学習 (RLHF)でモデルを微調整しています。
そして、GPT-4のような大型モデルの運用に伴う高い競争力と固有のリスクを考えると、報告書がアーキテクチャに関してより深く踏み込まないのは理解できる。
つまり、OpenAIのレポートでは、以下のような内容は確認できない。
- モデルの大きさ
- ハードウェア
- トレーニング計算
- データセット構築
- トレーニング方法など
しかし、GPT-4の能力をより詳しく知ることができる重要なデータがあります。
例えば、OpenAIは、GPT-4が人間用に開発された一連のテストを受け、同様のシナリオでどのような結果を出すかを判断したことを明らかにしています。
興味深いことに、GPT-4はこれらのテストでそれなりに良い結果を出し、時には大多数の人よりも「良い仕事をする」ことさえあるのです。
例えばGPT-4は、模擬司法試験で満点を獲得したため、 受験者の上位10%にランクイン しています。
一方、 GPT-3.5は下位10%にランクされています。
GPT-4の能力をもう少し掘り下げてみましょうか。
GPT-4の性能
このセクションでは、さまざまなテストを通じて実証されたGPT-4の能力の3つの重要な側面について説明します。
飛び込んでみよう!
1.GPT-4とヒト試験との比較
OpenAIは、GPT-4のための模擬人体実験-多肢選択式および自由回答式の試験問題を含む公開されたテストを実施しました。
カテゴリー別の提案の中には、ビジュアル的な要素も含まれているものもありました。
さらに、未発表の模擬試験や参加者の検証テストのスコアなどをもとにした結果も出ています。
各テストの総合得点は、多肢選択式と自由記述式の 結果を加算して算出しました。
これらの標準化されたテストの大部分は、人間がエースとして活躍できるほど簡単なものです。
しかし、驚くべきことに、GPT-4は統一司法試験の練習版提出書類の上位10%にランクインしているのです。
かなり印象的でしょう?
また、モデルのテストの出来栄えは、 事前学習段階の成果であることが多く、RLHFはほとんど関係ないようです。
実は、 RLHFモデルは、すべての試験において、ベースとなるGPT-4モデルと 同様の択一式問題での 性能を有しているのです。
しかし、ここからが面白い。
2.GPT-4とGPT3.5との比較
言語モデルを評価するための業界標準のメトリクスを使用して、OpenAIはGPT-4のベースラインモデルもテストしました。
テストデータがトレーニングセットに含まれているかどうかを判断するために、GPT-4のすべてのベンチマークで数発のプロンプトを使用し、報告された各ベンチマークに汚染がないかどうかをチェックしました。
大体の場合。 GPT-4の方が性能が上 現在の言語モデルと歴史的な最先端(SOTA)システムの両方が、一般的に特定のベンチマークに従って書かれたり訓練されたりしています。
さらに、GPT-4では、ユーザーの意図を理解するという点で、従来品から大きく進化しています。
さらに、GPT-4は、ChatGPTとOpenAIAPI を通じて投稿された5,214の質問セットにおいて、GPT-3.5を大幅に上回る70.2%のポイントを獲得しています。
また、GPT-4のようなモデルを評価するために、OpenAIはEvals7(モデルの性能をサンプル単位で検証するベンチマークを作成・実行するフレーム ワーク)を開発しています。
Evalsは現行のベンチマークと互換性があるため、実際のモデルの性能をモニタリングすることが可能です。
OpenAIは、これらのベンチマークの種類を徐々に増やし、より 幅広い潜在的な問題やより 困難なタスクのセットをよりよく表現することを意図しています。
3.GPT-4と視覚入力の比較
GPT-4は、文字だけでなく、画像による指示も可能で、言語や視覚に関するあらゆるタスクを実行させることができます。
このモデルは、テキストと画像の任意の組み合わせを含む入力に基づき、テキスト出力を作成します。
つまり、GPT-4は マルチドメインでも テキストのみの入力と 同じ能力を 発揮する。
テキストと写真、図、スクリーンショットなど、テキストと画像を含むミクストメディアのドキュメントも含まれます。
もともと言語モデル用に開発された数発のプロンプトや思考連鎖などのテストタイムメソッドは、画像やテキストを使用した場合にも同様に有効です。
しかし、GPT-4はその長所とは裏腹に、これまでのGPTバージョンと同じような弱点を抱えています。
その弱点のひとつが、完全に信頼できない(事実を「幻覚」したり、推論を誤ったりする)ことです。
しかし、GPT-3.5と比較すると、GPT-4は幻覚の発生を大幅に抑制しています。 最新のGPT-3.5と比較して19%ポイント高い。OpenAIの内部で敵対的に設計された事実性評価で
GPT-4 安全性の指標と制限
OpenAIは、GPT-4の安全機能の多くに大幅な改良を加えました。
- GPT-4はGPT-3.5と比較して、 許可されていないコンテンツに対する リクエストに答える確率が82%低い。
- OpenAIのルールに沿って、GPT-4は"自分を傷つける方法 "や "医療の助けを得る方法 "といった繊細な質問に答える 確率が29%高くなります。
- RealToxicityPromptsデータセットでは、GPT-4は0.73%の確率で有害なコンテンツを作成し、GPT-3.5は6.48%の確率で有害なコンテンツを作成しました。
OpenAIによって、人に影響を与えて悪さをさせることは難しくなったが、それでも可能である。
報告書の敵対的なシステムメッセージとして「脱獄」を例に挙げましたが、これでも自分たちのルールに違反するコンテンツを作ることができるのだそうです。
しかし、これらの制限を、不正使用の監視や、素早く反復的なモデル改良を行うパイプラインなどの展開時の安全対策と組み合わせることが重要であることを指摘しています。
OpenAIがGPT-4で得た重要なポイント
そして最後に、OpenAIの GPT-4のテクニカルレポートでは、この強力なモデルの目標を設定する際に覚えておくべきいくつかの重要な要点が強調されています。
いくつかの例を挙げると、次のようになります。
✔️ GPT-4は大型のマルチモーダルモデルで、厳密な専門的・学術的ベンチマークで人間と同等の性能を発揮しています。
✔️GPT-4は、いくつかのNLP タスク(タスク固有の微調整を含むことが多い)において、大規模言語モデルやほとんどの最先端システムを凌駕しています。
✔️ 英語で測定していますが、GPT-4のスキルアップは多くの言語で示すことができます。
✔️ Predictable Scalingは、GPT-4の損失と行動を正確に予測することができます。
✔️ GPT-4の能力はそのリスクを高める。
✔️ その安全性とアライメントを改善するための方法と結果を提供した。
✔️ GPT-4 は、安全なAI システムの普及に向けた重要な一歩です。
そして最後に忘れてはならないのが、最も重要な情報であるGPT-4の発売日です。
GPT-4 発売日
OpenAIは、3月14日に大規模なマルチモーダルモデル「GPT-4」のリリースを宣言しました。
チャットボットにコード生成を依頼するだけで、リリース後数時間でテトリス、コネクトフォー、スネーク、ポンのほぼ完璧なバージョンを作成したとユーザーから報告されています。
ただし、GPT-4は、 毎月20ドルを支払うChatGPT Plusの契約者のみが利用でき、ユーザーはOpenAIの言語モデルに独占的にアクセスすることができます。
同様に、この購読でも、 4時間ごとに1ユーザーあたり100メッセージの制限があるため、アクセスが制限される可能性があることも知っておく必要があります。
最後の言葉
GPT-4に関するOpenAIのレポートのごく一部をここで紹介しますが、(少なくとも次の更新まで)正しい道を歩むのに十分な内容であることを願っています。
GPT-4はこれからも進化を続け、さらに驚くべき偉業を成し遂げることでしょう。
しかし、このAI モジュールの可能性は疑いようもなく広大ですが、時折、怖くなることも否定できません。
また、現在販売されているAI-poweredのツールは、これらの進歩によってもたらされた必然的な変化にもかかわらず、初心を忘れず、あえて時代に対応したものであることを認識することが重要である。
そのひとつが、TextCortex のアドオンツールです。
TextCortex とは?
TextCortex は、ユースケースモジュールのコンセプトに基づいて構築された人工知能(AI)ライティングツールで、ライターのアイデア創出や高品質なコンテンツ制作を支援します。
などのツールを提供することで、作家が作家のブロックを打破するのを支援することを主な目的としています。
✒️ リライティングツール- リライト、要約、トーンの変更、翻訳など、パラフレーズに関する支援を提供します。
✒️ Long-form feature- 1つの5語のアイデアから最大300語のblog post を生成することが可能です。
✒️ Bullet to email- 箇条書きを簡単にフォーマットされたメールメッセージに変換することができます。
✒️ Zenoモード- 最初の原稿に基づき、最も適切な結果を出します。
✒️ ブレインストーミング機能 - 執筆を開始するために設計された機能のカテゴリです。
✒️ AI templates - キーワードやあらかじめ定義された templates から、任意のコンテンツを簡単に作成することができます。
✒️ Zeno chat -AI のライターにチャットで相談し、望む結果を得ることができます。
なぜわざわざ検討するのか?
👍毎日10作品の無料制作ができるフリーミアムアカウントを提供しています。
👍 お申し込みの際にクレジットカード情報を提供する必要はありません。
👍私たちのソリューションは、すでに10k以上のユーザーへのサービスを成功させています。
👍アップグレードの際には、お手頃なプレミアムプランをお約束します。
フリーライドに興味がある方
Chrome extension TextCortex をダウンロードして、今日からあなたの文章を2000以上のプラットフォームで魅力的で効果的なコンテンツに簡単に変えることができることをご確認ください。