イーロン・マスクのxAIと呼ばれる会社が2ヶ月で開発し、他のAIツールが拒否するスパイシーなクエリに答えるように設計されたGrok AIが、2023年11月4日に発表された。Grok AIはまだBETA段階の製品だが、すでにいくつかのベンチマークでGPT-3.5モデルを打ち負かすことに成功している。

この記事では、Grok AIを検証し、それが何を約束するのかを発見する。

準備ができたら始めよう!

TL;DR

  • Grok AIは、xAIが開発したユニークな出力スタイルのAIチャットボットである。
  • Grok AIは、2023年第3四半期までのオンラインデータと、Xプラットフォーム(旧Twitter)からのリアルタイムデータを出力に利用する。
  • Grok AIはTwitterのデータを使って出力を生成するため、誤った出力や幻覚のような出力を生成する可能性がある。
  • Grok AIはGPT-3.5の言語モデルよりは優れているが、GPT-4よりは性能が低い。
  • Grok AIはまだBETAであるため、アクセスするには認証済みのXプラットフォーム・アカウントが必要で、アプリケーション・フォームに記入する必要がある。
  • ツイッターを含むインターネット全体のデータを使ってアウトプットを生成できる会話AIを探しているなら、TextCortex のZenoChatがおすすめだ。

Grok AI レビュー

Grok AIは、xAIによって開発されたAIチャットボットで、ユーモア、皮肉、ジョーク、個性を交えてほとんどどんな質問にも答える。Grok AIはダークなユーモアを交えた回答を生成するが、法律や倫理的なルールには忠実である。Grok AIの輝く特徴のひとつは、他のAIチャットボットが回答を拒否するような質問にも対応できることだ。

grok ai レビュー

Grok AIの仕組み

Grok AIは、2023年第3四半期までのオンライントレーニングデータと、Xプラットフォーム(旧Twitter)のデータベースを使用して出力を生成する。つまり、あなたがGrok AIに質問や命令をすると、Grok AIはXプラットフォームから得た情報を使って応答する。Xプラットフォームをデータセットとして利用するということは、様々な文化や考え方の広範な情報源を活用することを意味する。

Grok AIはChatGPTより優れているか?

Grok AIとGPT-3.5モデルを比較すると、Grok-1ラージ言語モデルの方が若干優れていると言えます。xAIの調査によると、MMLU、GSM8k、HumanEval、MATHベンチマークでは、GPT-3.5よりもGrok-1ラージ言語モデルの方が高いスコアを出しています。しかし、Grok-1モデルはGPT-3.5よりも若干優れているものの、GPT-4大規模言語モデルに対抗できるレベルには至っていません。GPT-4大規模言語モデルは、Grok-1よりもベンチマークでのスコアがはるかに高い。

grok aiはchatgptより優れているか?

Grok AIにアクセスするには?

xAIチームはGrok AIを紹介する際に「誰にとってもパワフルな研究アシスタントとして役立つ」というフレーズを使っているが、X(旧Twitter)のアカウントを持っていなければGrok AIを体験することはできない。Grok AIを体験し、早期アクセスプログラムに参加するには、認証済みのXアカウントでウェイティングリストに申し込む必要がある。また、アクセスできるのは米国内のみである。近い将来、Xプレミアム加入者も利用できるようになる。いずれにせよ、認証済みのXプラットフォーム・アカウントが必要です。

コンピュータのスクリーンショット自動生成される説明文

GrokのAI機能

Grok AIは、Grok-1大規模言語モデルを搭載し、皮肉な出力を生成することができるAIチャットボットです。Grok AIには、他のAIチャットボットとは一線を画す機能が備わっている。Grok AIの機能を詳しく見てみよう。

Grok AI訓練データとウェブアクセス

Grok AIは、2023年第3四半期までのインターネットデータと、AI家庭教師から提供されたデータで学習しています。このため、Grok AIと最近の話題についてチャットすることも可能だ。独立したウェブ検索機能はまだないが、xAIチームが取り組んでいる。

しかし、xAIの記事によれば、Grok AIはX(旧Twitter)プラットフォームを通じて世界のリアルタイム知識を持っている。つまり、Grok AIはまだインターネット上のデータを検索することはできないが、Xプラットフォームのデータを使って出力を生成することができる。Twitterプラットフォームには公式な情報源が少ないため、Grok AIが幻覚や誤った情報を出力する可能性があります。このため、Grok AIからの回答を常に再確認することをお勧めします。

Grok AIのパフォーマンスとベンチマーク

xAIチームは、HumanEval、MATH、MMLUといったLLMの性能を測定するベンチマークを使用して、Grok-1大規模言語モデルを評価した。 

xAIの調査によると、Grok-1ラージ言語モデルは、コーディングと推論タスクのパフォーマンスを測定するHumanEvalベンチマークで63.2%のスコアを持っている。このスコアはGPT-3.5の57.1%より高いが、PaLM 2、GPT-4、Claude 2.1モデルよりかなり低い。

Grok AI パフォーマンスベンチマーク

xAIチームは、Grok-1大規模言語モデルの言語スキルを評価するためにMMLUベンチマークを使用しました。MMLUベンチマークでのGrok-1モデルのスコアは73%でした。このスコアはGPT-3.5より高く、Claude 2.1やPaLM 2に近いものの、GPT-4よりかなり低い。

AIのユーモアのセンスを学ぶ

Grok AIは、他のAIツールが拒否したり、答えられないような質問や問い合わせに答えるように設計されている。つまり、Grok AIはジョークを言ったり、皮肉を言ったり、非倫理的な文章を出力したりすることができる。xAIチームは記事の中で、Grok AIのこの機能について「ユーモアが嫌いな人は使わないでください」と述べている。

さらに、Grok AIは個人と会話することで自己学習し、ユーザーごとにパーソナライズされたユニークな体験を提供する。この機能により、Grok AIは異なる文化のユーモアのセンスを分析し、出力に利用することができる。ダーク・ユーモアとして知られるダーク・コメディを楽しむなら、Grok AIの出力スタイルは気に入るかもしれない!

安全と倫理

Grok AIは、皮肉やジョークを出力に使用するために開発されたAIチャットボットであるが、法律を遵守することによって違法な出力を生成することは避けている。言い換えれば、Grok AIは魅力的で皮肉な出力を生成するが、危険なコンテンツを提供することはない。

ZenoChat - あなたが必要とするより良い代替手段

もしあなたが、日々のタスクを完了するために、よりカスタマイズ可能なAIを探しているなら、ZenoChat by TextCortexがあなたのために設計されています。ZenoChatは、GPT-4とSophos-2の言語モデルを搭載した会話アシスタントです。ウェブアプリケーションおよびブラウザextension として利用可能です。ZenoChatブラウザextensionは30,000のウェブサイトやアプリと統合されているため、いつでもどこでもあなたに寄り添うことができます。

特徴

ZenoChatは、会話形式や対話形式でテキストベースの様々なタスクを完了できるように設計されています。ZenoChatは、25以上の言語でテキストを生成したり、既存のテキストを書き換えたり、声のトーンを変えたりすることができます。また、ZenoChat にプロンプトを与えることで、既存のテキストの文法やスペルを修正することもできます。

ZenoChatにはウェブ検索機能があり、最新のインターネットデータを使用して出力を生成することができます。ZenoChatのウェブ検索機能には7つの異なるオプションがあり、特定のソースに焦点を当てることができます:Scholar、Twitter、News、Wikipedia、Reddit、YouTube、Internetです。例えば、ZenoChatのウェブ検索機能からTwitterオプションを選択することで、出力時に最新のTwitterデータのみを使用するようにすることができます。

独自の会話AIを構築する

ZenoChatには、知識ベースと個別ペルソナという2つの機能があり、目的別にトレーニングすることができます。これらの機能を使うことで、執筆作業を手伝ってくれるアシスタントや、リサーチプロセスを円滑にしてくれるAIコンパニオンを構築することができます。どのような目的であれ、ニーズに合わせてZenoChatをカスタマイズすることができます。

個別ペルソナ」機能により、ZenoChatの出力スタイル、性格、声のトーンを調整することができます。この機能を使用することで、ライティング作業に使用する自分だけのデジタルツインを作成することができます。ナレッジベース」機能では、ZenoChatがアウトプットを生成するために使用するデータセットをアップロードまたは接続することができます。この機能のおかげで、何百ページものドキュメントを1回のプロンプトやチャットで要約することができます。

代わりにゼノに聞く?

長くて退屈な検索エンジンのセッションに代わるものをお探しなら、ZenoChatの最新機能であるAsk Zeno Insteadをお試しください。この機能では、ウェブアクセスを使って検索エンジンに入力したキーワードの結果をZenoChatが分析します。その後、ZenoChatは取得したすべての情報を要約し、重要なポイントを保持し、出力として生成します。