人工知能が私たちの日常業務にシームレスに統合される時代において、これらの高度なシステムとのインタラクションの効率性は最重要課題となっている。人間の意図と機械の理解の橋渡しは、繊細かつ重要なプロセスを通じて構築される。AIとのより効果的なコミュニケーションを実現するために、言語的スキルと技術的知識を組み合わせる分野だ。この概念をさらに探求し、現代の技術的状況におけるその意義を理解しよう。

TL;DR

  • 日常業務におけるAIの統合は、高度なシステムとの効率的な相互作用の必要性を強調している。
  • AIにおけるプロンプト・エンジニアリングは、効果的なAIコミュニケーションのために、言語的スキルと技術的知識を融合させる。
  • AIにおけるプロンプトとは、言語モデルから特定の結果を導き出すためのテキストベースの指示である。
  • プロンプト・エンジニアリングでは、AIの反応を最適化するために入力を工夫する。
  • GPT-3やGPT-4のような包括的な言語モデルの進化は、迅速なエンジニアリングの重要性を強調している。
  • プロンプト・エンジニアリングは、「プロンプト・エンジニア」や「AIのささやき屋」の出現につながった。
  • プロンプトエンジニアリングに不可欠な技術には、ゼロショット、少数ショット、思考連鎖、知識プロンプト生成、検索支援生成などがある。
  • プロンプトエンジニアリングの用途は、単純な指示プロンプトから複雑な指示プロンプト、創造的なプロンプトまでさまざまです。
  • また、プロンプト・エンジニアリングには、文章の連続性を確保する文脈的なプロンプトも含まれる。
  • AIの画像生成プロンプトは、詳細なテキスト説明をビジュアルに変換する。
  • 風景の視覚化、キャラクターのコンセプトアート、製品デザインのモックアップ、小説のコンセプトアートなど、さまざまなタイプの画像生成プロンプトが用意されている。
  • YouTubeチャンネルで、プロンプト・エンジニアリングを学ぶことができます。

AIにおけるプロンプト・エンジニアリングとは何か?

プロンプト・エンジニアリングという概念は、AIの領域で生じるもので、コマンドラインを通じて与えられるテキストベースの入力を、AIが最も熟達した結果をもたらすように注意深く作り上げ、微調整するものである。プロンプト・エンジニアリングは、拡張的な言語モデル、魅力的なチャットボット、想像力豊かなテキスト画像モデルなど、テキスト入力を必要とするジェネレーティブAIプラットフォームにおいて特別な用途を持つ。したがって、プロンプトエンジニアの役割は、有能なプロンプトエンジニアリングの必要性から形作られてきた。

AIプロンプトとは何か?

AIプロンプトは、ユーザーと洗練された言語モデルとの間にコミュニケーションチャネルを確立し、モデルが特定のタイプの出力を生成するように導く。このインターフェースは、クエリ、テキスト入力、コーディングの抜粋、または例示的なケースとして現れるかもしれない。

プロンプト・エンジニアリングはどのように機能するのか?

プロンプト・エンジニアリングは、テキストとコンテキストの形でAIに発行される指令を開発し、研ぎ澄ますことに焦点を当て、AIの出力が最適であることを保証する。特に「プロンプト」という用語は、広範な言語モデル(LLM)、対話型チャットボット、Midjourneyのような創造的なテキストから画像へのモデルなどの生成AIシステムに供給されるテキストベースの命令を指す。

GPT-3やGPT-4のような包括的な言語モデルの導入や、それらをベースとしたChatGPTのようなチャットボットシステムの構築、さらにはDALL-E、Stable Diffusion、Midjourneyのような堅牢なテキストから画像への変換モデルを考慮すると、プロンプトエンジニアリングの重要性はますます高まっている。その結果、「プロンプト・エンジニア」という新たな専門的呼称が登場し、「AIウィスパラー」や「AIインタープリター」と、よりリラックスした口調で呼ばれることもある。

プロンプトエンジニアリングは、AIが生成するアウトプットの本質が、コマンドラインインターフェイスを通じて提供されるテキストのタスク指示やガイドラインと密接に関連していることから、勢いを増している。AIが課題を正しく把握し、課題を達成するのに十分な情報とコンテキストを提供するためには、ユーザーの期待に沿い、真に役立つものであることが不可欠です。プロンプト・エンジニアリングは、このダイナミックで急成長している分野で急速に進化している。

プロンプト・エンジニアリングを学ぶには?

機械学習のスキルや経験は、プロンプト・エンジニアとしての仕事に役立ちます。例えば、機械学習は、ユーザーが過去にどのようにシステムとやりとりしたかに基づいて、ユーザーの行動を予測するために使用することができます。そして、プロンプトエンジニアは、LLMをどのようにプロンプトするか微調整し、ユーザー体験のための素材を生成することができます。

また、YouTubeチャンネルでプロンプト・エンジニアリングを学ぶこともできます。LLMのための効率的なプロンプトを作成する方法を教えるビデオをいくつか提供しています。

迅速なエンジニアリングのベストプラクティス

直接的でわかりやすい指示を出す

あなたの指導が的確でわかりやすいものであることを確認してください。あなたのニーズが明確であればあるほど、モデルはより良いサービスを提供することができます。簡潔な回答には、簡潔さを要求する。より高度な内容については、専門家レベルの内容を要求してください。形式が適切でないと判断した場合は、模範となるような好ましい例を示してください。直接的な指示は、望む結果を受け取る可能性を高めます。

十分な参考文献の提供

AI言語モデルには、特に曖昧なテーマや出典の入力を求められた場合に、不正確な情報を生成する能力があることに注意してください。メモが生徒の試験成績を向上させるように、参考テキスト、URL、または文書をモデルに装備させることで、誤った情報を生成する可能性を大幅に減らすことができます。

複雑なタスクを分解する

複雑な問い合わせは、より小さく管理しやすい部分に分割して、戦略的にアプローチする。これは、システムをモジュール化して構築するソフトウェアエンジニアリングのベストプラクティスを反映したものである。タスクを単純化することで、モデルの精度が向上し、各ステージが前のステージの上に構築される、ステップバイステップのワークフローを作成することができます。

プロンプトを体系的にテストする

パフォーマンスを一貫して向上させるためには、プロンプトを系統的にテストすることが不可欠である。プロンプトを修正することで、1つのケースは改善されても、広範囲に適用すると不利になることがあります。さまざまなシナリオでプロンプトを継続的に評価し、最も正確で有用な回答を一貫して得られるプロンプトをtemplates 。

質の高いプロンプトの例: 

持続可能なエネルギーソリューションをテーマに、専門的な口調で簡潔な要約を作成する。要約は300ワード以内で作成してください。太陽光発電と風力発電の最新動向を盛り込み、IEA(国際エネルギー機関)の2023年報告書から最新の統計を引用するようにしてください。出力形式は箇条書きでお願いします。

このプロンプトの分析

持続可能なエネルギー解決策をテーマに、専門的な口調で簡潔な要約を作成する。 (トーンとトピックを定義する明確な指示).要約は300ワード以内にまとめること (具体的な長さの要件を設定する).太陽光発電と風力発電の最新動向を含め、IEA(国際エネルギー機関)の2023年報告書から最新の統計を引用するようにしてください。 (.具体的な内容を盛り込み、正確性を高めるために事実に基づいた言及をするようモデルを指導する).出力形式は箇条書きにすること (望ましい形式を明示する)

迅速なエンジニアリング技術

プロンプトエンジニアリングと実践的なプロジェクトについて理解したところで、プロンプトエンジニアリングの一般的なテクニックについて説明します。このセクションでは、以下のテクニックをプロンプトに適用して、言語モデルから望ましい出力を得る方法を学習します。

ゼロショット・プロンプティング

追加のコンテキストなしで、言語モデルに通常の質問をします。上のプロンプトでは、分類と一緒にテキストの例をモデルに与えていないことに注意してください。ゼロショットが機能しない場合、プロンプトにデモや例を提供することが推奨されます。次のセクションで、数ショットのプロンプトを示す。

入力例"次の文章の心情は何か:「この曲を聴くたびに踊りたくなる!」"

出力例:「テキストのセンチメントは肯定的です。

数発のプロンプティング

モデルの性能を高めるために、いくつかの例でモデルを条件付けする。大規模言語モデルは顕著なゼロショット能力を示すが、ゼロショット設定を使用すると、より複雑なタスクではまだ不十分である。数ショットのプロンプトは、インコンテキスト学習を可能にする技術として使用することができ、プロンプトの中でモデルをより良い性能に導くためのデモンストレーションを提供する。デモンストレーションは、モデルに応答を生成させたい後続の例に対する条件付けの役割を果たす。

入力例「肯定的な例と否定的な例に基づいて、この新しい携帯電話の製品レビューを作成してください:肯定的な例この携帯電話のカメラは本当に気に入りました!否定的この携帯電話のバッテリーの持ちは最悪です。"

出力例:「この携帯電話のカメラは素晴らしい!写真はいつも鮮明で、色も鮮やかです。しかし、バッテリーの持ちはあまり良くなく、数時間しか持ちません。"

思考の連鎖を促す

Weiら(2022)で紹介されたCoT(chain-of-thought)プロンプトは、中間推論ステップを通した複雑な推論能力を可能にする。回答する前に推論を必要とする、より複雑なタスクでより良い結果を得るために、数発のプロンプトと組み合わせることができます。

思考の連鎖を促す

知識プロンプティング

生成された知識プロンプトは、外部知識ベースや生成されたコンテンツを活用して、モデルの応答を向上させる。プロンプトに関連情報を組み込むことで、モデルは詳細で正確な回答を提供したり、獲得した知識に基づいてコンテンツを生成したりすることができる。

知識プロンプトの生成

実際にどのように機能するのか、以下の文脈で見てみよう:

Context:
教育心理学では長い間、ニモニック装置が学習や記憶に与える影響を検証してきた。そこで疑問が生じる:ニモニックデバイスを活用することで、生徒の情報保持力は向上するのだろうか?

Starting Prompt:
教育においてニモニックデバイスを使用することは、生徒が情報をよりよく保持するのに役立つか?

生成された知識プロンプト:

インプット ニーモニック・デバイスは、人が情報を記憶するのを助ける道具である。

知識:ニーモニックデバイスは、記憶プロセスを助ける文字、アイデア、連想のパターンを活用する。効果的なニーモニック戦略には、アクロスティクスの作成、情報のチャンキング、軌跡の方法などがある。これらの技法は、言語的記憶システムと空間的記憶システムの両方に働きかけ、情報の保持向上につながる。

インプット 教育心理学は、人がどのように学ぶかを研究しています。

知識 教育心理学は、心理学、社会学、哲学の理論と方法論を組み合わせ、学習に関わる認知的・感情的プロセスを理解する学際的な分野である。この理解を指導設計、カリキュラム開発、教室運営に応用し、学習成果の最適化を目指す。

これで、この生成された知識を組み合わせることで、より情報に基づいた出力で最初のプロンプトに対処することができる。

統合された知識ベースのプロンプト:

質問教育においてニモニック・デバイスを使用することは、生徒の情報保持に役立つのか?

知識1: ニーモニック・デバイスは、文字、アイデア、連想のパターンを使って記憶を助ける。アクロスティックス、チャンキング、ロキ法などの技法は、複数の記憶システムに働きかける。

知識2:教育心理学は、認知的・感情的な学習プロセスを理解し、これを教育戦略に応用することによって、学習成果を最適化しようとするものである。

説明して、答えてください」。

答えてくれ:

「そう、教育におけるニーモニック・デバイスの使用は、情報のより良い定着をサポートする。これらのツールは、教育心理学が学習における重要な認知プロセスとして特定している言語的記憶システムと空間的記憶システムの両方に関与する。アクロスティックスや軌跡法のような方法を使うことで、教育者は、教育心理学の分野で研究され支持されているように、生徒により効果的に情報を想起させる戦略を提供し、より高い学習成果につなげることができる。"

この例は、関連する情報に基づいて知識を生成することで、複雑な教育上の疑問に対して包括的でニュアンスの異なる回答を提供できることを示すものである。

リトリーバル・オーグメンテッド・ジェネレーション(RAG)

標準的な言語モデルは適応性があり、センチメント分析や名前付きエンティティの識別のような典型的なタスクのために改良することができる。これらの作業では、通常、余分な事実情報を組み込む必要はない。

しかし、より複雑で広範な知識を必要とするタスクの場合、追加の外部情報源を利用する言語モデルを使用してシステムを構築することができる。このアプローチは、事実の正確性を高め、モデルによって提供される応答の信頼性を強化し、出力における「幻覚」の事例を減らすのに役立ちます。以下は、外部CSVファイルを使用したZenoChat上のRAG実装の小さな例です:

迅速なエンジニアリングの例

プロンプトエンジニアリングは、AIのパフォーマンスを導くために様々な場面で応用されている。ここでは、プロンプトを効果的に構成するアートとサイエンスを明らかにする具体的な例をいくつか紹介する。

シンプルな指示プロンプト

モデルにリストを作成させたり、直接クエリに応答させたりするような単純なタスクでは、単純な指示プロンプトで十分である。これらのプロンプトは明確で、簡潔で、要点をついている。

インプット"現代世界の七不思議を挙げてください"

アウトプット「現代世界の七不思議は以下の通り:1.メキシコのチチェン・イッツァ、2.ブラジルの救世主キリスト像、3.中国の万里の長城、4.ペルーのマチュピチュ、5.ヨルダンのペトラ、6.イタリアの古代ローマのコロッセオ、7.インドのタージ・マハル"

複雑な指導の促し

包括的なエッセイの起草や複数ステップのアルゴリズムの考案など、より複雑な要求に対処する場合、複雑な指示プロンプトが登場する。これらのプロンプトは詳細な情報を提供し、AIが従うべき期待を設定する。

インプット「気候変動が海洋の生物多様性に及ぼす影響について、少なくとも3つの主要な影響、潜在的な解決策、結論を含めて、包括的なエッセイを書く。

アウトプット「気候変動は海洋生物多様性に大きな影響を与えており、気温上昇、海洋酸性化、海面上昇は海洋種の健康と分布を変化させている。主な影響には、サンゴの白化、種の分布の変化、繁殖時期の変化などがある。"

創造的な構想の提案

時には、物語、詩、視覚的なアートワークなど、オリジナルのコンテンツを作成するようにAIを誘導することが目標になることもあります。創造的な概念化のプロンプトは、モデルの創意工夫に火をつけるために、喚起的な言語と生き生きとした描写に依存しています。

インプット 「動物とコミュニケーションをとりながら謎を解く探偵の物語を作ってください。探偵がオウムから行方不明の競走馬についての不可解なメッセージを受け取るところから始めてください。"

出力 「イライザ・ソーンベリー刑事の朝は、彼女の情報提供者であるパスカルという名の緋色のオウムの必死の鳴き声によって中断された。駿足が夜明け前に消えた」と彼は鳴いた。動物界と交信できるユニークな能力で知られるイライザは、このメッセージが意味することはひとつしかないとわかっていた。

文脈上の継続プロンプト

同じスタイルで文章を続けたり、継続性を持たせてトピックを展開するには、文脈に応じた継続プロンプトが利用される。このプロンプトは、AIが先行するコンテンツを認識し、後続の投稿でスレッドを維持することを確実にします。

入力:「時計が真夜中を告げると、ひび割れた窓から影が滑り込んできた。一家の100年来の秘密が守られていると思われていた金庫が、大きく開いていたのだ。"

アウトプット「かつて静かだった部屋は、新たな侵入の緊張でどよめいた。心臓が高鳴り、侵入者の目は薄暗い室内を見回し、月明かりが金属製の金庫の中身を照らし出した。一家の禁断の歴史が手の届くところにあり、謎は今にも明らかになりそうだった。彼らは知らなかったが、もう一組の目が暗闇から陰謀の展開を目撃していたのだ。

これらは、プロンプト・エンジニアリングが人間とAIの対話をどのように形成し、最終的にアルゴリズムのアウトプットの有効性に影響を与えるかを示すほんの一例に過ぎない。

プロンプト・エンジニアとして、これらのテクニックをマスターし、いつ適用すべきかを認識することで、AIが生成するコンテンツの双方向性と実用性を大幅に高めることができる。

画像生成プロンプト

画像生成のためのプロンプトは、AIがテキストの説明を説得力のあるビジュアルに変換するよう導く。重要なのは、モデルがコンセプトを思い描き、正確にレンダリングできるよう、十分なディテールを提供することだ。

図解ビジュアライゼーション・プロンプト

インプット「湖畔に建つ小さなコテージ、背景には霧に包まれた山々、日没のゴールデンタイム。

キャラクター・コンセプト・アート

入力"スチームパンク発明家のキャラクターコンセプトをイメージしてください。ビクトリア朝時代の服に真鍮の小物を飾り、特注のレンチを持ち、ゴーグルを帽子の上に置いています。"

製品デザイン・モックアップのプロンプト

入力"曲面ガラスディスプレイ、ベゼルレススクリーン、ディスプレイ上の対話型AIアシスタントを備えた、洗練されたモダンなスマートフォンデザインのイメージを生成してください。"

フィクションのためのコンセプト・アート

入力:"宇宙ステーションを舞台にした、にぎやかなエイリアン・マーケットのシーンを描いてください。" "さまざまな銀河系外の種族が、エイリアン文字のネオンサインの下でエキゾチックな商品を取引しています。"