データサイエンスに向けてクラウドコードで強力なループを作成する方法

最近コーディングエージェントの間で非常に人気のあるトピックです。ループは基本的に、エージェントが自己検証ループ内で動作し、エージェントがより自律的に動作するという概念です。

これは、以前にコーディングエージェントを使用した方法とは逆で、新しいコーディングエージェントを作成し、コーディングエージェントに何かを実行させ、その結果を検証し、完了するまで実行し続けます。

ループは、後部座席に座って人間としてより多くのことを実行できるため、非常に強力です。これは、エージェントをそれほど綿密にフォローする必要がなく、エージェント自体がより自律的に動作し、最初から最後までジョブを完了する能力が高いためです。

この記事では、コーディングエージェントと対話するときにループで作業する必要がある理由と、その方法について説明します。ループを効果的に設定し、コーディングエージェントをできるだけ効果的にするために、コーディングエージェントと対話するときに積極的に使用する必要があるいくつかのテクニックについて説明します。

データサイエンスに向けてクラウドコードで強力なループを作成する方法 — このインフォグラフィックは、この記事の主な内容を強調しています。コーディングエージェントにループを実行させる方法について説明します。これにより、コーディングエージェントが大幅に強力になり、より多くのタスクを自律的に完了できるようになります。画像はchatgptによる。

コーディングエージェントでループを使用する理由は何ですか?

まず、コーディングエージェントを使用するときにループを使用する必要がある理由を見てみましょう。最も簡単な答えは、ループを使用するとより多くの作業を実行できるからです。

これは、ループを設定すると、エージェントがエンドツーエンドのタスクを自律的に完了できるようになり、人間としての時間が解放され、より多くの作業を行えるようになるためです。

次の 2 つのシナリオを想像できます。

シナリオ 1: あなたはエージェント A を採用し、一緒に計画を立て、仕事をさせます。次に、エージェント B に電話をかけます。エージェント B との行動計画を立てる前に、エージェント A はあなたに質問したり、いくつかの作業を完了したので確認する必要があると言いました。あなたはエージェント B を排除することに決め、そこでの作業を完了したらすぐにエージェント A に戻ります。エージェント A と対話して仕事を続けます。そこで作業が完了する前に、エージェント B は再びあなたからの入力を必要とします。その後、このように続行すると、一度に 2 人のエージェントのみと対話できるようになり、基本的に 2 つのタスクを同時に完了することになります。

シナリオ 2: エージェント A を起動し、ループを実行して動作を自己検証するように依頼します。次に、エージェント A がタスクの作業を開始し、タスクが完了してから連絡するように依頼します。エージェント A への指示が完了したら、エージェント B に対しても同じことを開始し、目標を設定してループで動作させることができます。今回、エージェント A は自己検証ループを備えており、同じように入力を必要としないため、それ以上の入力を要求しません。したがって、エージェント A が作業を完了するまで、エージェント C、D、E などにタスクを設定し続けることができます。

ここで重要なのは、シナリオ 2 では、より多くのエージェントを関与させ、より多くのタスクを完了できるということです。これは、一度により多くの作業を実行できるため、もちろん非常に価値があります。

ループで作業する方法

さて、当然のことですが、大きな疑問は、ループ内で実際にどのように作業するかということです。これを行うにはさまざまな方法がありますが、ここではすぐに実行できる最も簡単なテクニックを説明します。

このテクニックは、クラウドコードまたはコーデックで /goal コマンドを使用するためのものです。

/goal

たとえば、私はこう言います。

/goal Implement everything I asked for. Verify it end to end by clicking 
through the browser using the Playwright MCP. It's not acceptable to test 
the application only through integration tests. You need to actually click 
around the app. Continue like this until it works. Fix any issues if you 
encounter them then do an end to end test again. Run Codex exec and run
the review skill with Codex and make him approve it and iterate until 
Codex has approved it. When Codex has approved it, come to me and tell 
me which servers I can test it on and exactly how to test it.

基本的に、/goal はフックを実装します。このフックは、クラウドコードまたはコーデックがその作業を完了するたびにトリガーされ、基本的に、コーディングエージェントが作成したタスクまたはターゲットの下でタスクを完了したかどうかを反映します。完了すると、戻ってきて作業内容を教えてくれます。それが達成されていないと感じた場合、彼は満足するまでその目標に向かって努力し続けます。

これは基本的に、コーディングエージェントが実際に目標を達成するまで、または目標が完全に達成不可能であると判断されるまで、コーディングエージェントを動作させ続ける方法です。コーディングエージェントに長時間労働を強いることにより、より自律的に働き、より多くの作業を完了させるための非常に強力な方法です。

また、プロンプトで、エージェントの動作を確認する方法に関するその他の多くの情報をエージェントに提供していることに注目してください。これは、/goal コマンドを最大限に活用したい場合に非常に重要であるため、次のセクションで説明します。

/目標を効果的にする方法

ここでは/goalコマンドを有効にする方法を説明します。もちろん、エージェントに目標を与えるだけでも構いませんが、どのような目標を設定し、エージェントがその目標をどのように検証できるかが不明確な場合、良い結果は得られません。

エージェントがその動作を検証し、バグの可能性を減らすための方法を提供する必要があります。私はこれを主に 2 つの方法で行います。

Playwright MCP を使用し、ブラウザと対話して、エンドツーエンドで作業を検証するようエージェントに依頼します。
Codex Exec を実行してエージェントから提供されたコードを確認し、バグの可能性を減らします。

最初のポイントについて説明します。私は Playwright MCP を使用しましたが、ブラウザーの任意の操作方法を使用できます。私は Playwright が気に入っています。なぜなら、Playwright は素晴らしい仕事をしてくれますし、エージェントがすべての仕事を私に代わってやってくれるからです。エージェントに私の作業を最初から最後まで確認してもらうことは非常に効果的です。エージェントはブラウザまたはアプリにアクセスし、スクリーンショットを撮り、すべてが意図したとおりに動作していることを確認するからです。これは、コーディングエージェントの効果を少なくとも 2 倍にするために実行できる、信じられないほど強力かつ非常に簡単な変更です。

UI を使用していない場合は、エージェントに実際に API 呼び出しを行わせ、データベースまたはログをチェックして、期待どおりに動作していることを確認することができます。重要なのは、コードを見るだけではコーディングエージェントにその動作を検証してもらえないということです。これを行うには、実際にコードを実行し、コードの出力と結果を確認します。

次に、私は通常、コーデックスを開発する際のメインドライバーとしてクラウドコードを使用していますが、コーデックスからも多くの価値を得ることができることがわかりました。

私は Codex を使用してエージェント、つまりクラウドコードエージェントにレビューを提供します。コードを公開する場合、またはコードを公開して開発にコードを取り込みたい場合は、Cloud がコードを開発にマージできるようにする前に、Codex にコードをレビューして承認してもらいます。これにより、理解するのが難しいほど多くのバグが軽減されました。

また、クラウドコードとコーデックスをレビューした私の経験にも大きな違いがあります。コードをデプロイするためのメインドライバーとして Cloud Code を使用している場合は、後でコードを検証するために Cloud Code ではなく、Codex を必ず使用したいと考えています。これは、コーデックがより多くのバグを検出できるためです。 Cloud Codes がコードを実装し、Codex にレビューしてもらい、レビューコメントを修正し、再度レビュー用に Codex にタグを付ける反復セットアップを作成します。 Codex がコードを承認するまで、この作業を続けます。

これにより、クラウドコードで発生するバグの数が大幅に減少します。

結論

この記事では、Cloud Code でループを設定する方法について説明しました。概念としてのループは、コーディングエージェントがより自律的に動作し、より多くのことを達成できる方法であるため、最近非常に流行しています。 /goal コマンドを使用すると、目標が達成されるまでエージェントを実行し続けるスーパーループを簡単に設定できます。ただし、エージェントに自分の作業を検証する方法を提供する必要もあります。これについては、この記事でも説明しました。このようなループを作成することがソフトウェアエンジニアリングの未来であると私は信じています。ループ内で動作するエージェントを作成し、その動作を検証する方法を提供します。これにより、より多くのタスクを一度に実行できるようになります。概念としてのループは、他の小さなループや自己修正ループを構成する大きなループに拡張することもできます。これについては、今後の記事でさらに詳しく説明します。

👋 お問い合わせ

👉 私の無料の電子書籍とウェビナー:

🚀 LLM でエンジニアリングを 10 倍にする (無料の 3 日間の電子メールコース)

📚 無料の Vision Language Model 電子ブックを入手してください

💻視覚言語モデルに関する私のウェビナー

👉 ソーシャルメディアで私を見つけてください:

💌 サブスタック

🔗リンクトイン

🐦