データサイエンスに向けて AI の財務的安定性を掘り下げる

4 月のコラムで、AI の実際のコストが、長期的に利益をもたらすテクノロジの商業化にとって潜在的に致命的な欠陥であることについてお話しました。興味深いことに、それ以来 2 か月の間に、潜在的に壊滅的な規模で私の議論を正当化するハイテク業界の注目すべき見出しがいくつか見られました。

AI 業界の風は急速に方向を変えており、追跡するのが難しいように感じます。ほんの数か月前まで、ハイテク企業やその他の企業でさえ、従業員に AI をもっと活用するよう精力的に奨励し、たとえソフトウェアに対する明確な必要性や特別な欲求がない場合でも、チームが AI をワークフローに統合することを要求していました。

結果論は20-20

これを考えた人なら誰でも想像したかもしれませんが、人々の物質的な生活を何かのより多くの利用に結び付けると、より多くの人々が実際にその物をより多く使用するようになります。これにより、「トークンマックス」、AmazonやUberなどの企業（および名前を出したくない他の企業）内のトークン使用量リーダーボードなど、多くの場所でAIトークン支出の数字が衝撃的に変化しました。なぜこれらの企業がこれらの結果に驚いているのかは私には完全には明らかではありませんが、それでも、このコストが長期間持続可能ではないだけでなく、AI の使用が十分に目覚ましいビジネス成果を生み出していないため、人員配置の方向性が方向転換する原因となっています。

経営幹部は、AI の使用によって半ば奇跡的な生産性の爆発が起こると信じていた可能性がありますが、もしそうなら、彼らは本当に下調べをしていなかったことになります。業界を取材するメディア関係者だけでなく、この分野に携わる私たちの多くも、AI は効果的に使用されることも非効果的に使用されることもあるツールであり、奇跡を期待することは常に失望に終わるだろうと警告しています。

私は以前にもこの種の比喩を使ったことがありますが、これらの会社が建設業に携わっていて、電気ドリルが発明されたばかりで、建築の生産性が驚異的に向上したと考えてみましょう。正しい対応は、ドリルの部品が不足して価格が上昇するまで、できるだけ多くのドリルを購入することではなく、すべてのタスクでドリルを使用するように従業員に指示し、誰が 1 日の中で最も多くドリルを使用しているかを示すスコアボードを作成することです。スイスチーズ模様の穴が開いた建物があり、ドリルや電力に多額の費用を費やし、テクノロジー企業が現在 AI で行っているのと同じくらい多くのことを証明する必要があります。

お金は無限ではない

いずれにせよ、現実の崩壊が始まっており、これは少なくとも迅速な地球への帰還でした。一部の企業は依然としてドリルを購入しているが、大手企業はここでは費用対効果の比率が意味をなさないことに気づき、調整を進めている。しかし、私が4月に報告したように、それは彼らが思っているほど簡単ではないでしょう。一部の企業は、価値を生み出すテクノロジーを活用しながらコストを削減するために、トークンマックス化のためだけでなく、AI を有意義な目的に使用する必要があることをチームに伝え始めています。

彼らがまだ理解していないのは、トークンの予算を立て、AI がいつ問題を解決するかを明確に定義することは、他の種類のテクノロジーを使用するよりもはるかに不確実な作業であるということです。 4 月の記事に戻り、個人向けに AI を使用した経験を思い出してみましょう。

」[Y]送信するトークンの数を制御してコストを制御できることは明らかですが、この制御には限界があります。信号を簡潔にし、不要な命令を制限し、結果として入力コストを低く抑えることができます。ただし、エージェントデバイスが関与しており、LLM が他の LLM に渡す信号を作成している場合、信号の長さを管理する必要はありません。さらに重要なのは、特定のモデルが応答するトークンの数を最小限しか制御できないことです (「崩壊」するように指示するなど)。ほとんどの場合、出力トークンの数は、前に説明した非決定的な未知数の一部です。そして、出力トークンの価格は入力トークンの価格の 5 倍であることがわかります。

これをさらに詳しく説明すると、AI を使用すると、質問にうまく答えられない可能性が高くなります。したがって、スロットマシンのコンポーネントが問題をさらに悪化させます。技術スタッフは、A. プロンプトが返すトークンの数、B. 質問に対する適切な回答を得るためにプロンプトに何回入力する必要があるか (おそらく編集を含む) を知りません。コストを計算するには、すべての入力プロンプトトークンカウント (A、不明) とすべての出力プロンプトトークンカウント (A、不明) を必要な試行回数 (B、これも不明) まで合計する必要があります。 A と B は、モデルアーキテクチャ、当面の問題、モデル内のランダム性、およびおそらく舞台裏でさえ知らないその他の要因に応じて無限に異なります。次に、使用されているモデルのトークンあたりの価格をそれに掛けますが、4 月に説明したように、これも変動します。

したがって、あなたがテクノロジー企業の財務部門にいて、来年の AI トークンの予算を設定する必要がある場合は、幸運を祈ります。過去の使用状況に基づいても、あるいは会社の生産性目標に関する非常に優れた情報に基づいて推測したとしても、適切な金額の予算を立てる可能性は非常に低いように思えます。ただし、何らかの制限を強制する必要があり、白紙の小切手シナリオにすることはできないため、ある時点で人々を遮断する必要があります。

実際的な意味

これは実際にどのように機能するのでしょうか?上半期はAIを集中的に活用し、下半期は「手作業コーディング」でしょうか？第 3 四半期と第 4 四半期の電子メールとマーケティング文書はすべて手書きでしたか?限界に達したら、AI 文字起こしツールや音声テキスト変換ソフトウェアをシャットダウンするのでしょうか?これは私にとって興味深い質問です。AI を使用してコードを作成するエクスペリエンスが、AI を使用しない場合とどれほど異なるか、そして 2 つのプロセスを行ったり来たりすることがどれほど信じられないほど破壊的なものになるかを個人的に見てきたからです。

これは、AI のコスト削減が AI ベースのソリューションを提供する企業にどのような影響を与えるかという疑問も生じます。昨年の10月、私はハイパースケーラー（Anthropic、OpenAI、Googleなど）が、この業界に何十億ドルもつぎ込んだ投資家に利益を還元するために、どのようにスタートアップ企業にAIベースの機能を製品に実装するよう促しているかについて議論した。 AI 機能を提供するコストが上昇し、企業が従量制モデルにますます移行するにつれて、このフライホイールは崩壊し始めるでしょう。予算がコストの上昇に対応できないため、企業が AI ベースのツールの使用を減らし始めれば、ハイパースケーラーの収益パイプラインは枯渇してしまいます。 AnthropicとOpenAIは今年IPOを計画しているが、どちらも収益性への道筋が非常に不透明で、投資家に数千億ドルの負債を抱えているため、AI利用の減速は彼らにとって最も避けたいことだ。

Apple が先週の WWDC で AI 分野の製品を発表し、批評家たちはこれまでのところかなり肯定的な反応を示していることにも言及する価値があります。 Google Gemini のテクノロジーを使用した新しい Siri は、適切なプライバシー保護 (デバイスおよびプライベートクラウドのコンピューティングと最小限のデータストレージ) を備えており、ユーザーに追加の費用がかかることはありません。それが利用可能になり、品質が期待を満たしていれば、消費者による ChatGPT とクラウドの通常の使用も危険にさらされる可能性があります。

結論

このスペースに注目してください。「AI 法案に衝撃を受けた企業」と「史上最大の IPO を狙う OpenAI と人類の銃撃」の記事は別々に報道されることが多いですが、実際には異なる角度から見た同じ物語であるからです。テクノロジー企業は、AI によって利益が得られ、生産性が向上していると感じていますが、AI を導入するための無制限の予算があるわけではありません。彼らが無制限の予算を持っていないのであれば（日用品価格が予算を圧迫しており、経済センチメントがほぼ1世紀の追跡の中で最低であるため、消費者ももちろんそうではありません）、私たちは一歩下がって、OpenAI、Anthropic、その他の企業が何十億ドルもの収益を期待しているのかを尋ねる必要があります。これにデータセンター全般に対する世論の反発やAIに対する否定的な感情が加わると、ハイパースケーラーは大きな問題に直面することになるだろう。

私の作品の詳細については、www.stephaniekirmer.com をご覧ください。