ニュース24 (Nyūsu 24)

最新ニュース (Saishin Nyūsu) – 世界と日本の最新情報

クロード・ソネットの紹介 5

クロード・ソネットの紹介 5


Claude Sonet 5 は、これまでで最も強力な Sonet モデルとなるように設計されています。計画を作成し、ブラウザや端末などのツールを使用し、ほんの数か月前にはより大型で高価なモデルが必要だったレベルで自律的に実行できます。

多くの開発者にとって、エージェント AI 時代は Sonnet クラスのモデルから始まりました。Cloud Sonnet 3.5、3.6、および 3.7 は、コーディングとツールの使用において優れたスキルを示した最初のモデルでした。ただし、最近、エージェント機能が最も顕著に向上したのは、Opus クラスのモデルです。

Sonnet 5 はそのギャップを埋めます。その性能は Opus 4.8 に近いですが、価格は低くなります。これは、推論、ツールの使用、コーディング、知識タスクなど、エージェントのパフォーマンスの重要な側面において、前世代の Sonnet 4.6 に比べて大幅に改善されています。

Cloud Sonnet 5 ベンチマーク テーブル
Sonnet 4.6 および Opus 4.8 (参照用のより一般的に機能的なモデル) と比較した、さまざまな評価における Sonnet 5 のスコア。 Cloud Sonnet 5 は、システム カードの包括的な評価を詳細にレポートします。

弊社のセキュリティ評価では、Sonnet 5 は Sonnet 4.6 よりも望ましくない動作の全体的な割合が低く、エージェントのコンテキストで使用しても一般に安全であることがわかりました。この評価では、既存の Opus モデルよりもサイバーセキュリティ機能がはるかに少ないことも示されています。

本日より、Cloud Sonnet 5 がすべてのプランで利用可能になります。これは Free プランと Pro プランのデフォルト モデルであり、Max、Team、Enterprise ユーザーが利用できます。 Cloud Code と Cloud Platform でも利用可能で、開始価格は 2026 年 8 月 31 日まで入力トークン 100 万あたり 2 ドル、出力トークン 100 万あたり 10 ドルで開始され、その後は入力トークン 100 万あたり 3 ドル、出力トークン 100 万あたり 15 ドルになります。開発者が使用できる claude-sonnet-5 クラウドAPI経由。

Cloud Sonnet 5 の使用

以下のグラフは、エージェント検索評価 BrowseComp およびコンピュータ使用率評価 OSWorld-Verified における、さまざまな作業レベルでの Sonnet 5 と Sonnet 4.6 および Opus 4.8 のパフォーマンスを比較しています。 SONNET 5 (オレンジ色の線) は、SONNET 4.6 (灰色の線) に比べて大幅に改善されています。 Opus 4.8 (黄色の線) は、これらのタスクで高精度を実現するために依然として最適なモデルですが、Sonnet 5 は、以前よりもはるかに高品質で低価格のオプションを開発者に提供します。 Sonnet 5 と Opus 4.8 の間で、ユーザーは作業レベルを調整して、コストとパフォーマンスの適切なバランスを見つけることができます。

早期アクセス パートナーからのフィードバックは一貫しており、Sonnet 5 は以前のバージョンよりもはるかにエージェント的です。テスターは、以前の Sonnet モデルでは不十分だった複雑なタスクをどのように実行するか、明示的に要求せずに自身の出力をチェックする方法、およびこれらすべてのエージェント作業を魅力的な価格帯でどのように実行するかを説明しました。

セキュリティ評価

導入前のセキュリティ評価では、全体的に Sonnet 5 が Sonnet 4.6 よりも優れていることがわかりました。エージェント セキュリティの観点からは、このモデルは悪意のあるリクエストを拒否し、初期のインジェクション攻撃におけるハイジャックの試みに抵抗する点で優れています。このモデルは、Sonnet 4.6 よりも幻覚や媚びる率が低いことを示しています。虐待や欺瞞への協力など、幅広い不適応行動をテストする自動行動監査では、Sonnet 5 は全体的に低いスコア (つまり、安全) でした。ただし、この評価では、より高性能な Opus 4.8 や Cloud Mythos Preview と比較して、不発率が若干低いことが示されました。

クラウドモデルにおける不整合動作の割合
自動動作監査での不正確な動作の割合。複数の状況やコンテキストにおける非常に広範囲の望ましくない動作をテストします (特定の動作ごとの完全なリストと結果については、Sonnet 5 システム カードのセクション 6.4 を参照してください)。 Sonnet 5 では、Sonnet 4.6 よりも全体的に不整合な動作の割合が低くなりますが、Mythos Preview や Opus 4.8 よりは割合が高くなります。

私たちは意図的に Sonnet 5 にサイバーセキュリティのタスクを訓練しませんでした。日常的な無害なサイバー タスクは実行できますが、ソフトウェア エクスプロイトの開発など、潜在的に危険なサイバー スキルをテストすると、Opus 4.8 や Mythos 5 などのモデルよりも大幅に悪いパフォーマンスが示されます。Firefox ブラウザーの脆弱性に対するエクスプロイトを開発するモデルの能力をテストした評価のスコアを以下のグラフに示します。 Sonnet 5 は完全に機能するエクスプロイトを開発できませんでしたが、わずかに高い率を示しています 部分的 Sonnet 4.6 よりも成功しています。この後者の変化は、特定の訓練ではなく一般的な知性の向上によるものと考えられます。

Firefox 147 におけるソフトウェア脆弱性の進化を軽減するクラウド モデルの成功を測定するスコア
Firefox 147 のソフトウェア脆弱性のエクスプロイト開発におけるモデルの成功を測定するスコア (この評価は Mozilla と協力して開発されました。すべての脆弱性は Firefox 148 でパッチされています)。各モデルの左側のバーは、そのモデルが機能するエクスプロイト (セキュリティ対策なし) を開発した回数を示します。右側のバーは、モデルが部分的に成功した回数を示します。 Sonnet モデルはいずれも、実用的なエクスプロイトの開発に成功しませんでした (スコアは両方とも 0.0%)。 SONNET 5 は、SONNET 4.6 よりもわずかに高い部分成功率を示しました。どちらの Sonnet モデルも、Opus 4.8 および Mythos 5 よりもサイバー機能が大幅に劣っています。詳細については、Sonnet 5 システム カードのセクション 3.2.4 を参照してください。

Sonnet 5 はこれらの機能が前世代よりも若干強化されているため、デフォルトでサイバーセキュリティ対策を有効にしてリリースしました。危険なサイバー利用をリアルタイムで検出して防止するこれらのセキュリティ対策は、Cloud Opus 4.7 および 4.8 に存在するものと同じです (Sonnet 5 によるサイバーセキュリティ リスクの全体的なレベルが低いと推定されたため、セキュリティ対策は Fable 5 で開始されたセキュリティ対策よりも厳しくなく、より広範なサイバーセキュリティ アクションを防止します)。1

複数のセキュリティと機能の評価にわたる Sonnet 5 の完全な評価は、Cloud Sonnet 5 System Card に詳しく記載されています。

在庫状況と価格

Cloud Sonnet 5 は、本日から 2026 年 8 月 31 日までどこでも、入力トークン 100 万あたり 2 ドル、出力トークン 100 万あたり 10 ドルの導入価格で利用できます。その後、入力トークン 100 万あたり 3 ドル、出力トークン 100 万あたり 15 ドルの標準価格に移行します。2 Chat、Cowork、Cloud Code、Cloud Platform のレート制限を引き上げました3 より高い労力レベルでのより高いトークンの使用に対応するため。ユーザーは、特定のプロジェクトに適したレベルを選択できます。

Leave a Reply

Your email address will not be published. Required fields are marked *

ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಚುನಾವಣಾ ಫಲಿತಾಂಶಗಳು ಸಿಎ ಚುನಾವಣಾ ಫಲಿತಾಂಶಗಳು ಚುನಾವಣಾ ಫಲಿತಾಂಶಗಳು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಚುನಾವಣೆ ಚುನಾವಣಾ ಫಲಿತಾಂಶಗಳು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಪ್ರಾಥಮಿಕ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಪ್ರಾಥಮಿಕ ಫಲಿತಾಂಶಗಳು ಇಂದು ಪ್ರಾಥಮಿಕ ಚುನಾವಣಾ ಫಲಿತಾಂಶಗಳು ಸಿಎ ಗವರ್ನರ್ ರೇಸ್ ಫಲಿತಾಂಶಗಳು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಗವರ್ನರ್ ಸ್ಟೀವ್ ಹಿಲ್ಟನ್ ಗವರ್ನರ್ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಚುನಾವಣೆಗಳು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಚುನಾವಣಾ ಫಲಿತಾಂಶಗಳು 2026 ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಗವರ್ನರ್ ರೇಸ್ ಫಲಿತಾಂಶಗಳು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಸಿಎ ಪ್ರಾಥಮಿಕ ಫಲಿತಾಂಶಗಳು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಪ್ರಾಥಮಿಕ 2026 ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಗವರ್ನರ್ ರೇಸ್ ಪೋಲ್ಸ್ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾದ ಗವರ್ನರ್ ಅನ್ನು ಯಾರು ಗೆದ್ದರು ಲಾ ಗವರ್ನರ್ ರೇಸ್ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಗವರ್ನರ್ ರೇಸ್ ಅನ್ನು ಯಾರು ಗೆದ್ದರು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಪ್ರಾಥಮಿಕ ಫಲಿತಾಂಶಗಳು 2026 ಪ್ರಾಥಮಿಕ ಫಲಿತಾಂಶಗಳು ಸಿಎ ಗವರ್ನರ್ ರೇಸ್ ಸಿಎ ಚುನಾವಣಾ ಫಲಿತಾಂಶಗಳು 2026 ಗ್ಯಾವಿನ್ ನ್ಯೂಸಮ್ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಫಲಿತಾಂಶಗಳು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಗವರ್ನರ್ 2026 ಅನ್ನು ಯಾರು ಗೆದ್ದರು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಗವರ್ನರ್ ಪ್ರೈಮರಿ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾದಲ್ಲಿ ಗವರ್ನರ್ ರೇಸ್ ಅನ್ನು ಯಾರು ಗೆದ್ದರು ಸಿಎ ಪ್ರೈಮರಿ ಚುನಾವಣಾ ದಿನ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಕ್ಯಾಲಿಫೋರ್ನಿಯಾ ಗವರ್ನರ್ ಫಲಿತಾಂಶಗಳು