AI

2024.12.06 14:15

アンソロピック「Claude 3.5 Sonnet」 デスクトップアプリも制御可能に

Shutterstock

Shutterstock

本稿は英国のテクノロジー特化メディアWonderfulengineeringによる2024年10月25日の記事を翻訳したものである。


AI関連のユニコーン、アンソロピックは自社のAI技術を日々進化させている。Claude 3.5 Sonnet をリリースしたのだ。

このアップグレードモデルは、人間ユーザーと同じようにソフトウェアとやり取りができる「コンピュータを使う」新APIで、デスクトップアプリケーションを制御できる。

参考記事>> AIユニコーン「アンソロピック」がOpenAIを凌駕する最新モデル公開

ボタンをクリックしたり、カーソルを動かしたり——

Claude 3.5 Sonnetの事業展開は投資家への売り込みにさかのぼるが、アンソロピックはこのたび、調査業務、Eメール、その他のバックオフィス業務を自動化できるAIの作成という目標の概要を明らかにした。 彼らはこのコンセプトを「AIの自己学習のための次世代アルゴリズム」と呼び、近い将来、経済の大部分を自動化できるようになるとしている。 そしてClaude 3.5 Sonnet.のリリースにより、そのビジョンはさらに現実味を帯びつつある。

アンソロピックは、新しい「コンピューターを使える」APIを使用してどんなデスクトップアプリをも制御できる画期的なアップグレードモデルを発表した。このAPIは現在はオープンベータ版ではあるが、Claude 3.5 Sonnetはボタンをクリックしたり、カーソルを動かしたり、人間が操作するようにソフトウェアを扱うことが可能だ。アンソロピックは「画面上で起こっていることを認識し、その判断を踏まえ、ソフトウェアツールを用いてタスクをこなせるようClaudeを訓練した」という。

Claude 3.5 Sonnet.の能力はすでにAmazon Bedrock、Google CloudのVertex AI、アンソロピックのAPIなどのプラットフォームを通じて試すことが可能だ。今回のアップデートされたバージョンは、既存モデルよりも高パフォーマンスを発揮し、特にコーディングや複雑なタスクにおいて改善が期待できる。

「問題発生時に軌道修正する」AI、スクロール・ズームなどにはまだ課題も


実は、デスクトップのタスクを自動化すること自体は目新しいアイデアではない。実際に多くの企業が同様のソリューションを提供している。 

ロボティック・プロセス・オートメーション(RPA)といった売り手から、RelayやInduced AIといった新しいスタートアップまで、ハイテク業界において「自動化」は長年注目されてきた。 しかし、アンソロピックの「アクション実行レイヤー」と呼ばれるAIへの取り組みが、Claude 3.5 Sonnetを他とは一等地を抜く存在にしている。同モデルは、プロセスを自動的にこなすだけでなく、問題発生時に軌道修正することができるのである。 アンソロピックによるとClaudeのコーディング能力は、あのOpenAIのモデルをも凌ぐという。

しかしまだ課題も残っている。 テストでは、Claudeはフライト予約の変更や商品の返品などに苦戦し、約半分のタスクしかこなせなかった。 アンソロピックは、このAIがスクロールやズーム等の作業にまだ問題があり、重要なちょっとした動作や通知を見逃すことがあると認めている。

一方で、この高度なテクノロジーが悪用される懸念を抱かずにはいられないのも事実だろう。 アンソロピックは、有害なタスクをフィルタリングしたり、やりとりのスクリーンショットを30日間保存したりするなど、悪用を防止するための対策を講じているが、まだ悪用リスクを排除しきれていないのが現状である。 最近の研究では、デスクトップにアクセスできないモデルが有害な可能性があることが判明しており、デスクトップ機能があれば、その危険性はより可視化しやすいかもしれない。

アンソロピックはリスクを認めつつも、徐々にAIを実世界で浸透させれば、AIへの理解が深まり、今は潜在している問題も対処・軽減できるようになるだろうという。 「今の限定的で比較的安全なモデルにコンピュータへのアクセスを与える方がはるかに良いと考えています」と同社は述べている。

安全性を高めるため、アンソロピックはまた、モデルが政府のポータルサイトのような機密性の高いサイトと相互作用するのを防ぐシステムを実装し、リスクの高い行動からAIを誘導する分類器を追加した。

翻訳=大石月子 編集=石井節子

ForbesBrandVoice

人気記事