News
2024.03.19
知財ニュース
画像と文章を同時に処理するマルチモーダルAI「Claude 3」、日本語含む多言語でGPT-4を凌ぐモデル登場

2024年3月4日(現地時間)、AIスタートアップのAnthropicは、以前のモデル「Claude 2」に続き、新しい大規模言語モデル「Claude 3」を発表した。この新モデルは、複数言語に対応しており、特に日本語能力を示すベンチマーク「Rakuda」で、OpenAIのGPT-3.5を上回るスコアをマークしている。さらに、Claude 3はGPT-4の性能も上回るとされ、画像と文章を同時に処理できるマルチモーダルAIとしての能力も備える。
Claude 3は「Haiku」「Sonnet」「Opus」という3つのバリアントに分かれており、それぞれコスト効率、性能のバランス、高性能を目指している。最上位モデルのClaude 3 Opusは、さまざまなベンチマークテストにおいて最高得点を記録し、特にビジョン機能のベンチマークではGPT-4Vを上回る成績を叩き出した。
Claude 3の特徴の一つは、20万トークンまでのコンテキスト長に対応している点である。長いコンテキストを効率的に処理するためには、再現率が重要とされ、Claude 3 Opusは精度99%を超える再現率を達成している。これにより、複雑で難しい質問にも正確に回答できる確率が大幅に上昇した。
料金体系においては、Haikuモデルが最もコストパフォーマンスに優れ、Sonnetモデルは中間、Opusモデルが最も高価だが、最高の性能を提供する。100万トークン当たりの料金は、それぞれHaikuが入力で0.25ドル(約38円)、出力で1.25ドル(約188円)、Sonnetが入力で3ドル(約451円)、出力で15ドル(約2260円)、Opusが入力で15ドル(約2260円)、出力で75ドル(約1万1300円)となっている。また、ユースケースに応じて、100万トークンまでのコンテキストウィンドウの拡張が可能である。SonnetとOpusモデルはすでにClaude APIを通じて一般に提供が開始されており、Haikuモデルの一般提供も近日中に予定されている。
Top image ©: Anthropic