News

2025.04.03

知財ニュース

OpenAI、GPT-4oにリアリティのある画像生成ができる新機能を搭載-GPUが“溶ける” アクセス殺到

OpenAI_top

OpenAIは、マルチモーダルの対話型AIモデル「GPT-4o」に新たな画像生成機能を追加した。4oの構造深くに機能を組み込み、画像と言語の関連性などを学習させ、リアリティのある画像生成ができるモデルを構築。入力プロンプトのイメージを正確に反映し、視覚的に滑らかで一貫性のある画像を生成する。

同社の画像生成AIモデル「DALL-E」シリーズよりも高性能な機能と位置付けている。また、動画生成AI「Sora」でも新機能を利用できる。

OpenAI_sub

シンプルな操作性も特徴だ。GPT-4oのプロンプト入力欄の「…」から「画像を作成する」を選択し、作りたい画像イメージを入力するだけ。プロンプトエンジニアリングの知識が不要で、誰でも簡単に使える。追加指示を重ねることで、色を変えたり、画像の要素を追加したりと手軽にブラッシュアップできる。

OpenAI_sub1-1

OpenAI_sub1-2

OpenAI_sub1-3

新機能は、現地時間2025年3月25日にリリースを開始。ChatGPT のPlus、Pro、Teamの有料プランに加え、無料プランにも展開している。ただ、開始以降アクセスが集中し、3月28日からは無料プランのみ1日3回までと利用を制限。OpenAIのサム・アルトマンCEOは、同日のX(旧Twitter)の投稿で、「GPUが溶けている」とコメントした。

世界中の注目を集めている4oの新機能の特徴はほかにもある。例えば、プロンプト内のテキストを画像反映する性能が高い。発表時に公開された画像では、道路標識やメニュー、招待状の記載内容を指定して生成した画像を例示している。

OpenAI_sub2

また、10~20個の異なるオブジェクトを、1つのプロンプトで生成することも可能。さらに、ユーザーがアップロードした画像を分析・学習し、その要素を統合して画像生成するなどもできる。

OpenAI_sub3

画像生成に求められる安全対策も講じている。児童虐待や性的虐待、ディープフェイクにつながる生成リクエストを制限。コンテンツの来歴証明技術「C2PA」も採用し、すべての生成画像にC2PAメタデータを付与して、生成画像であることを識別できるようにしている。安全対策の概要をまとめた「System Card」(PDF)も公開した。

一方でOpenAIは、現時点では新たな機能は「完璧ではない」と言及。複数の制限があるとし、リリース後にモデルを改良する予定だ。なお、DALL-Eは「思い入れのある」人向けに、引き続き提供するという。

ニュースリリースはこちら
OpenAI 「Native_Image_Generation_System_Card」

Top Image : © OpenAI

広告