OpenAIの最新動画・音声生成モデル「Sora 2」に関する詳細をお届けします。
2025年9月30日、OpenAIは最新の動画・音声生成フラッグシップモデルである「Sora 2」を発表しました。この新モデルは、従来のシステムを大幅に上回る物理的な正確性、リアリズム、制御性を実現しており、同期された対話や効果音も同時に生成可能です。さらに、Sora 2の能力を最大限に活用するための新しいiOS向けソーシャルアプリ「Sora」も同時に発表されました。
Sora 2の飛躍的な進化
OpenAIは、2024年2月に発表した初代Soraをビデオ生成における「GPT-1の瞬間」と位置づけています。それに対し、Sora 2は「GPT-3.5の瞬間」に相当する飛躍を遂げたと説明されています。
主な進化点:
- 物理世界の高度な理解:Sora 2は、オリンピックの体操選手の演技や、ウェイクボードでのバックフリップといった、複雑な物理的相互作用を極めて自然にモデリングできます。従来のモデルでは、プロンプトを成功させるために物理法則を無視する傾向がありましたが、Sora 2は失敗する状況も正確にシミュレートしようとします。例えば、バスケットボールのシュートが外れた場合、ボールは自然にリバウンドします。
- 音声の同時生成:Sora 2は、ビデオと音声を同時に生成する初のSoraモデルです。複数の話者による様々な言語での対話、効果音、環境音(サウンドスケープ)などを高精度で生成できます。
- 物語性(ナラティブ)と制御性の向上:複数のショットを含む、より長く一貫性のある物語を一度の生成で作成する能力が向上しました。ショット間の切り替えや自然なジェスチャー、表情、正確なリップシンクなどもSora 2で新たに追加された機能です。
- 多様なスタイル表現:リアルな実写からアニメスタイルまで、幅広い美的スタイルに対応しています。
新機能「Cameo(カメオ)」とソーシャルアプリ「Sora」
Sora 2の最も革新的な機能の一つが「Cameo(カメオ)」です。これは、ユーザーが短い動画と音声を録画・アップロードすることで、自分自身や友人、ペット、さらには物体までもSoraが生成するあらゆるシーンに登場させることができる機能です。
このCameo機能を核として開発されたのが、新しいソーシャルiOSアプリ「Sora」です。
- アプリの概要:ユーザーはプロフィールを持ち、他のユーザーをフォローできます。フィードに流れるコンテンツはすべてAIによって生成されますが、投稿するのは人間です。これにより、既存のソーシャルメディアとは全く異なる新しいコミュニケーション媒体のような感覚を生み出します。
- Cameoの安全性と制御:Cameo機能を使用するには、なりすましを防ぐための本人確認プロセス(動的な音声プロンプトや頭を動かすなどのライブネスチェック)が必要です。ユーザーは自分のCameoを誰が使用できるか(自分のみ、承認した人、相互フォロー、全員など)を完全にコントロールできます。また、自分のCameoが使われて生成された動画はいつでも削除する権利を持ちます。
- Remix機能:フィード上の動画を見てインスピレーションを得たユーザーは、「Remix」ボタンを押すことで、その動画をベースにした独自のバリエーションを簡単に作成できます。
- 責任あるアプリ設計:OpenAIは、ユーザーのウェルビーイングを重視しています。フィードの内容を自然言語で制御できる機能を導入し、消費よりも創造を促す設計にしています。特に10代のユーザーに対しては、デフォルトでスクロール時間に制限を設けたり、Cameoの権限を厳しくしたりするなどの保護措置を講じています。
安全性への取り組み
Sora 2とSoraアプリは、安全性と責任ある展開を重視して設計されています。
- コンテンツの出所明記:アプリからエクスポートされた動画には、AI生成であることを示すための透かし(ウォーターマーク)が付けられます。また、C2PA規格にも対応しています。
- 有害コンテンツの防止:Sora 1や画像生成モデルで培われたモデレーション技術に加え、推論モデルを活用して有害コンテンツの生成を困難にしています。特にCameo機能では、成人向けコンテンツや暴力的なコンテンツを作成できないように厳格なガードレールが設けられています。
提供状況と今後の展開
- Soraアプリ:iOSアプリは米国とカナダで提供が開始され、招待制でロールアウトされます。Android版も開発中です。
- ウェブ版とAPI:既存の
sora.comもSora 2モデルにアップデートされます。また、数週間以内にAPIも公開される予定で、開発者は独自のビデオエディタなどにSora 2を統合できるようになります。 - Sora 2 Pro:ChatGPT Proユーザーは、より高品質な実験的モデル「Sora 2 Pro」を
sora.comで利用できます。
OpenAIは、Sora 2がAGI(汎用人工知能)への道筋における重要な一歩であり、物理世界を深く理解するAIの実現に不可欠だと考えています。Sora 2とSoraアプリを通じて、世界に多くの喜び、創造性、そしてつながりをもたらすことを目指しています。
要約まとめ
動画と音声の同時生成
Sora 2は、ビデオと同期した対話、効果音、環境音を同時に生成する初のSoraモデルです。
新機能「Cameo (カメオ)」
ユーザーが短い動画と音声をアップロードするだけで、自分自身や友人、ペットなどをAIが生成するあらゆるシーンに登場させることができます。
ソーシャルアプリ「Sora」
Cameo機能を活用した新しいiOS向けソーシャルアプリです。AIが生成したコンテンツを友人同士で共有・リミックス(改変)して楽しむ、新しい形のコミュニケーションを提供します。
安全性と制御
なりすまし防止のための本人確認プロセスや、自分の Cameo を誰が使えるかを管理する機能が備わっています。また、AI生成コンテンツであることを示す透かしやC2PA規格にも対応しています。
提供開始
iOSアプリは米国とカナダで招待制にて提供が開始されます。


コメント