LOADING

AI模型训练

Sora

OpenAI 推出的一款 AI 文本到视频生成模型

Sora 是 OpenAI 推出的一款 AI 文本到视频生成模型,它能够根据用户提供的文本描述生成对应的视频。Sora 采用了类似 GPT 的 Transformer 网络结构,并使用 DALL-E 3 的重新描述技术,可以处理不同时长、分辨率和格式的视觉数据,能够更好地根据用户文字描述中的细节生成视频内容。

Sora 模型分为两个版本:Sora 2B 和 Sora 7B,分别针对不同的应用场景。这两个版本都经过安全训练,使用自动化技术从训练数据中剥离个人信息,并采用基于人类反馈的强化学习来确保模型的指令调整变体表现出负责任的行为。

Sora 不仅可以生成单个视频,还能够将已有视频或图片进行延续和补全,确保目标即使暂时消失在视线之外也保持不变。此外,Sora 还可以生成包含多个场景和角色的复杂视频,角色表达会贯穿始终。它也可以基于图片生成视频。

OpenAI 正在与相关机构合作,通过对抗测试等手段来确保 Sora 生成的视频的真实性和安全性。在未来,OpenAI 计划推出更高级的 Sora 版本,以提高生成视频的质量和准确性。

Sora

相关导航

暂无评论

暂无评论...