文字变视频！OpenAI发布新AI模型Sora

OpenAI去年凭借ChatGPT的流行而进入主流，现在该公司正将其人工智能技术应用到视频行业。

OpenAI于周四推出了其新的生成式AI模型Sora。Sora的工作方式类似OpenAI的图像生成AI工具DALL-E。用户输入所需场景，Sora将返回一个高清视频片段。Sora还可以生成受静态图像启发的视频片段，或扩展现有视频或填充缺失帧。

Sora是一个扩散式人工智能模型，与ChatGPT一样，它使用谷歌研究人员在2017年论文中提出的Transformer架构。OpenAI在其声明中写道：“Sora为能够理解和模拟现实世界的模型奠定了基础。”

Sora目前只能生成一分钟或更短的视频。作为微软支持的OpenAI，其发展目标之一是多模态——将文本、图像和视频生成结合起来，从而提供更广阔的人工智能模型套件。

目前，Sora只提供给一小部分安全测试人员 (又称“红队”)
使用，他们负责测试模型在错误信息和偏见等方面的漏洞。该公司表示，其配套的技术论文将在周四晚些时候发布。

OpenAI还表示，他们正在构建一个可以识别由Sora生成的视频的“检测分类器”，并计划在其输出中包含某些元数据，以帮助识别人工智能生成的内容。这与Meta在今年大选期间用来识别人工智能生成图像的元数据类型相同。

现在聊天机器人和图像生成器已经进入消费和商业世界，视频可能是生成式AI的下一个前沿。

借助Sora，OpenAI正在寻求与Meta和谷歌等公司的视频生成AI工具竞争，后者于
1月宣布了Lumiere。其他初创公司也提供了类似的人工智能工具，例如Stability AI，其产品名为Stable Video
Diffusion。亚马逊还发布了Create with Alexa，这是一个专门生成基于提示的短格式动画儿童内容的模型。

OpenAI官网发布的Sora生成视频：

Tokyo in the snow

<br />

Gold Rush

<br />

Ships in coffee

<br />

Big Sur

<br />

文字变视频！OpenAI发布新AI模型Sora

猜你喜欢

评论0