今天凌晨,OpenAI 从「弹药库」里掏出了 AI 视频生成工具 Sora,瞬间占据了各大新闻头条。
就连一向和 OpenAI 不对付的马斯克也甘心承认 Sora 的强大,并借此盛赞「在未来的几年里,人类借助 AI 的力量,将创造出卓越的作品。」
Sora 的强大之处在于能够根据文本描述,生成长达 60 秒连贯流畅的视频,其中包含细腻复杂的场景、生动的角色表情以及复杂的镜头运动。
对比其他只能生成短至个位数长度的视频,Sora 的一分钟时长无疑起到了掀桌的效果。
更为重要的是,无论是在视频的真实性、长度、稳定性、一致性、分辨率还是对文本的理解方面,Sora 均展现出了目前最佳的水平。让我们先来欣赏一下官方发布的演示视频片段。
Prompt: Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.
在这段视频中,无人机视角下的一对情侣穿梭于繁华的城市街道,美丽的樱花花瓣伴随着雪花在空中翩翩起舞。