近日,美国开放人工智能研究中心(OpenAI)推出的视频生成模型Sora震惊了IT圈。
Sora目前展示出的功能十分强大,能够根据用户输入的关键词生成长达“60S”的视频且视频质量非常高。
1、Sora生成的视频具有多样化表现
(1)在原始视频图像数据直接训练:过去,图像和视频生成需要将视频调整标准要求,但Sora打破了这一常规,可以直接在原始数据上进行训练。
(2)采样更灵活:Sora具备更灵活的采样能力,无论是宽屏1920x1080p视频、垂直1080x1920视频,还是介于两者之间的任何尺寸视频,都能轻松应对,这意味着Sora可以为各种视频生成要求匹配更恰当的内容。
(3)改进构图与框架:将Sora与一个将所有训练视频裁剪为方形的模型版本进行了比较。结果发现,在正方形裁剪上训练的模型有时会生成仅部分显示主题的视频。而Sora则能呈现出更加贴合的帧,充分展现了其在视频生成领域的优异性能。
(4)Sora具有图像和视频的多样化提示,可以接受图像或视频等多样形式的输入。
2、Sora深化语言理解
研究员利用GPT技术将简短的用户提示转换为更长的详细转译, 并将其发送至模型,这一应用使得Sora能够精准地按照关键词生成高质量的视频。
3、Sora具有新的模拟能力
在大规模训练过程中,研究员发现Sora能够模拟现实世界中的人物、动物和环境等方面,并且这些并没有依赖于任何明确的3D建模、物体识别等归纳偏差,而是纯粹通过模型的尺度扩展而自然展示的。
Sora的出现,预示着一个全新的视觉叙事时代的到来,能够依据关键词,将人们的想象力转化为动态画面,而这种生成技术一旦得到场景化应用,将对各行各业带来颠覆式的发展。
但Sora的行业发展之路无论从自身所需资源还是社会接受度都还需要度过一段艰难的时间。数据、算法和算力作为人工智能三素,也整体制约人工智能技术的发展。
算力作为人工智能技术发展的底层源动力,对大模型的训练和推理至关重要,而服务器则是算力的底层载体。
针对大模型训练,安擎基于“训练服务器+推理服务器+存储服务器”,推出“大模型算存解决方案”。
·EG8628G4·
安擎EG8628G4是一款面向云计算、大数据、AI等应用场景的高性能服务器,支持第四代英特尔®可扩展处理器。采用NVIDIA NVlink 互联技术,在6U空间内支持最新计算模块,单机AI性能达到16 PFlops,具有高扩展和高可用性。
·EG540S-G30·
安擎EG540S-G30是一款4U双路存储产品,支持Icelake全系列扩展处理器,整机可支持52个硬盘存储槽位,单机可提供1PB的存储空间。
安擎作为专业的AI服务器提供商,深耕AI服务器研产销多年,具有五大系列产品(训练服务器、推理服务器、边缘服务器、存储服务器、通用服务器),并拥有完备的供应链体系。
返回列表