Forgot password?
sky86
sky86

文生视频大模型Sora

文生视频大模型Sora

OpenAI 文生视频大模型Sora【颠覆】
生成式视频的到来,这是个双刃剑,意味着虚假信息会真到无以复加!
OpenAI 文生视频大模型Sora:生成式视频的到来,这是个双刃剑,意味着虚假信息会真到无以复加!
https://www.zhihu.com/question/644478554/answer/3397579518
。。。
之所以有你说的这个问题,主要还是在于国内的AI发展和美国的差距在拉大,更关键的是因为半导体生产受限,目前无法在硬件上发挥出规模优势,就无法快速形成生产力。
你看是不是中国不能做的都贵得离谱,然后等中国能做了就会快速的白菜化,是既是福利,也是悲哀。
。。。
Sora是一种对视觉数据进行广义建模的模型,它可以生成跨越不同持续时间、宽高比和分辨率的视频和图像,高清视频的长度可达一分钟。
https://www.zhihu.com/question/644478554/answer/3397641936

真的太强了。文生视频一直是 AI 落地比较酷炫的一个应用场景,但在 OpenAI 的 SORA 之前,感觉都还有明显的短板。
、、、
从 22 年的文字,到 23 年的图片,再到 24 年的视频,(其实音频生成也已经很厉害了),AI 真的已经进化了太多。感觉多年前看上去不切实际的元宇宙很快就要迎来落地了。
https://www.zhihu.com/question/644478554/answer/3397626377

谷歌发布新一代多模态大模型 Gemini 1.5谷歌发布新一代多模态大模型 Gemini 1.5
谁能想到呢,谷歌这次体验了一把汪峰老师被抢头条的感觉。。不过从对人类社会的震撼程度来讲,OpenAI 的 SORA 确实比这次的 Gemini 强了好几个数量级。谷歌这次输得不冤
https://www.zhihu.com/question/644489216/answer/3397665527

。。。。。。。
之前相关

OpenAI 王炸模型引爆科技圈
科技终归是国之重器 经济基石科技终归是国之重器 经济基石【实验室】
OpenAI 2月16日凌晨发布了文生视频大模型Sora,在科技圈引起一连串的震惊和感叹,在2023年,我们见证了文生文、文生图的进展速度,视频可以说是人类被AI攻占最慢的一块“处女地”。而在2024年开年,OpenAI就发布了王炸文生视频大模型Sora,它能够仅仅根据提示词,生成60s的连贯视频,“碾压”了行业目前大概只有平均“4s”的视频生成长度。
为了方便理解,我们简单总结了这个模型的强大之处:
1、文本到视频生成能力:Sora能够根据用户提供的文本描述生成长达60S的视频,这些视频不仅保持了视觉品质,而且完整准确还原了用户的提示语。
2、复杂场景和角色生成能力:Sora能够生成包含多个角色、特定运动类型以及主题精确、背景细节复杂的场景。它能够创造出生动的角色表情和复杂的运镜,使得生成的视频具有高度的逼真性和叙事效果。
3、语言理解能力:Sora拥有深入的语言理解能力,能够准确解释提示并生成能表达丰富情感的角色。这使得模型能够更好地理解用户的文本指令,并在生成的视频内容中忠实地反映这些指令。
4、多镜头生成能力:Sora可以在单个生成的视频中创建多个镜头,同时保持角色和视觉风格的一致性。这种能力对于制作电影预告片、动画或其他需要多视角展示的内容非常有用。
5、从静态图像生成视频能力:Sora不仅能够从文本生成视频,还能够从现有的静态图像开始,准确地动画化图像内容,或者扩展现有视频,填补视频中的缺失帧。

6、物理世界模拟能力:Sora展示了人工智能在理解真实世界场景并与之互动的能力,这是朝着实现通用人工智能(AGI)的重要一步。它能够模拟真实物理世界的运动,如物体的移动和相互作用。
可以说,Sora的出现,预示着一个全新的视觉叙事时代的到来,它能够将人们的想象力转化为生动的动态画面,将文字的魔力转化为视觉的盛宴。在这个由数据和算法编织的未来,Sora正以其独特的方式,重新定义着我们与数字世界的互动。一反常态,OpenAI在模型公布后的不久,就公布了相关的技术Paper,我们第一时间“啃”了这篇技术报告,希望能够帮助大家理解到底有哪些神奇的技术,让Sora能够有如此强大的魔力。
。。。。。。。
图注:Sora生成的东京街头场景视频
在Sora生成的视频里,身着黑皮衣、红裙子的女子在霓虹街头行走,地面有积水的倒影。

采样更灵活
Sora具备出色的采样能力,无论是宽屏1920x1080p视频、垂直1080x1920视频,还是介于两者之间的任何视频尺寸,它都能轻松应对。这意味着Sora可以为各种设备生成与其原始纵横比完美匹配的内容。更令人惊叹的是,即使在生成全分辨率内容之前,Sora也能以较小的尺寸迅速创建内容原型。而所有这一切,都得益于使用相同的模型
。。
OpenAI 王炸模型引爆科技圈
我们第一时间深读了官方技术报告
原创 郭晓静、郝博阳 腾讯科技 
2024-02-16 16:52 北京
https://mp.weixin.qq.com/s/aUyOkXQJoAYNmkLA7H5o2Q
谷歌这两天确实挺惨的,刚被黄皮衣的英伟达超越了市值。 又被OpenAI暴打一顿。
将来的世界 有多少还会是真的[破涕为笑][破涕为笑]
想象空间无限
。。。。
胡锡进:AI也许永远、或者在“可预见未来内”无法彻底满足人类个性化的需求,尤其做不到感情方面的细致入微,也许人在终结意义上就是不可模仿的,但是AI的工业化使用潜力已经清楚地展现在了人类面前,它将能够代替大量一般性的体力和脑力劳动,冲击无数行业,重塑人类的工作和消费场景

这是爆炸性进展!
原创 胡锡进 胡锡进观察 2024-02-16
这的确是爆炸性进展。美国OpenAI公司今晨发布了首个文生视频模型Sora,让老胡接着看春节档电影都有些心神不宁了。到今天中午,在贾玲现实主义电影《热辣滚烫》的引领下,中国今年春节档的票房突破70亿。但是Sora在点亮AI影像制作未来的同时,也给全球现实主义电影的前途抹上了阴影。
根据OpenAI公司的演示,用户可以在Sora上输入一段文字指令,瞬间生成长达1分钟有电影质感的逼真视频。全世界的影像制作行业被强烈震撼,很多人惊呼:视觉影像制作的革命性时代真的到来了。
尽管OpenAI表示,Sora仍存在一些弱点,比如它在准确模拟复杂场景的物理现象方面仍存在困难,可能不理解特定的因果关系,会搞错左和右,以及在准确体现随时发生的事件方面遇到困难等等,但是去年4月一家AI初创公司刚刚推出一项技术,让人们只需在电脑屏幕的输入框里打出一个句子,就可以生成几秒钟略显混乱的视频,时隔仅10个月后,我们看到的是非专业人士已经觉得相当OK的AI文生一分钟视频。这样的进步速度完全是AI式的,它让一些在评论区留言的网友忍不住幻想:有一天,也许不会太久,把一个剧本输入进去,一部电影就能够自动生成了

当然了,AI也许永远、或者在“可预见未来内”无法彻底满足人类个性化的需求,尤其做不到感情方面的细致入微,也许人在终结意义上就是不可模仿的,但是AI的工业化使用潜力已经清楚地展现在了人类面前,它将能够代替大量一般性的体力和脑力劳动,冲击无数行业,重塑人类的工作和消费场景,还能够极大加速人类文明的演进速度,这些已经不用再怀疑了!
我们大多数人将在AI开辟的新时代里随波逐流,而此时此刻,老胡最关心的问题是:美国AI公司的快速进步对中国意味着什么?中国的相关AI技术发展得怎么样了?我们的AI技术与美国是像一些人描述的那样已经拉开距离,并且差距越来越大吗?我们该如何做,才能不让自己落伍呢?
这些问题很专业,同时它们也很严峻。从老胡能够看到的一些专业人士的反馈中,他们显得有些悲观,或者说信心不足。一是因为美国卡高端GPU芯片,一定程度上抑制了中国AI公司的算力。二是中国大语言模型以及AI视频开发需要对内容安全投入巨大精力,这些都是中国发展AI需要面对的现实成本。
困难是需要应对的,但是它们不能成为我们接受在AI上落后于美国并且任由差距拉大的理由。整个国家必须明白,我们是承受不起AI大幅落后美国的,那将产生一系列国家安全后果。为此我们首先要承认落后在发生,实事求是,决不能自我安慰,更不能骗自己。然后对困难和问题我们要下更大力气克服它们,缓解它们,这个克服和缓解过程需要是思想解放的、创造性的、勇于自我改变的。
Sora的出现是人类AI技术新的里程碑,但从国家竞争意义上来说,它对中国又是新的警钟,是我们必须进一步行动起来新的倒逼。
我们的现实主义电影很棒,老胡是它们最热情的粉丝之一。但是我同时衷心祝愿,中国AI技术大规模向影视渗透的过程要紧紧咬住美国,我们不仅要为一个可能由AI主导的全新影视时代未雨绸缪,而且一定要参与引领那个时代的到来。

https://mp.weixin.qq.com/s/aUyOkXQJoAYNmkLA7H5o2Q


芯片、半导体、
华为、鸿蒙系统、好奇心、创意创造力
。。
需要新的经济红利
2024,我们需要新的经济红利
原创 曹多鱼 多鱼说 2024-02-15 09:30 
房地产,没人买了,教育改变未来,谈不下去了,医疗也抗不住老龄化了。
我们消除不掉这些影响。
我们现在需要去找新的经济红利。

https://mp.weixin.qq.com/s/Dv5vQ98l9-mWKuslPvC1wg

经济萧条、时代趋势、高清显卡

知乎:
英伟达创始人黄仁勋称「必须学会计算机的时代过去了,人类生物学才是未来」,如何看待此言论?
https://www.zhihu.com/question/644449435?utm_psn=1742094746183610368