来源:China-Venture(ID:China-Venture) 作者:刘艳秋朴凡首先讲了两个非常有“中国特色”的荒唐笑话。对于小红书,一位投资领域的博主表示,一天就找到了三个项目。他们来到这里并表示要制作中国版的《Sora》,但他们的想法是,“让我们看看是否能赚钱。”昨天广为流传的另一张照片被贴上“中美两大AI巨头”的标签。美国代表是OpenAI首席执行官奥特曼先生,中国代表是销量过亿的AI课程博主李一洲。怎么说呢?前者虽未经证实,但却代表了一些人对人工智能企业家乃至整个企业家群体的“刻板印象”,而到了李一洲身上,这种“刻板印象”最终是有明确目标的。谁让人们赚钱了?然而事实证明这是一个错误,被看不起的是中国AI。开个玩笑,当我向一些投资朋友询问这个消息时,得到的答复是,他们都没有遇到过打着中国版Sora旗号的如此离谱的项目。或许这是因为大家还处于震惊之中,需要时间来反应。这可能是因为与去年ChatGPT创造的热潮相比,今年的情况相似但又不同。虽然失去对世界的控制感的心理大致相似,但不同的是,企业家和投资者经过去年的洗礼,今年都成熟了。有些人清楚地意识到,兴奋仍然是兴奋,但大部分兴奋是OpenAI。 “创业至上” “OpenAI这么厉害,我们以后不太可能投资文盛视频项目了。”一位主流投资机构的朋友告诉我。认清现实后,很难判断这种心态是悲观还是冷静。回顾过去,类似的言论始于去年3 月GPT4 发布该插件时。在第《第一批投AIGC的VC开始后悔了》 篇文章中,我写道,当时一个典型的担忧是:“所有垂直应用公司都会被基于GPT4 插件的生态系统所取代吗?”我之前投资的项目会不会过时?我以后还想再看到它们吗?这样的事情时常发生,所以不要责怪写吐槽的人。去年年底,Altman 在YC 上的演讲给生成人工智能领域的企业家泼了一盆冷水。他建议,技术发展应以通用人工智能的实现为基础。由于与GPT4 相比,GPT5 是一个潜在的巨大飞跃,这一进步将为初创公司和老牌公司带来许多挑战。相反,他不建议创建解决GPT4 当前限制的产品。这是因为GPT5 中修复了大部分限制。这份创业指南诚实、傲慢,危害极大。这家AI巨头的领导者正在警告企业家不要过度扩张,OpenAI自己的迭代计划很快就会惠及更多公司。我什至想到了一年前另一个“大模特”选题中的另一段话。当时,ChatGPT给世界带来了“小震动”,也带来了密集投资的爆发。他们几乎所有人都在努力寻找企业家。您还可以提供类似的产品,并毫不犹豫地赞扬您找到的企业家。
出于本能的警惕,我做了一个简单的调查,向30多个人工智能领域的创业团队发出了QA邀请,我试图弄清楚我是否夸大其词。 “我们认为人工智能的这一轮发展是人类智能不断融合的过程。在这个过程中,很多流程和环节被吞噬,形成一个端到端的系统。上一代互联网有独角兽。”企业在这些环节上形成了超级智能(即互联网时代是“平权”创业的时代),但现在没有机会了—— 比如在GPT4之前,很多企业都在做视频和图像处理。但GPT4发布后,将是一个巨大的打击。该模型能否成立值得怀疑。这个答案来自极智魔方创始人徐达达。简单总结一下,他认为当前的人工智能热潮几乎没有留下多少机会,我们可能面临一个“霸道创业”的时代。而这种“霸道创业”意识,通过创业者充分传递给投资人。通过徐达达与很多VC的接触,目前的共识是商业计划应该有“战略性推进的时间”,而不是“时间加快”,我理解这一点。我们正在保持足够的计算能力。专门从事视频生成领域的AI投资人Magic(化名)给我分享了一个真实的案例。去年,他们的团队多次争论是否要创办一家Vincent Video公司,但最终决定不投资。最初的挣扎是,从国内企业的角度来看,现有的解决方案显然存在性能限制,虽然我们知道OpenAI正在使用更根本的方法来解决问题,但我不知道它什么时候能完成。 “坦白说,我们知道OpenAI 会让这一切发生。我们不认为其他公司有机会,但我们没想到它会发生得这么快。” OpenAI 当然可以想到你能想象到的任何现有场景。也许会出现新的场景? OpenAI的超强能力让AI投资者感到困惑,不知道在应用层面该投资什么。至于追赶,魔术队则没有那么乐观。他认为,国内企业与OpenAI的差异本质在于视野、认知、工程能力的差异,没有一家企业能够在短时间内弥合这种差距。当然,国内一些企业公布的情况与实际情况存在差异。例如,在去年的公司新闻稿——中,我们看到这样的表述:“视频生成实现了可控的内容重写和风格转换,表现优于Runway等主流模式。纵观国内近年来的‘类Sora产品’,我国科技行业的企业家们并没有停止尝试开发“类似Sora的产品”。从技术角度来看,它们可以分为两类。一个是Vinson Video,这是一种源自编辑工具的产品。与Sora类似,此类产品的使用逻辑非常“自然语言”。用户只需输入文字内容,产品就会将其与相应的视频素材进行匹配,生成电影。然而,此类产品不产生视频。在素材库内调用,而不是根据文本内容创建素材。时间线上,2020年10月,知乎推出“一键图文转视频”,配合同时启动的“海燕计划”,内容视频大战拉开了帷幕。 2021年,视频片段也将上线,由于很多创作者使用“在电影中插入照片和文字”功能,一致的结论是“感觉很多营销号都要破产了”。 ' 到达。
可以说,这条技术路线的成熟,催生了最近Sora衍生话题:—— Sora会“杀”电影吗?小编也建议:内部讨论得出的结论是,GPT 相关问题要到2023 年才会出现、“张楠年初宣布辞去抖音集团CEO 职务,专注于剪辑”、“AI 视频生成将成为主流”。这是有可能的,”他总结道。是Byte Jump发现的“第二增长曲线”最现实、最直接的结论。前字节跳动算法工程师Pixel Alchemist 也有类似的观点。在回答知乎“OpenAI的视频模型Sora能否颠覆影视制作?”的问题时,他写道: ``不要怀疑视觉模型的力量.ChatGPT的上限值得商榷,并且``大型语言模型可以面对数据。高质量数据的缺乏早已存在,已纳入GPT4的训练集。然而,视觉数据与文本不同;我们几乎可以无限地从世界各地收集它。”由数据组成。 -模态大模型在“文胜视频”的衍生产品中,因让郭德纲说英语、特朗普说山东话而走红的HeyGen就是其中的代表产品之一。类似的产品还有FancyTech、Wondershare、腾讯智影等,它们都可以让用户“输入自然语言”生成视频,并有针对性地原生展示部分素材,具备生成的能力。从冷静的技术角度来看,似乎有人怀疑Sora被“神化”,许多AI行业的巨头可能在某种程度上高估了自己的技术壁垒,但指出目前并不存在这样的情况。事物。 2022年10月,谷歌宣布开发文本转视频产品Imagen Video。根据当时发布的一份技术文件,当时的谷歌工程师已经开始计划以24FPS 的帧速率输出1280x768 高清视频,保留物体结构的同时“开发物体结构的全3D 旋转”。他表示,试图“让创造更多图像成为可能”。形式。此时,距OpenAI 发布其著名的DALLE-2 才过去六个月。针对OpenAI 声称sora 是“世界模拟器”,图灵奖获得者、Meta 首席AI 科学家Yann LeCun 表示,大多数根据提示文字生成的逼真视频都是,我们认为我们距离“AI”还很远。了解物理世界。”有很多bug,生成视频的过程与基于世界模型的因果预测完全不同。同日发布的谷歌多模态模型Gemini 1.5,可以连续运行100万个代币、“1小时视频、11小时音频、超过3万行代码”。以视频的形式,谷歌变成了汪峰,失去了头条新闻。今年1月,北京大学、斯坦福大学、Pika Labs合作,针对文森图频发“错版”背后的两个关键问题:空间信息缺失,我们发布了一套全新的文森图框架RPG——扩散大师。此外,由于处理重叠对象的困难,基于反馈的方法需要收集高质量的反馈数据,这会产生额外的培训成本。所以,在很大程度上,“中美AI竞赛”之所以显得有些艰难,并不是因为企业家不努力,而是因为他们的努力主要与他们的“赚钱能力”挂钩。其次,企业家不努力。正如OpenAI天才谢赛宁所说,弥合人才、数据和计算能力之间的差距是困难的。由剪辑工具衍生出来的“文盛视频”产品往往有庞大的内容生态系统支撑。作为创作者生态的一部分,这个属性层有两个方面,这是第三方“文胜视频”产品商业化的一个大问题。
几年前我认识他的时候,他还在制作网剧、网剧,但现在他公司的主营业务是短剧和AI,利用人工智能来生成3D和2D内容。 2022年夏天,他创立了人工智能组织SOLART TECH(苏林科技),并于次年加入了NVIDIA的Inception计划、针对AI初创公司的谷歌云以及亚马逊的加速计划。去年,吴力团队出于业务需要,没有召开发布会,而是以自有正版电影、漫画为数据源,开始搭建大规模的国产视频生成模型,我尝试着开发。花费了数百万美元后,他得出的结论是,虽然投入巨大,但效果并不理想,离工业应用还很远。 “基于项目文件的数据标注准确度很高,但由于数据量不大,生成的内容相对有限。动画部分与皮卡1.0有类似的效果,但有恐怖屋效果。` “我们的团队基本上都是会写代码的影视美术人员,所以一开始我们就会有一点优势。”在他看来,去年皮卡等人虽然很多团队只进行了图像处理根据图像研究推论,今年的Sora团队成员越来越多学科,做跨学科的研究。我无法忍受OpenAI创造奇迹的努力。吴立苏放弃了大规模的自制视频生成模型,转而基于较大的模型构建了几个较小的模型。他希望结合其他技术和工具来促进产品的实际落地。 “国内做完整视频生成的公司方向各有不同,但大多数都是以科学研究的形式来做。目前我看不到任何商业化或产业化的潜力。” 行业应用需要更高的精度,而Sola 的演示文稿也充满了不稳定因素。他对比了Vincent Video对影视动画行业的影响,“每个人都知道数学公式,但不是每个人都能用这些公式来解决应用问题。”也许并没有你想象的那么大。吴立苏拥有计算机出身,中川大学数字媒体专业,此后在影视行业打拼十余年。他的判断是,Vincent Video目前适合填充没有特定需求的内容或增强背景图像。 “在传统的影视动画行业,准确的场景和人物情感表达更为重要。直接生成纯文本很难达到效果。通过图像(故事板)生成更重要。”并且更加看好未来的3D市场以及3D 内容与人工智能相结合的机会。吴立苏做出的另一个决定是,公司今年将向海外扩张。 “国内用户的需求正在慢慢增长,所以现在更多的人可以卖课程赚钱。”他无奈地说。很多人看不起中国人工智能的原因是因为他们看的是钱。一位投资者朋友表示,互联网时代以来,美国科技公司代表了技术和商业的双重飞跃,而国内公司则注重跟进和应用。但到了AI时代,事实证明一切都只是幻象。去年这个时候,很多人问为什么中国不开发ChatGPT,今年又出现了为什么中国不开发Sora的问题。在天才科学家史蒂芬·沃尔夫勒姆(Stephen Wolfram)的书《这就是ChatGPT》的序言中,作者建议,“让我们改变一下”。问题是,“为什么OpenAI 是世界上唯一一家可以创建ChatGPT 的公司?”我认为这个方向没有对错,只是与实际土壤有关。有一个美元基金的投资人强烈建议我关注2022年中期AI的发展趋势,当时GPT是一个热门话题,但我对此一无所知,而且几乎没有新闻报道。他目前在一家外国科技风险公司工作,但他说,“出来躺下吧。”
斯蒂芬·沃尔夫勒姆在书中提到了“可计算性不可约性原则”,该原则指出“人类、人工智能、自然和社会等计算系统从根本上来说是不可预测的,令人惊讶的事情总是会发生。”这是可能的。 ”他们拥有内在的动力和内在的体验,这本质上使他们能够定义目标和意义,从而最终定义他们的未来。那么如何才能依靠这种不可预知的“收获惊喜的潜力”呢? 【本文由中国投资网撰写,经企业家授权转载。如需转载,请联系微信公众号(ID:China-Venture)获取许可。 ]