21世纪经济报道记者白阳北京报道
正式亮相四个月后,创新工场董事长兼CEO李开复创立的人工智能公司零一一切又取得新进展。
11月6日,011Wang正式发布开源大模型“Yi”。目前,Yi系列模型发布在Hugging Face、ModelScope、GitHub这三个全球开源社区平台上,并对外发布商业应用。
李开复表示,“开源对于推动世界科技革命的发展具有重要意义。从Linux开始,到各种AI技术,再到今天的AI 2.0,开源的力量是巨大的。一直引起科技浪潮。” ”。
这也是灵异雾选择打造大规模开源模式的原因。 “零一事物的发展得益于迄今为止开源社区的一些集体智慧,并要求我们做出一定程度的贡献。大规模模型需要很多资源。很多人都是这么认为的。”开复说李。只有OpenAI、微软、谷歌、阿里巴巴、百度、腾讯这样的公司才能做到这一点,但任何技术都需要全球参与,而开源方向是大家大规模做的一个方式,目的是提供机会访问模型”
“烧钱”
今年3月,李开复在社交平台上正式宣布创立AI公司。 7月,新公司正式命名为“零义乌”,主要聚焦大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。
据当时报道,零一心愿联合创始团队成员包括阿里巴巴前副总裁、百度前副总裁、滴滴出行/百度原算法负责人、前谷歌中国高管、微软/SAP/思科等/他是前副总裁,算法和产品团队背景均来自国内外各大厂商。
在Yi系列车型发布的同时,零一物团队成员也登场。例如,零千物技术副总裁、Pretrain负责人黄文浩曾就职于微软亚洲研究院和致远研究院,很早就参与了AI 2.0的工作。
戴宗宏,零一事技术副总裁、AI基础设施负责人,曾任华为云AI CTO兼技术创新部部长、阿里巴巴达摩院AI基础设施总监。他管理的基础设施团队核心成员主要来自阿里巴巴、华为、微软、商汤科技,这些人参与支撑了4个千亿参数的大规模模型的大规模训练,我们已经管理了数万人。参数。 GPU 卡。
拥有丰富人力资源的零一一一也需要解决数据、算力等问题。李开复介绍,灵异万物尝试了多种方法和渠道来解决数据问题。 “我们从外部购买了大量数据,利用网络爬虫合法检索授权网站的内容。我们也使用了很多开源、在线共享的数据。但拿到数据后,发现有很多重复的数据。” “质量参差不齐。所以我们非常系统地筛选了这些数据,最终从100 多吨数据中选出了3 吨。”
关于计算能力,李开复表示,“在01Wan初期,我们就认定GPU比黄金还重要,很早就规划了各种资源。经过18个月……目前01Wan已经拥有足够的计算资源使用。” 。 ”
对于人工智能公司,尤其是那些大规模构建模型的公司来说,招聘人才、购买数据和计算资源是一项巨大的投资。李开复还透露,零一旅行车在完成新一轮融资之前已经负债数千万美元。
但零一的东西也受到资本的喜欢。据记者了解,零壹五五已完成阿里云领投的新一轮融资,估值超10亿美元。这也意味着李开复只用了八个月的时间就打造出了自己的独角兽公司。
分数
据李开复介绍,灵异物物今年六七月份才开始编写第一行代码,短短四个月就取得了骄人的成绩。
此次发布的Yi系列有34B和6B两个版本。其中,截至11月5日,Yi-34B在Hugging Face英语测试公开榜预训练开源模型排名中以70.72分位居全球第一,并超越了LLaMA2-70B、Falcon等众多大型模型—— 180B,我超越了。
在中文方面,Yi-34B在C-Eval中文权威排行榜上也超越了全球所有开源机型。其中,Yi-34B在CMMLU、E-Eval、高考三大中文指标上的表现也优于GPT-4。
还值得注意的是,Yi-34B 计划发布一个支持200,000 个上下文窗口的版本,可以处理约400,000 个汉字字符的超长输入。相比之下,OpenAI的GPT-4上下文窗口只有32K,文本处理量约为25,000字。
在语言模型中,上下文窗口是大型模型综合计算能力的黄金指标之一。这对于理解和生成与特定上下文相关的文本非常重要。具有较长窗口的语言模型可以处理更丰富的知识库信息。零一事也是第一家向开源社区开放超长上下文窗口的大型模型公司。
除了此次发布的大模型产品外,李开复还重点介绍了其背后的一些研发能力。他说,在人工智能基础设施的支持下,Yi-34B模型的训练成本下降了40%。这可能没有必要。
同时,经过数月的广泛建模和实验,灵异物物开发了“大规模训练实验平台”来指导模型设计和优化。数据匹配、超参数搜索、模型结构实验等都可以在小规模实验平台上进行,而小规模模型一旦成功,就可以应用于更大的模型。经过验证的34B模型,零一千件事保证了平台的有效性,每个节点的预测误差控制在0.5%以内。
基于这样的模型预测能力,可以显着减少因训练错误而造成的计算资源浪费,同时让之前训练大型模型的“炼金术”过程变得非常细致和科学。李开复宣布,01Wang已开始训练下一个千亿参数模型,同时完成Yi-34B的预训练。
未来
对于大模型的未来前景,李开复再次强调,大模型时代不仅是人类向AGI过渡的重要一步,也是大平台的机遇。移动互联网时代。
这个时代最大的商机就是超级应用程序的创建。在李开复看来,超级APP应该是大多数人应该花大量时间、每天使用的东西,体现自己的价值。比如PC时代的微软Office、移动互联网时代的微信等,都是超级应用。
因此,打造超级APP也是零义乌追求的目标。 “我们的超级应用程序原型很快就会向所有人提供。我认为现阶段我们还不能自己创建一个超级应用程序,但超级应用程序会从简单开始,变得精益。”李开复说。创业的方式就是不断迭代,最终创造出一个超级应用。 ”
这就是零一万的超级应用创建方法论,李开复相信这将是未来数十万甚至数百万开发者尝试的方法论。马苏。 AI 2.0充满机遇,凌亦武希望能够打造出超级App,同样,如果创业者找到正确的方向并快速迭代,在AI 2.0时代打造出超级App是有可能的。
此外,从企业发展的角度来看,李开复表示,AI 2.0时代商业化非常重要。在AI 1.0时代,很多AI公司没有商业化成功而早早被淘汰,甚至那些盈利的公司也没有足够的可持续性,所以AI 1.0公司给出的成绩单如下。不理想。
这也为AI 2.0时代的初创企业敲响了警钟。 “我们开发应用程序的目标是快速产生收入,产生非常高的利润,并让这种收入可持续。如今,所有成功开发的公司都发现,他们的收入质量在凌亦武看来,收入质量在下降。”高于ToB的比例,所以我们也坚定不移地选择走ToC的道路。”李开复说道。
下载21财经APP了解更多。