来源:猎云精选(ID:lieyunjingxuan) 作者:王飞正在秘密开发通用多式联运模式,预计年底推出。随着OpenAI的文生视频模型Sora受到广泛关注,这家由90年代以来的清华大学学生创办的国内领先的模特公司不断受到知名机构的关注。今日获悉,Moonshot AI已完成超10亿美元新一轮融资,投资方包括红杉中国、小红书、美团、阿里巴巴,此前股东也参与投资,投后估值达到约1000美元2.5美元十亿。就在2月3日农历新年之前,有消息称,蚂蚁金服和阿里巴巴集团联合投资的Dark Side of the Moon正在筹集2亿美元,投前估值为15亿美元。针对“最新一轮融资”,月之暗面向猎云网表示,“感谢您的关注!公司不便对具体融资信息发表评论。月之暗面已在评论”有一段时间了。”无论是现在还是未来,公司坚持推动中国AGI领域关键技术的进步,产品创新也将根据公司的发展阶段继续与资本战略保持一致。我们期待继续与您分享好消息。”事实上,成立于2023 年4 月的“月之暗面”发表了一份声明,表示“有关财务披露的情况不太清楚。”确实如此。对于据称成立仅两个月就完成的首轮融资,创始人杨智霖在2023年10月宣布,公司已获得红杉资本等知名机构近20亿元人民币的投资。”已更正”,确实是这样。今日资本和Rishi Capital。这也是《月之暗面》成立近一年后唯一准确的资金披露。
01
杨智霖的优等生身份,让清华顶尖学子创办的、与他们联手组成全明星阵容的公司“月之暗面”,在早期就获得了大笔VC的押注,并积累了丰富的经验。在清华大学期间,杨志林曾任清华大学计算机学院知识工程研究所(KEG)负责人、智能源研究所学术副主任、启蒙工程主任。最终,他以满分通过了所有编程课程,并以全班第一名的成绩毕业。随后,2015 年,颜子林加入卡内基梅隆大学(CMU) 语言技术学院(LTI),与苹果公司AI 负责人Ruslan Salakhutdinov、谷歌AI 智能首席科学家William W. Cohen 一起学习。博士学位毕业后,杨志林曾在谷歌大脑研究院和Meta(Facebook)人工智能研究院工作,是Transformer-XL和XLNet的第一作者。其中XLNet模型在18个自然语言任务中取得了比谷歌BERT更好的结果,是当时NLP领域最流行的国际前沿模型之一。据不完全统计,杨志林已在ICLR、NeurIPS、ICML、ACL、EMNLP等主要计算机会议上发表论文20余篇,研究成果在Google Shcolar上被引用超过17000次。目前,杨志林是清华大学跨学科信息研究院助理教授,主要研究方向为大规模预训练、自然语言处理、自然语言理解与生成、小样本学习、零样本学习等。多模式学习。出生于90年代的杨志林在循环智能、智慧AI、智慧研究院等大模型领域赫赫有名,他的名字和身影随处可见。同时,杨志林及其团队还作为研发核心成员,参与Google Bard、Gemini、Einstein、盘古、五道等大型模型的研发,并发明了AI方面的突破性成果。 做过。 Google PALM 和LLaMa 等模型中采用了TransformerXL、XLNet、RoPE、Detectron2 和Group Normalization 等领域。天眼查App信息显示,杨智霖拥有月之暗面78.97%的股份,拥有绝对控股权。他身边的创业伙伴也都实力非凡,不容小觑。月之暗面联合创始人周新宇拥有公司10%的股份,他和杨志林、张玉涛是清华大学计算机学院2011级本科生,我们是同学。周新宇第四年加入旷视实习,各方面都达到了标准,毕业后正式加入公司,他的工作就是量产算法,让算法的生产效率提高很多倍。作为持有5.96% 股份的第三大股东,月之暗面联合创始人吴宇欣毕业于清华大学和卡内基梅隆大学,曾荣获2018 年欧洲计算机视觉大会(ECCV)最佳论文提名。在2018年10月举办的GeekPwn国际安全极客大赛上,IYSWIM是六支参赛队伍中唯一破解面部识别算法的队伍。当时是IYSWIM 团队成员的吴宇欣表示,“我们使用了Google 的FaceNet 开源代码模型(我们以自己的名义注册,我们的队友没有来现场)来击败算法。”他说。此外,杨志林的弟弟张玉涛目前持有该公司5%的股份。公开资料显示,张玉涛先生在清华大学计算机学院获得学士和硕士学位。研究兴趣包括异构数据融合和知识图谱构建,在KDD、CIKM等重大计算机会议上发表多篇论文。作为技术负责人,我参与了科技大数据分析平台AMiner的研发。
02
继大型语言模型之后,通用多模态模型已经秘密开发,凭借华丽的团队阵容和深厚的积累,《月之暗面》在不到半年的时间里就成立了,计划于2023年10月投产。宣布新进展。这是“长文本”栏。据杨志林介绍,针对“大模型输入长度有限导致的应用困难”,月之暗面推出了Moonshot,这是首款支持20万汉字输入的大模型和智能助理产品。 KimiChat已正式发布。接下来,我们对KimiChat 进行了详细的介绍,包括实际使用示例。以全书《月亮与六便士》的输入为例,Kimi Chat会与用户一起阅读,帮助用户更好地理解和应用书中的知识。英语方面,KimiChat的多语言能力更强。比如Kimi Chat在中文方面就有很大的优势,实际使用效果约为20万个汉字,是Anthropic的Claude-100k(约8万个字符)的2.5倍,是OpenAI的GPT的8倍。 4-32k.(实际阅读约25,000字)。同时,通过创新的网络结构和工程优化,Kimi Chat实现了千亿参数下的无损长程注意力机制,并利用滑动窗口、下采样、小规模模型等“捷径”,实现了独立解决方案。这可能会导致严重的性能损害。今年1月26日,Kimi Chat发布了最新的“v1.3春节版”。基础款的功能全面升级,包括用友上网搜索功能、情境学习功能、文学创作功能、语言翻译功能……Kimi智能助手程序版已经支持中英文语音输入。需要的是OpenAI 的Vincent 视频模型Sora 这些天继续受到关注,再加上其演示视频的高保真度和高质量(长度超过一分钟)。据多方报道,月之暗面的通用多模式模型也在秘密开发中,预计将于今年年底发布。也就是说,在基于文本的大规模语言模型领域逐步取得进展的月之暗面,也将在基于图像和视频的多模态模型领域与OpenAI等国内外竞争对手展开竞争。 未来。月之暗面在资本市场的“频繁动作”似乎是为不断上升的培训成本以及不断增加的资本和人才需求做好了更好的准备。举一个团队规模的例子,截至2023 年10 月,Dark Side of the Moon 约有50 名员工,现在该公司的团队已超过80 人。我想关注“月之暗面”能否在“多模式模型”领域占据一席之地。 【本文作者烈云选,经企业家许可转载】如需转载,请联系微信公众号(ID:lieyunjingxuan)获得许可。 ]