在高喊“要做中国版OpenAI”之后的第136天,王慧文把光年之外卖给了美团。
2023年6月29日,美团在港交所发布公告,于2023年6月29日全资收购「光年之外」100%的股权,收购总代价包括:2.33673亿美元现金+承担3.66924亿元人民币债务+1元人民币,合计大约20.65亿元人民币。
很难想象,国内第一家由大佬入局创办的大模型初创公司会以这种方式收尾,这一结局给市场留下了无数的疑问和猜测。
(资料图片)
从整体商业视角看,光年之外被美团收购只是企业间常见的收购动作。但对于国内AI行业来说,这笔收购似乎预示着仅火热半年的AI大模型创业潮正在降温。
资本市场对行业水温的感知更加直观。自6月26日开始,科大讯飞、昆仑万维、360等AI概念股集体大跌。
不只是国内,人们甚至对曾经趋之若鹜的ChatGPT也不再追捧。
根据网站数据分析工具SimilarWeb数据,前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,在4月份明显放缓,环比增长率为12.6%,到了5月,这个数字只剩2.8%。
当大模型的热度不再,人们很容易想到一个问题:大模型到底是不是创业的好机会?
这个问题显然没有标准答案,甚至连大佬之间的看法都大相径庭。就在前几天,猎豹移动董事长兼CEO傅盛和金沙江创业投资基金董事总经理朱啸虎为此在朋友圈“吵”了起来。
大模型的认知矛盾并不只集中在个体身上。当创业者、投资人与需求方都存在认知偏差的时候,对于大模型的“谨慎与保守”,就成了绝大多数玩家的普遍状态。
在6月16日召开的2023年华映资本年度大会上,华映资本投资人与被投的硬科技及消费科技企业之间,对产业如何拥抱大模型与AIGC的问题也曾展开过激烈的探讨。
在「甲子光年」看来,大模型市场急需理性的声音,创新的脚步不能停,诸多问题尚待厘清——大模型究竟能不能投?如何投?入局大模型有哪些问题?大模型未来的商业化前景到底是否会重蹈此前AI行业的覆辙?
无论人们多忧虑,产业拥抱大模型几乎是既定结局——问题是,以什么样的姿态拥抱。
谨慎的投资人们
百川智能、衔远科技、聆心智能、西湖心辰、MiniMax……从2023年初至今,国内大模型创业公司层出不穷,每一位创业者的背景都足够光鲜,每一家企业的实力都备受资本方认可。
那段时间,某某明星企业家离职创业入局大模型获得巨额融资的消息屡见不鲜。
例如6月1日,有消息称国内大模型初创公司MiniMax即将完成一轮超过2.5亿美元的融资,公司估值超过12亿美元;
而刚刚被美团收购的光年之外的融资消息在当时更是扑朔迷离,王慧文曾一度否认公司获得了包括源码、腾讯、五源以及宿华的2.3亿美元融资,但这笔融资最终也因为美团发布的收购公告而坐实。
这种投资人追捧创业者的浪潮,让人们一度以为大模型将要激活国内整个AI创投圈,但事实却并非如此。实际上,除了自带光环的明星团队,投资人对大模型创业更多是观望和审视,真正拿出真金白银的人是少数。
早在今年初ChatGPT浪潮席卷全球时,「甲子光年」便第一时间和部分投资人们交流看法。那段时间,几乎所有人都在快速学习,邀请专家对公司内部进行科普。
当时,AI领域热烈讨论着一个问题:ChatGPT是不是人工智能界的iPhone时刻?对此,险峰给出的答案是不急于下定论。“我们暂时还不能确定这个影响到底有多大,但我们认为它(大模型)肯定会改变一些东西。”险峰副总裁李抗说。
但也有投资机构对大模型表现了担忧。某一级市场投资人对「甲子光年」表示,很担心中国的反应过热。ChatGPT爆发后,国内的AI概念股被引爆。“我们的一二级市场都必须考虑注入的相关投资能否产生相应的回报。如果都是为了短期利益,这种投资到最后很容易打水漂,因为你没有真正去促进技术的发展,而是一个概念性投资。”
在他看来,投资人的关注点要聚焦,去探索更多对人类未来有影响力的基础科学,这才是真正深藏潜在市场价值的科技力量。“既要和市场动态结合,也要和市场价值以及真正的、未来的社会进步结合,不能盲从,我们要清醒认识到哪些东西能改变未来,不能去蹭热点,一窝蜂做这件事儿,我们不应该成为一个浪潮中的泡沫。”
不过,一位FA从业者向「甲子光年」表示:“最近慢慢开始有投资人出手大模型项目了,但手笔都不大。”
“本质问题还是认知不够。”对于投资人们的谨慎态度,华映资本管理合伙人章高男给出了自己的理解。他进一步表示:“几乎没有人能清晰地定义大模型,我们要先把大模型的边界定义清楚再来讨论,你说的大模型与我说的大模型,很有可能都不是一件事情。”
在一些人看来,投资人的谨慎对大模型创业而言或许是一种负面信号,是在给大模型泼冷水。但客观来看,谨慎不代表拒绝,经过深刻思考后的理性拥抱更为珍贵。
无论投资者还是创业者,又或是希望借助大模型将自身业务转型升级的传统企业,在真正投身大模型市场前都需要厘清两个问题——大模型的能力边界是什么,以及自身是否有必要引入大模型?
拥抱大模型前,厘清两个问题
当一项新技术出现时,商业世界最核心的问题就是:这项技术能用在哪,怎么用?
这对大模型来说尤其重要,也是当前还未真正入局大模型的企业都应谨慎考虑的问题。
要回答这个问题,首先需要划定大模型的能力边界。
大模型的特殊之处在于,其内部的模型算法是一个巨大的黑箱,大模型的生成过程不可解释且不可预测,因此很难界定其能力边界。但可以确定的是,通用大模型不是万能的。
智源研究院副院长、总工程师林咏华曾在一次分享中提到,从产业落地角度来看,“大模型+提示学习”无法代替一切。
她进一步提到,对于许多特定任务或新任务,提示学习或许能通过多轮提示prompt,让大模型输出需要的结果,但大模型“记不住”这个过程,而如果开发者把整个提示prompt都加到每一次的调用中,一方面有可能使得prompt越加越长而超过了大模型的上下文能力,另一方面势必导致每次的推理开销增大、效果也会难以控制。在投入了真金白银的产品落地环节,这种不稳定性更为致命。
国家语音创新中心首席专家张熠天也在2023年华映资本的年会上表示:“大模型是一个生成逻辑,他给出的只是一个最优的词汇梯次聚类,答案和问题之间并无因果。我们得到的东西只是一个"result",需要鉴别,而不是"answer"。所以大模型是否能够直接在教育、医疗、司法等严肃领域应用,可能都是一个问题。但是它在辅助决策上,是有意义的。在直接生成结果上,如果要商业化、产品化,我们认为还是有很长的路要走的。”
因此,一个在业内基本形成的共识是,未来每个行业都会有一个自己的垂直大模型,重点在于如何将通用大模型的能力与企业自身的行业数据很好地融合起来。
但在真正考虑大模型工程落地前,创业者们还需要考虑一个更加重要却很容易被忽视的问题——大模型是否是企业的“刚需”?
对此,国内一家多模态大模型团队曾对「甲子光年」表示,大模型是否是企业的“刚需”需要多角度来理解。对于一些企业而言,没有引入大模型,就相当于在市场竞争中失去了一把利刃,他们不得不上大模型来获取客户青睐——这也是一种“刚需”。
但某种程度上,这更多是新兴技术在发展初期的一种市场情绪。长远来看,新兴技术的产业化发展,本质还是要靠业务需求驱动。这时,企业究竟是否需要大模型就需要考虑多重因素。
除了具体的工程落地问题外,企业还需要考虑数据安全问题,以及大模型对原有市场格局的影响。
这两大问题在信息化、数字化时代已经频频出现且无法根除,智能化时代,这些问题则可能以一种更隐晦的方式出现。
“很多消费型、或者是平台型的企业,如果毫无保留地去拥抱大模型,那大模型对行业的反噬能力是很强的,因为这意味着从产业端很轻易地就交出了行业的进入门槛和认知钥匙。”张熠天表示。
在数字化转型的大背景下,大多数行业都通过大数据、云计算等技术实现了数字化转型升级。但与此同时,传统企业也向数字化技术厂商交出了大量的行业数据,数字化技术的提供商成为产业中一个不可忽视的主体,原有的市场格局被改变。
但工业、建筑等行业由于数据量小,且各业务线之间的数据难以打通,传统企业至今仍保持着较高的竞争壁垒。
张熠天表示:“目前,建筑业是在数字化背景下被保护得最好的行业。现在建筑业的信息化,除了一个广联达可以做预算以外,没有一家巨头能够切入。为什么?因为建筑有设计图、施工图、维修图、规划图、备案图等八张图,所有的图之间相互都是打不通的,政府部门都不是互认的,打通整个建筑的这八张图的成本足够高,所以建筑业才保持了这种竞争主体的多元化。我们通常认为竞争主体的多元化是产业发展活力和动力之源。”
因此,在大模型浪潮下,对于行业标准、竞争优势尚不完善的企业,是否要无条件拥抱大模型,是每一家都需要慎重考虑的问题。
大模型的工程化落地没有标准答案
对于已经将真金白银投入大模型市场的入局者而言,接下来要做的是解决实际的工程落地问题。
对此,业内已经逐渐形成一个共识——未来,在产业落地环节,大模型和小模型将会相辅相成。
林咏华曾表示,对精度要求高、对泛化能力要求低的窄域场景更合适“小模型+迁移学习”的范式。比如工业检测、工业质检、医疗影像分析等等。
此外,华院计算创始人宣晓华也曾表示,未来AI企业的商业模式,是将大数据驱动的通用大模型和以知识驱动的面向垂直行业的小数据模型相融合,实现双轮驱动。
章高男也对「甲子光年」表示:“企业在做自己的模型优化或训练垂类模型时,可以和大模型有所结合。不需要大模型那么高维的数据,也不需要完全套用大模型的训练方法,但可以将大模型技术和其他技术耦合,形成低算力要求的行业垂直模型,这是有启示作用的,绝不是简单套用大模型。”
例如,对于大模型屡遭诟病的“幻觉”问题,短期内可能还需结合上一代AI技术来解决。
“产生幻觉的原因很多,可能是因为数据在某个领域相对稀疏和不足。在这种情况下,我们需要为模型提供更多数据来进行训练。此外,在用户提问时,清楚地向模型提供更多背景信息也是减少幻觉的一种方法,或者降低‘温度’。有时候幻觉的产生是因为问题提得不够完整,缺乏背景和前提。因此,问题的提出也非常重要,prompt engineering是关键。另外,如果用户真的想要百分之百解决准确的问题,可能还是需要用到知识图谱。知识图谱能够保证逻辑推理的准确性,以及包括Meta AI的负责人Yann Lecun提出的‘世界模型’等更新的技术。”金柚网CTO邬学宁表示。
除和上一代AI技术相结合之外,将大模型的训练过程与高质量的行业数据结合也是很重要的部分。
例如,作为一家为AI PaaS平台服务的混布型数据库,天云数据已经走过了十余年,如今已经走到了和大模型结合的阶段。
天云数据副总裁李从武表示,将从两个方面考虑自身与大模型的结合——首先是如何将私域数据与大型模型结合使用。例如天云数据为证监会完成了一个类似政策解读的项目,通过结合法规、判例和解释等各种数据,天云数据生成了对违规行为的解读,类似于法院判罚的过程,可以通过综合各种数据来解读违规行为的原因。
其次,天云数据一直在研发混布式数据库,是国内最早的几家之一。早在2018年左右,天云数据就提出了AI native数据库的概念,其实就类似今天支持大型模型的向量数据库,天云数据已经发布了自研向量数据库,并应用于自己的模型。
总的来看,大模型的工程化落地问题没有标准答案。
在人工智能这条路上,中国一定会走出一条不同于别国的道路。两条路很难有优劣之分,更多是基于不同国情下的现实选择。
险峰副总裁李抗曾在访谈中向「甲子光年」做了一个类比,如今看来依然适用:“借OpenAI的成功去说国内创业者的诸多问题是不公平的,就像两个人打牌,牌风不同,对方突然玩了一把大的,胡出了同花顺,你就说人家打牌好,我太谨慎了,但我赢的时候你怎么不说?”
张熠天分享道,从中央的判断来看,大模型,包括人工智能的问题,是赢得全球竞争主动权的重要战略抓手,是推动我国科技跨越发展,产业化优化升级,生产力总体跃升的重要战略资源。
“二十大报告谈产业问题的时候,将人工智能从新一代信息技术中单独提出。所以从政策上来看,发展人工智能、大模型,不仅仅是技术问题与产业问题,还是一个国家经济核心竞争力的问题,从更深远上看,更是一个政治问题,大家要从更高的角度来认识这个问题。”
如果将视野跳出中国,将技术发展的时间线拉长,ChatGPT引发的轩然大波或许只是人工智能技术发展历史上的一个点,现在一切判断都可能为之过早。
毕竟,即使是长期浸淫人工智能研究一线的技术人员,现在并未对人工智能的未来形成共识,并深陷于一种不安情绪中。
在近期爆火的《为什么伟大不能被计划》一书中,肯尼斯·斯坦利、乔尔·雷曼两位作者写道:“我们不得不面对这样一个令人不安的事实,即我们无法确定任何经验法则能否成为追求实现人工智能目标的可靠指南。”
在前不久落幕的2023北京智源大会上,智源研究院院长黄铁军也有着极度相似的不安。他直接用“无法闭幕”4个字作为闭幕式的演讲标题。他说:“我们处在一个不能确定的状态,这样的Near AGI它比我们强吗?它超过我们的智能了吗?还是它在什么时候能超过我们呢?我不知道,我们处在一个完全无法把控的状态里。”
在闭幕致辞的最后,他用这样一句话收尾:“如果我们能够用投资大模型一样的热情去应对风险,至少有一定可能把握未来。但是,你相信人类能做到吗?我不知道。”
放眼所有技术与产业,这种来自一线核心技术人员的“失控感”在其他领域并不常见。现在,几乎所有人都在摸着石头过河。如今入场的每一家企业,都有可能成为技术处女地的拓荒者。
而时间,是证明一切的最佳凭证。