2023,大模型正渗透到百度的方方面面。
(相关资料图)
例如,在搜索框的基础上,添加了有来有回的对话框。
基于文心一言大模型能力,百度分别在C端、B端推出文心一言APP与文心千帆大模型平台。在对话框之中,有多个灵感模板与prompt,为探索世界提供线索。
(灵感模板及运用 图源:文心一言APP)
再例如,据百度智能汽车事业部智舱业务部产品架构师徐嘉南表示,文心大模型正在重塑车内的应用和交互。
据介绍,基于文心大模型能力,百度Apollo推出的智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,同时也能够实现在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。
可以说,百度的每一项业务都与大模型,产生了化学反应。
本文试图探究,大模型之后,对百度的业绩影响如何?关于自动驾驶与大模型两大最热门的项目,百度布局到何处了?
012023Q3,百度名利双收
8月22日晚,百度发布了2023年第二季度财报,业绩亮眼。
财务数据显示,第二季度,百度实现营收人民币340.56亿元,同比增长15%,较市场预期高 2.57%;归属百度的净利润(non-GAAP)达到80亿元,同比增长44%。
总体来看,百度营收和利润双双实现增长,超市场预期。消息一出,百度股价开盘大涨近3%。
(百度股价 图源:Trading View)
分业务线来看,百度核心业务收入人民币264.07亿元,同比增长14%。百度核心业务经营利润约人民币65亿元,同比增长27%。
长期以来,在“流量为王”的互联网语境中,基于搜索引擎这个天量流量入口的广告营销业务,一直是百度营收的最重要组成部分。坐拥中国最大的搜索引擎,百度广告业务理所应当地风声水起。根据2023年2季度财报显示,百度线上营销业务196亿元,占公司总收入的57.6%,较去年同期增长15%。
移步AI,是每一个大厂的重要命题。百度将公司简介改为“强大互联网基础的领先AI公司”,剑指AI领域。百度持续投入自动驾驶与智能云,为自己打造用于AI这个战场的“干将莫邪”。
随着行业回暖,政策利好出现,百度自动驾驶业务进度可观:在2023年Q2财报电话会上,百度CEO李彦宏表示,在全无人自动驾驶运营区域扩大和车队规模增加的同时,运营效率也在提高,每车每公里成本降低。与此同时,萝卜快跑每日平均订单量和每笔订单收入也大幅增长。
而智能云业务,无疑成为了百度的“明星”。今年三月,文心大模型的发布赚足了眼球,后期的迭代也保证了产品的实用性。在B端,百度推出了千帆大模型平台,服务企业用户。文心千帆提供超30种大模型接口,完整的大模型生态正在逐步形成。
据2023年一季度财报电话会显示,智慧云业务营收42亿元。虽然不足一季度全部营收的两成,但智慧云业务成功扭亏为盈,标志着除了广告外百度并非无路可走。虽然二季度百度未公布智慧云具体营收,但智慧云占大头的非广告业务收入68亿元,同比增长11%。
纵观近两年百度核心业务收入组成可以发现,自百度于2020年提出“云智一体”之后,百度智慧云、自动驾驶等AI相关业务增长迅猛,收入占总核心业务比例整体呈上升态势。
财报数据表明,百度以搜索引擎为流量入口,通过以广告为主的多种方式变现,资金流量合力研发AI,再用AI重新定义产品的生态模式在一步步建立。
02自动驾驶:逆流而上,不惧行业寒冬
我们都知道的是,现如今,自动驾驶正陷入寒冬:据偲睿洞察不完全统计,至2022年底,在纳斯达克上市的十余家自动驾驶初创公司,在上市后的平均跌幅超过80%,裁员、关停已然是常事。
低频率、种类极多、且对行车安全造成严重影响的“长尾问题”,是横亘在自动驾驶技术门前的一道坎。
如日中天大模型凭借解决“长尾问题”以及引发科技奇点的可能,如“冬天里的一把火”,为行业带来了希望。拥有处理海量数据的能力,大模型便可以在测试自动驾驶系统上限、重建自动驾驶场景上发光发热,甚至可能搭载在车辆上进行合并检测小模型、检测道路物体、进行车道拓扑预测等。
作为国内AI领域的领跑者,百度在自动驾驶领域披荆斩棘,在L4级别无人驾驶技术上进展显著。今年7月,北京市高级别自动驾驶示范区工作办公室宣布在亦庄开放智能网联乘用车“车内无人”商业化试点。百度旗下Robotaxi萝卜快跑获准在在北京亦庄60平方公里的示范区内分别投入10辆全无人自动驾驶车辆进行示范运营。
萝卜快跑参与本次试点是政府层面为百度过硬的技术进行了背书。更重要的是,本次试点不同于以往测试,Robotaxi内没有安全员,做到了真正的“无人驾驶”,这标志着Robotaxi离商业化落地又近了一步。在此寒冬之下,百度Apollo Robotaxi无疑给自动驾驶行业,打了一针强心剂。
百度2023Q2财报电话会透露,萝卜快跑为公众提供的乘车服务达到71.4万次,同比增长149%,截至2023年6月30日,萝卜快跑累计向公众提供的乘车服务数量达到330万次,领跑全球无人驾驶。
在已有区域“如鱼得水”的同时,开疆拓土也较为迅速:目前,萝卜快跑已获批在武汉、重庆、北京和深圳四个城市向公众提供全无人自动驾驶出行服务。今年7月,萝卜快跑获得上海市浦东新区发放的首批牌照,允许在公开道路上开展全无人自动驾驶测试。
自动驾驶进度可观,百度的高级辅助驾驶,也迎来了自己的春天:
一边是,高级辅助驾驶进展迅猛:5月份,集齐6个试点城市高级辅助驾驶地图许可;而到8月份,已然获批30个省份134城市,实现全国一线、新一线、二线城市全覆盖,三线城市覆盖率超85%。
另一边是,其合作伙伴阵营日益庞大:7月,新岚图FREE上搭载百度“行泊一体”产品;8月2日,百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。
总的来说,关于汽车,百度开始精细化运营,放手一部分,再细琢一部分。有关技术的部分,无论是自动驾驶还是高级辅助驾驶,百度都在积极落地的路上。
03大模型的故事,百度讲到哪一篇章了?
自动驾驶的故事,正渐入佳境,而大模型,百度已然写出了花样。
现阶段大模型应用落地最为成熟的也最为“显眼”的,莫过于文心一言APP。
(灵感模板及运用 图源:文心一言APP)
可以看到,文心一言从最初的简易对话框,已然衍生出多场景多主题的玩法,C端用户正在上面搜刮灵感:工作学习层面,有论文、PPT、脚本大纲生成;日常生活层面,有朋友圈文案、水墨风格绘画生成······
据偲睿洞察分析师亲自体验,朋友圈文案不乏诗意,论文大纲也达到了本科水平。
(论文大纲 图源:文心一言APP)
从灵感中心模块来看,文心一言热度不少。这也就意味着,百度将持续收获大量的、高质量的、免费的训练与反馈数据,从而丰富语料库数据,提高其质量。
同时在B端,百度推出百度智能云千帆大模型平台,定位于一站式企业级大模型平台,为客户提供先进的生成式AI生产及应用全流程开发工具链。
现阶段,文心千帆的阵营与功能也逐渐强大:8月2日,百度旗下的AI大模型平台文心千帆,宣布接入LLaMA2全系列开源模型,平台可调用的大模型数量增至33款,除了3款文心模型,其他30款均为开源模型,其中包括ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等。
这也就意味着,各个模型之间能够性能互补,能够满足不同用户的需求,比如支持无限上下文长度的RWKV,和英文能力较强的Llama2,弥补了文心一言相应的短板。
在功能上,千帆大模型平台除基本的大模型训练、管理、服务之外,给出了个性化服务:提供百个预制Prompt模板,授人以渔。
在用户实际使用模型的过程中,提问的方式往往会影响模型输出的内容。这是因为,一个好的问题模版往往能够帮助预训练模型“回忆”起预训练时学习到的内容——这一问题模板就被称为Prompt。
百度所上线的103个预制Prompt模板,覆盖了对话、编程、电商、医疗、游戏、翻译、演讲等十多个场景。据百度智能云AI平台副总经理李景秋介绍,预制Prompt模板来源于百度智能云在产业实践中积累的Prompt模板,也源自文心一言的高频用户。
(文心千帆上线的103个预制Prompt模板 图源:文心千帆截图)
实际效果无从知晓,不过目前来看,大模型无疑是提高了云业务的粘性与流量:飞桨开发者群体至2023年8月中用户数达800万,而去年年底仅有200万。
百度智能云AI与大数据平台总经理忻舟表示,开放大模型平台的初心,是为了给客户的业务创造价值,创造价值的同时可以增强老客户的黏性,并拓展更多新客户。这对于扩大云厂商的规模效应,有很大的帮助。
而如何在“大模型+智能云”上玩出花样,百度给出了提供tips:更优质的服务。
忻舟表示,一站式大模型平台最后会更被开发者所需要,随着技术的不断成熟,底层设施和工具的开发会放缓,更多的精力会被放在保证自己的业务不被技术发展所淘汰,这时上层应用对平台工具的需求会更大,平台之间比拼的是服务的能力,“在激烈竞争中,一定会有一些做得好的头部的平台,能够变成主要的玩家。”
以上,是百度在产品端的一系列布局。3月,文心一言出生之时,质疑满满,接近半年过去,文心大家族羽翼逐渐丰满。
作为大厂,百度能在大模型时代拿到的优势,不仅在于原先就有着众多入口、亿级流量,还在于各个业务能够以较低成本参与到大模型时代。
据偲睿洞察测算,现阶段 ChatGPT 日活一亿,若每日有5%的人每秒同时提问,将会吞噬三峡大坝近一年的发电量。
假设有1亿人同时在线,每日有5%的人每秒同时提问,每个prompt占30个token,便需要1530万颗H100芯片来提供其推理算力;而每颗H100的功耗在750W左右,若每天运行10个小时,这些H100芯片所在的数据中心一年的耗电量将达到840亿kW*h,而三峡大坝一年的发电量是882亿kW*h。
这,还只是ChatGPT一个大模型在推理阶段的耗电量,百家大模型全阶段、全部运作的耗电量,难以估量。
这也就意味着,算力已然筑起高墙,非资金雄厚者,勿进。此时,大厂的优势便显现出来:有多项业务去瓜分大模型训练的好处,分担其成本。
“人有所不为也,而后可以有为。”百度完全可以靠搜索引擎与爱奇艺的流量过自己的“小日子”。然而,拒绝固步自封的“有所不为”,以及在AI、自动驾驶、大模型等领域不断探索的“有所为”,将在全球新一轮科技革命和产业变革中,淘到金子。