AIGC 施展“物理魔法”，3D视觉突破“精度极限”_财金网_中华财经网

“没有艺术，全是物理！物理让你快乐，不是吗？”

近日，在世界计算机图形会议 SIGGRAPH 2023 上，英伟达创始人、CEO 黄仁勋宣布，将生成式AI与仿真模拟平台Omniverse结合的时候，如同他宣布“AIGC是iPhone时刻”一样兴奋。

(资料图片仅供参考)

不同于大语言模型只能应用在图文，有了基于物理规律的仿真模拟平台，生成式AI就可以直接用到现实世界。

除了黄仁勋，美国斯坦福大学李飞飞团队，近期也将大模型接入机器人，不仅使得机器人能够与环境有效交互，还能够在无需额外数据和训练的情况下完成各种任务。

“基于物理世界模拟的生成式AI，是生成式AI 2.0”，跨维智能创始人、华南理工大学教授贾奎对光锥智能表示，与具身智能的结合，生成式AI 将发挥出更确定性的作用。

而随着通用能力的增强，AI也有望打破商业化的“魔咒”。

当生成式AI学会物理

将生成式AI与物理世界结合，并不容易，这里面涉及的技术链条非常长。

首先，需要对物理世界基本规律的掌握，才能将真实世界建模到仿真模拟平台。

仿真模拟平台，不仅可以仿真物理场景，还可以模拟真实世界中物体之间相互作用、运动和变形。

而生成式AI的加入，会让仿真模拟平台拥有“预演”能力。

“人类从小就知道的物理常识，AI却不知道。”黄仁勋表示，“生成式AI和仿真模拟平台结合，就是要让AI的未来能够在物理上扎根。”

黄仁勋进一步解释，让AI在虚拟世界中学习如何感知环境，并通过强化学习来理解物理行为的影响和后果，让AI实现特定目标。

这就需要用生成式 AI，预测物理世界中的千万种、甚至上亿种可能性，形成有价值的合成数据。

比如机械臂需要通过3D视觉的“眼睛”才能精准抓取，但如何排除环境变化的干扰，认出待抓取的物体（比如工厂里的零部件）？

通过仿真模拟平台掌握了“光线对场景目标的反射、折射影响”等物理规律，生成式 AI就能预测模拟出一个瓶子，在不同场景光照下，周身不同的反光程度；同一光照下，金属、塑料、木制品等不同材质物体表面呈现的状态；一堆钉子，所有可能出现的散落状态……

再次，需要将所有数据，都在仿真模拟平台中用AI都跑一遍。

这一步，就是在训练3D视觉大模型。区别于大语言模型，3D视觉大模型对于理解和推理视觉场景的组成特性至关重要，需要处理对象之间的复杂关系、位置、以及现实环境中的变化等。

最后，再连接上机械臂等具身智能的硬件，才能让其学会智能化操作。

可以看到，生成式AI与物理世界结合的整个技术链条，不仅涉及物理学、图形学、计算机视觉、机器人多学科交叉，还包括数字孪生、几何深度学习、运动学解算、混合智能、智能硬件等多维前沿技术。

相应的，整个产业的链条也比较复杂，需要从数据到模型，再从模型到部署。

在这些环节中，有一个节点和此前AI的路径非常不同，那就是“合成数据生成”。

用基于物理规律的生成式AI合成的数据，去训练大模型，将给实体产业带来跨越式的革命。

不用一张真实图片，训练3D视觉大模型

为什么不直接用真实数据训练大模型？

目前，行业内多数基于3D视觉的机械臂，其控制系统的算法训练所使用的就是真实数据。因为商业隐私等问题，这些真实数据很难在通用数据中获取，基本都是企业自行采集。

然而，自采真实数据，首先在“效率和成本”这两个运营的关键指标上，性价比就非常低。

这是因为，终端应用场景碎片化，数据根本不能通用。采集真实数据，企业就需要一个一个行业，一个一个工厂，一个一个场景的“地毯式”采集。而且，采集回来的数据也不能直接用，还需要进行一系列处理。

这个过程中，甚至产生了“人工智能悖论”。

“采集真实数据，AI技术的成本构成中，半数以上都是数据成本，而对数据的采集、清洗、标注、增强等处理过程，往往是大量人力堆积的结果。”有分析人士就曾指出，人工智能的本质是代替人工的智能。“讽刺的是，这样的AI具备显著的劳动密集型产业特征。”

如果用合成数据呢？

“用五六年、上千个案例积累的真实数据，通过合成数据，几天几周就能完成。”贾奎告诉光锥智能，相比于人工采集与标注数据，合成数据的成本能够实现几个数量级的降低。

最关键的还是，在训练效果上，合成数据能够更优于真实数据。

由于本身就是基于物理规律合成，合成数据天生自带绝对精确的标注，这就意味着，AI学习起来效率非常高。

另外，合成数据的“全面性”是真实数据难以比拟的。“生成式AI 2.0可以创造无数个世界，而且可以让这个世界快速演进。”贾奎表示。

而落地到3D视觉行业，机械臂就犹如有了“上帝之手”，可以掌控一切过去未来。

“当然，这不能是物理世界的规律之外的。”贾奎强调。

“目前，我们不使用一张真实图片，就可以完成机械臂复杂场景作业的3D视觉模型训练。”贾奎告诉光锥智能，完全使用合成数据训练的模型引导机械臂的柔性操作，可以实现现场99.9%以上的稳定抓取。

也正是因为此，合成数据，被称为大模型的“数据永动机”。

当前，除了3D视觉领域，许多领域也都因通用数据缺乏和噪点多等问题，开始尝试使用合成数据。但也有对合成数据抱有强烈质疑的观点，称如果没有经过精心调试，在训练时大量使用，会引发模型崩溃，造成不可逆的缺陷。

从技术演进的角度，合成数据不会是大模型的唯一解。

但贾奎指出，“没有找到更好的办法之前，合成数据就是目前能够解决实际问题的最好办法。如果还采用人力堆砌的真实数据，在包括3D视觉在内的很多领域，AGI（通用人工智能）永远不可能实现。”

打破AI的商业化“魔咒”

在机器视觉领域，对合成数据的需求更加旺盛，生成式AI 2.0能够释放的价值也就会更大。

作为机器视觉非常重要的感知手段，3D视觉对于合成数据的需求就十分迫切。

“在一堆相似的零件里‘找不同’，物体换一个材质、颜色，都需要去调整参数。”一位3D视觉从业人士表示，不同领域的需求不同，使得落地场景过于碎片化，只能做完一个项目再重新定制另一个项目。

这就意味着，企业很难通过着力解决一个或几个项目需求，就能形成标准化产品。也就无法进而通过快速复制，打入并拓展市场，追求利润规模。

边际成本难以降低，会将一家技术公司，变成项目公司，最终拖垮。

“魔鬼”藏在细节中。

传统3D视觉感知有多脆弱？贾奎向光锥智能描述，“机械臂在抓取过程中，如果有人路过产生光线变化，任务就可能失败。”

这是由硬件3D相机的成像原理造成的，3D相机成像容易受环境、物体形状、材质、颜色、散射介质等影响，而且这一问题短时间内难以解决。

“解决一个问题可能是一百步，但最后一步付出的努力可能跟前面99步加起来是一样的。”商汤科技联合创始人杨帆曾表示，企业大部分的精力都需要用来应对小部分长尾问题。

但现在，“通用性能力很强的生成式AI 2.0，能够解决长尾问题，对于产品标准化至关重要。”贾奎表示。

相较于行业传统定制化开发的模式，企业基于生成式AI 2.0，就可以利用通用大模型，实现产品模块化开发，做到开箱即用地部署，进而实现同行业直接拓展，不同行业也能有效复用。3D视觉行业的商业化难题也就迎刃而解。

与此同时，数据、开发、部署、硬件、行业拓展，每一个环节的成本也都实现骤降。

而在生成式AI 2.0的催化下，3D视觉一旦爆发，也就意味着，在机械臂、机器人、无人驾驶、元宇宙等等高度依赖3D视觉技术的垂直场景，都将加速吃到AI的红利。

不少数据已经印证了这一点，像数据标注、合成数据、工业机器人、机器视觉等领域，全球市场规模都在高速增长，尤其是合成数据的年复合增长率甚至都超过了30%。

这背后，实际上是生成式AI 2.0的战略价值，已经受到了科技和众多制造业巨头的高度重视。

从西门子、福特等老牌制造企业，到英伟达、特斯拉、谷歌等一众科技巨头，再到Waabi等明星初创公司，都开始纷纷在工业、机器人、无人驾驶、医疗、零售等诸多领域，探索生成式AI 2.0更大的可能。

与此同时，资本的热情也被极大地调动起来。据不完全统计，近年来，国外合成数据的相关融资，累计已接近8亿美元。

在国内，合成数据相关企业也同样引起了资本的注意。2022年6月，跨维智能宣布完成Pre-A轮融资，融资金额数千万元，成立不到一年时间累计融资近亿元；今年7月，光轮智能也宣布完成天使+轮融资，融资金额累计数千万元。

可以说，从会作诗到学物理，生成式AI 2.0正在开启一个产业数字化的宏大未来。

推荐内容

AIGC 施展“物理魔法”，3D视觉突破“精度极限”

蓝思科技中报净利润增近三倍，彰显经营韧性与成长潜力 | 看财报

车机变“平板”，阿维塔终是向华为“妥协”｜钛度车库

8月21日A股分析：沪指跌逾1%失守3100点，环保板块逆市走强

AI落地推动PC 加速发展，戴尔要用OptiPlex商用台式机部署数字未来

北京亦庄：打造国内领先机器人产业综合集聚区

北京：谷仓智能硬件标杆孵化器落户丰台

“深海一号”大气田完成首次超深水海管清管作业

吉林：新能源电源集群调控新模式正式运行

首个国产PCSK9单抗药获批

21解读丨 5年期LPR不变有三大原因，后续存量房贷利率、存款利率有望下调

中信银行南京分行“信E采”业务助力中小企业高效融资

员工胸卡管理制度（员工胸卡）

佐力药业(300181)每日收评(08-21)

西子洁能(002534)每日收评(08-21)

临港B股(900928)每日收评(08-21)

科泰电源(300153)每日收评(08-21)

华峰超纤(300180)每日收评(08-21)

金杯电工(002533)每日收评(08-21)

新动力(300152)每日收评(08-21)

物贸Ｂ股(900927)每日收评(08-21)

四方达(300179)每日收评(08-21)

天山铝业(002532)每日收评(08-21)

国家发改委副主任杨荫凯主持召开推动银发经济发展座谈会

国家发改委召开推动银发经济发展座谈会

商务部：60余家企业和机构将在服贸会上首发一批新产品、新技术

世界十大音响品牌都有哪些（世界十大音响品牌）

斗罗，九心海棠堪称武魂奇迹，为何后期没再出现，一山不能容二虎

助推零售业数字化转型，华为云携手百联集团发布《云迁移框架白皮书》

浙江宁波缘何能成为专精特新“小巨人”诞生的沃土？

香港国际机场首7月客运量同比增超15倍 7月份客运量环比增14.9%

突发闪崩！上海机场、白云机场齐跌停 公司最新回应

我国货币政策加大逆周期调节 助力经济加快恢复

港股内房股整体下滑 融创中国跌超6%

*ST榕泰8月21日盘中跌停

男子6年没陪老婆过七夕登报道歉：今年又没能陪你未来家务我全包 具体是怎么回事？

当人类喝了核废水 受日核废水影响 淡水养殖或引关注 基本情况讲解

孤注一掷经典语录名句 孤注一掷：网线另一端的千谎百计 基本情况讲解

孤注一掷掀起全民反诈潮 孤注一掷：网线另一端的千谎百计 基本情况讲解

孤注一掷传递的信息 孤注一掷：网线另一端的千谎百计 基本情况讲解

借车给无证驾驶员死亡出事谁负责 少女无证驾车身亡 借车者被判担责 基本情况讲解

一家11口家中睡午觉被洪水冲走 四川金阳突发山洪多人被困 基本情况讲解

景区游客与工作人员争执 景区游客向工作人员泼热水被拘10日 基本情况讲解

孤注一掷拔网线 孤注一掷：网线另一端的千谎百计 基本情况讲解

食用十字花科蔬菜可减轻肺部感染

50多年前预测的量子态发现，有助抑制超导量子比特中的噪声

中国新能源汽车如何“一路疾驰”

“算力中国行”走进宁夏 探寻算力助力产业提质升级路径

第二届CCF量子计算大会暨中国量子计算峰会举办

李玟生前控诉《中国好声音》事件持续发酵，母公司星空华文股价再跌超三成 ｜钛媒体焦点

浦发银行青岛城阳支行开展“防范电信网络诈骗”活动

中国银行潍坊分行举办“断卡”以演代训培训活动

中润光学（688307）：该股换手率大于8%（08-21）

德尔玛（301332）：该股换手率大于8%（08-21）

汇金科技（300561）：该股换手率大于8%（08-21）

嘉曼服饰（301276）：该股换手率大于8%（08-21）

*ST爱迪（002740）：8月21日14时22分触及跌停板

马斯克承认：现在还没有伟大的社交网络 X也可能会失败

拜登又该头疼了！FEMA：极端天气风险显著提高，钱不够花了

都市冒险高手怎么注销账号 都市冒险高手注销账号方法

科达利：公司4680电池结构件目前处于批量生产阶段

招商基金出资5000万元自购基金

外媒：乌克兰正与跨国保险公司磋商 为来往于黑海港口的粮船提供保险

河北省公安机关服务保障灾后重建便民惠企九项措施

中建壹品与湖北省保租房签订战略合作协议 探索城市更新等合作

小鹏半年巨亏51.4亿

最好不相见如此便可不相恋完整版（最好不相见 如此便可不相恋）

巴哈马男篮vs阿根廷世界排名 巴哈马胜阿根廷晋级奥运资格赛 基本情况讲解

巴哈马篮球奥运资格赛 巴哈马胜阿根廷晋级奥运资格赛 基本情况讲解

巴哈马预选赛视频 巴哈马胜阿根廷晋级奥运资格赛 基本情况讲解

巴哈马对阿根廷 巴哈马胜阿根廷晋级奥运资格赛 基本情况讲解

阿根廷男篮vs巴哈马 巴哈马胜阿根廷晋级奥运资格赛 基本情况讲解

李秋平因涉嫌猥亵被停职 涉猥亵挂职女干部的县长仍在停职 基本情况讲解

巴哈马参加过世界杯吗 巴哈马胜阿根廷晋级奥运资格赛 基本情况讲解

挂职女干部被停职图片 涉猥亵挂职女干部的县长仍在停职 基本情况讲解

一年期LPR下调10个基点，市场关注存量房贷利率何时调降

我国首个大型巡天空间望远镜正在研制 计划与空间站共轨长期独立飞行

云南出台全国首个草原有害生物普查验收方案

万丰股份（603172）：股价5分钟涨速大于5%（08-21）

突发闪崩！上海机场、白云机场齐跌停公司最新回应

我国货币政策加大逆周期调节助力经济加快恢复

港股内房股整体下滑融创中国跌超6%

男子6年没陪老婆过七夕登报道歉：今年又没能陪你未来家务我全包具体是怎么回事？

当人类喝了核废水受日核废水影响淡水养殖或引关注基本情况讲解

孤注一掷经典语录名句孤注一掷：网线另一端的千谎百计基本情况讲解

孤注一掷掀起全民反诈潮孤注一掷：网线另一端的千谎百计基本情况讲解

孤注一掷传递的信息孤注一掷：网线另一端的千谎百计基本情况讲解

借车给无证驾驶员死亡出事谁负责少女无证驾车身亡借车者被判担责基本情况讲解

一家11口家中睡午觉被洪水冲走四川金阳突发山洪多人被困基本情况讲解

景区游客与工作人员争执景区游客向工作人员泼热水被拘10日基本情况讲解

孤注一掷拔网线孤注一掷：网线另一端的千谎百计基本情况讲解

“算力中国行”走进宁夏探寻算力助力产业提质升级路径

李玟生前控诉《中国好声音》事件持续发酵，母公司星空华文股价再跌超三成｜钛媒体焦点

都市冒险高手怎么注销账号都市冒险高手注销账号方法

外媒：乌克兰正与跨国保险公司磋商为来往于黑海港口的粮船提供保险

中建壹品与湖北省保租房签订战略合作协议探索城市更新等合作

最好不相见如此便可不相恋完整版（最好不相见如此便可不相恋）

巴哈马男篮vs阿根廷世界排名巴哈马胜阿根廷晋级奥运资格赛基本情况讲解

巴哈马篮球奥运资格赛巴哈马胜阿根廷晋级奥运资格赛基本情况讲解

巴哈马预选赛视频巴哈马胜阿根廷晋级奥运资格赛基本情况讲解

巴哈马对阿根廷巴哈马胜阿根廷晋级奥运资格赛基本情况讲解

阿根廷男篮vs巴哈马巴哈马胜阿根廷晋级奥运资格赛基本情况讲解

李秋平因涉嫌猥亵被停职涉猥亵挂职女干部的县长仍在停职基本情况讲解

巴哈马参加过世界杯吗巴哈马胜阿根廷晋级奥运资格赛基本情况讲解

挂职女干部被停职图片涉猥亵挂职女干部的县长仍在停职基本情况讲解

我国首个大型巡天空间望远镜正在研制计划与空间站共轨长期独立飞行

万丰股份（603172）：8月21日该股突破长期盘整

威士顿（301315）盘中异动股价振幅达11% 上涨6.6%（08-21）

8月21日 13:20分通达创智（001368）股价快速拉升

常青科技（603125）：日K线呈现-“曙光初现”形态后市看多（08-21）

两大机场龙头双双跌停！采购旺季来临磷化工龙头看好后市触底回升

日本女足英格兰女足结果英格兰女足输球后围一圈主帅训话基本情况讲解

澳大利亚和英格兰女足英格兰女足输球后围一圈主帅训话基本情况讲解

英格兰女足怎么打两场进两球呢英格兰女足输球后围一圈主帅训话基本情况讲解

中国好声音股票行情中国好声音母公司股价逼近腰斩基本情况讲解

好声音母公司中国好声音母公司股价逼近腰斩基本情况讲解

中国好声音是由巴士在线投资的吗中国好声音母公司股价逼近腰斩基本情况讲解

2019年好声音投资中国好声音母公司股价逼近腰斩基本情况讲解