本文系投稿,作者:刘哲

有关3D-AR系列文章,此为第二篇

第一篇:《苹果Vision Pro开启新时代,计算机从2D到3D,三维内容生态迎万亿蓝海》


(资料图片)

谁拥有先进的三维数字化技术(3D内容生产),谁就掌握下个数字世界的入口,谁解决了3D内容生产的技术、商业瓶颈,谁就是下一个全球顶级的科技巨头,这是全球科技的核心领域,也是全球竞争的战略高地。

3D内容生产主要有人工建模和三维扫描两种方式,核心看好三维扫描中的图像建模、结构光技术。三维扫描,又称3D数字化、3D建模,指通过机器扫描、配套软件处理,人工修复生产出具有三维立体数据、色彩、纹理、各种几何面的3D数据模型。机器扫描又分为激光、结构光、图像建模三种细分领域,各有优缺点,具备核心竞争力,能解决未来十年数十万亿级别的3D内容,主要是依赖图像建模、结构光技术的发展。

国外传统3D公司以激光为主。海外是从上世纪80-90年代开始进行研发和商业化,以服务汽车、机械、建筑、医疗等行业应用为主,绝大部分采用激光雷达扫描,价格十分昂贵,且扫描后的模型无色彩纹理,无法用于互联网、AR/VR的消费端。

科技巨头近几年跨界进军,并购频发。相较于国内对3D产业认知缺失,海外科技巨头对未来十年3D内容生态充分认知,近几年纷纷进行产业链收购,加大技术研发三维数字化技术。如苹果收购了香港大学全龙教授的技术,推出了软件Object Capture;谷歌多年来一直在研发三维数字化技术;亚马逊近几年多次高价收购三维数字化技术公司。

中国军团厚积薄发具备全球竞争力。我国几乎与国外同步开展相关研发和产业化培育,国内图像建模以景致三维为代表,结构光技术以易尚展示为代表,均是产研学一体,自主研发,各有优势,在技术研发、商业化、工程实践上取得一定进展。相较于AR/VR头显端,我国在三维数字化技术—3D内容生产方面具备全球竞争力。

国外高度重视,国内急需重视和投入。目前三维数字化技术还未像二维成像技术(拍照、视频)这么成熟,仍需对关键底层技术进行研发,对硬件产品、软件体系进行升级迭代,不断解决产业化过程中面临的技术难题和商业短板,进而具备全球竞争优势,培育巨大战略产业。相较于国外对三维数字化技术的高度认知和战略重视,我国在政府层、产业层、大型公司、投资层对此认知不足。

一、3D内容生产的方法、流程和难点

3D内容的生产——又称3D数字化、3D建模,是指通过机器扫描、计算机软件、人工处理等构建出具有三维立体数据、色彩、纹理、各种几何面的3D数据模型。其涉及到多视图立体几何、深度图估计、点云处理、网格重建和优化、纹理贴图、马尔科夫随机场、图割等技术。目前,3D内容生产主要有人工建模、机器扫描两种方式,其中机器扫描又分为激光、结构光和图像建模。

(一)传统人工建模难以商业应用

人工建模又称正向建模。其从概念设计出发,经过数据编程、加工,依靠计算机辅助设计,得到开发者需要的3D模型。人工建模要求操作人员要具有丰富的专业知识,熟练使用建模软件,之前适用于3D游戏、3D动画和电影。

人工建模涉及环节多,流程较为复杂。主要流程有:构建3D几何形状-构建3D建模-材质着色器-UV展开-烘焙-纹理贴图-骨骼绑定和动画-布局与渲染。

人工建模其有诸多天然缺陷,难以满足3D-AR的大规模商业应用:

三维模型真实度、还原度不高,不利于打造3D-AR的虚实结合

操作复杂,周期较长,商业成本极高(3D电影、3D游戏上亿成本)

精细度不够,且难以标准化

(二)三维数字化技术迎来时代机遇

三维扫描,又称三维数字化技术,是一种先进的全自动高精度立体扫描技术,使用光学传感器件、计算机硬件等对物体进行扫描,通过发射光的反馈获取三维坐标信息,依靠设备的摄像头来获取纹理颜色,结合三维重构的算法和系统,构建三维物体的几何形状、色彩、特征的三维数字模型。

计算机视觉—三维数字化原理

目前技术主要有激光、结构光、图形建模三种路径。最初的应用领域主要是工业、制造业的逆向工程、测绘检测等,采用激光技术为主,讲究高精度、高密度,但生成数据为黑白,缺乏色彩和纹理。本世纪初,结构光扫描技术出现,是由激光技术衍生发展而来,可生成色彩、纹理,应用于互联网领域。2010年后,图像建模技术出现并快速商业化应用。

三维数字化技术路径

使用技术应用领域优点缺点
激光工业、制造业的逆向工程、测绘检测高精度、高密度

缺乏色彩和纹理

会有大量错误数据

结构光互联网、3D/AR、全息中高精度,模型、颜色、纹理不失真

面数多、模型大

需人工将几十G数据压缩到10M左右,会有大量错误数据

图像建模互联网、3D/AR、全息

数据色彩、纹理逼真

能自动映射,具备成本优势

仍需人工处理数据

部分不规则无法拍摄

由于激光主要用于工业测量,无色彩和纹理。3D-AR生态的万亿级3D数据需求,主要依赖图像建模、结构光技术的成熟和商业化应用。三维扫描相较于人工建模,能大幅提升3D内容生产的效率。

(三)3D内容生产的流程和痛点

1、三维扫描未像二维拍照样成熟,还需配套软件和人工处理

三维内容的生产,先通过专门的扫描仪/摄像机进行扫描拍摄,获得初步的数据,但初步数据拥有大量的错误数据、缺失数据、且缺乏纹理等。各公司再通过自研的自动化软件进行处理和完善,得到一个完成度在60%-80%的3D模型(完成度由模型的复杂度、不同的机器和技术路径决定),剩余20%-40%的模型构建修补工作则由人工进行处理。机器扫描及软件处理在数分钟到十分钟不等,但人工处理则需要数小时到数天时间。

生产流程机器扫描拍摄配套软件自动化处理人工处理
用时时间数分钟数分钟到十分钟数小时到数天
生产结果50%-60%60%-80%100%

由不同模型、不同机器、不同技术决定

三维扫描生产的模型仍需人工修补

2、物品规则多样化,技术上仍有各种受限瓶颈

受到复杂场景的几何结构、未知物体表面反射特性、变化的光照条件、复杂的地形以及不规则的未知遮挡物等限制,三维数字化技术还不能一次性还原所有表面,各种几何物体和不同颜色,黑色或反光表面、玻璃等透明物体难以识别和还原。因此如何快速而又精确地扫描出复杂的三维物体仍是研究该技术的关键。

3、非常复杂和专业化,生产注重工程实践

3D内容的技术标准和制作流程涉及很多环节细节,以三维数字化公司给阿里、京东提供商品3D内容生产为例,每家都需要经过十多个生产流程环节,各种物体、材质的不同,对应的三维数字化技术设备和扫描方式亦不同。

(四)应用最广、技术最难的领域

如第一篇《苹果Vision Pro开启新时代,计算机从2D到3D,三维内容生态迎万亿蓝海》所述,3D内容生产直接关系到苹果为代表的科技巨头打造的3D-AR生态,同时亦是3D打印的上游数据方,3D内容生产是下一代信息科技革命的战略制高点。

事实上,三维数字化是计算机视觉最难环节,苹果能实现较好的运动追踪、空间感知,但无法还原精准的三维数据。Meta更是因为三维数字内容的粗糙效果大打折扣。

苹果iPhone运动跟踪(无法三维建模的色彩、纹理等)

Meta的三维内容应用

在3D视觉领域中,包含3D识别、3D空间感知、3D数字化、3D打印四个细分领域。3D识别只需要做个判断,3D空间感知则是空间计算,3D数字化(三维数字化)则要精准反应3D物体的长宽高、几何形状、面数、色彩和纹理,是所有环节中最难。

总之,苹果及业内公认的,3D内容生产是最昂贵、最困难的环节。虽然行业进入门槛较低,但技术成熟度、大幅提升效率,降低成本难度较大,具有非常高的技术和商业竞争壁垒。全球科技巨头对此心知肚明,纷纷进行业内并购,不断投入技术研发和工程实践,力图解决技术、商业难点,培养下一代信息科技革命的核心战略高地。

二、国外篇——传统公司以激光/工业测量为主

国外是从上世纪80-90年代开始进行研发和商业化,国外传统三维数字化公司,以服务汽车、机械、建筑、医疗等行业应用为主,绝大部分采用激光雷达扫描,价格十分昂贵,且扫描后的模型无色彩纹理,无法用于互联网、AR/VR的消费端。

(一)GOM

1990年成立于德国,研发部门共有100多位工程师、数学家和科学家,已有超过一万四千台系统设备服务于汽车、航空和消费品等行业。

Gom公司介绍

(二)Faro

1981年由博士生Simon Raab和Greg Frasier成立,设想成为3D测量和成像的先驱,Faro于1997年纳斯达克上市,主要研发激光雷达探测,面向医疗端和工业端领域。

图:Faro公司介绍

(三)Creaform

2002年成立于加拿大,2005年推出首个3D 激光扫描仪Handyscan,2009年推出彩色激光扫描仪,2010年伦敦自然历史博物馆购买其第1000台扫描仪,同时收购技术领先的3D人体扫描公司InSpeck。

(四)Artec

总部位于卢森堡,2007年开始生产高品质的3D扫描仪,主要应用于工业设计与制造、医疗保健、科学与教育、艺术与设计领域。

三、国外篇——科技巨头跨界大举进军,并购频发

3D内容生产是计算机三维数字世界的入口,各大科技巨头心知肚明,近几年科技巨头公司纷纷大量收购三维数字化公司、加强技术研发和投入,抢占下一代信息科技革命的战略制高点。

(一)苹果

苹果收购以色列面部3D扫描软件公司RealFace,该公司成立于2014年,位于特拉维夫的RealFace,以开发面部识别技术而闻名。

苹果2017年推出iPhone X,具备脸部3D识别和跟踪功能,但并未具备3D建模重现。

图:苹果iPhone X的脸部3D识别功能

根据3D产业链信息,苹果收购了香港大学主攻三维数字化的权龙教授的公司。

苹果2021年6月WWDC推出了Object Capture功能,主要应用于技术最简单的小物品,包括一些规则整齐、面数和纹理较少的小物品,扫描构建AR所需3D数据,但此类技术谷歌多年前已推出,仍需人工大量操作,商业化效果及进程一般。

(二)谷歌

谷歌多年来一直在研究3D扫描技术。谷歌最新创造出一种被称为“容积捕获”的技术装备,由在一个360°全景设备中的100部1200万像素相机和331个LED照明模块组成,能够看到物体周围的一切,从而创建出真实照片感的物体3D模型。

2021年谷歌I/O开发者大会上,谷歌推出发布了Project Starline,由高分辨率传感器、景深扫描传感器以及 65 英寸「光场显示器」重新生成的实时3D模型,该项目已开发数年之久,其背后是大量计算机视觉、机器学习、空间音频和数据压缩技术。但目前看此项技术偏概念,难以商业化普及。

图:谷歌展示的动态3D建模

腾讯:科技巨头数据处理,硬件、数据采集依赖第三方供应商

(三)微软

微软开发了一款产品PhotoSynth,可将大量的照片做3D处理,但是它不是真正创建3D 模型,而是根据照片之间的相机参数及空间对应关系,建构一个虚拟的3D场景,使得用户能够从不同角度和位置来查看该场景。

(四)Facebook

Facebook 2019年3月推出数字人类项目“Codec化身”。这个项目特别关注头部和脸部,头像的生成需要用132个摄像头对用户头部进行昂贵的扫描。

2019年5月,在F8年度会议上,该公司展示了以前所未有的逼真度进行的实时无标记人体跟踪,使用的模型参考了人类肌肉和骨骼系统。

2021年9月,Facebook推出了3D重建数据集:Common Objects in 3D,作为同类第一个数据集,CO3D主要用于重建现实生活中的3D对象,而AR/VR在3D中重建对象是一个具有开创性的计算机视觉问题。

(五)亚马逊

2015年,亚马逊收购了3D数字化公司Shoefitr,Shoefitr公司成立于2010年,利用自主开发的3D数字化技术,对鞋子里外进行扫描,以获取最为精确的信息。

2017年,亚马逊以4.7亿元收购了人体3D扫描公司Body Labs,Body Labs成立于2013年,专精3D人体扫描技术。

2019年,亚马逊推出了“Amazon Real World Image Study”, 公众可以提交自己的3D身体扫描数据供亚马逊研究,然后后者将相应地为你支付酬劳。技术涉及人工智能,计算机视觉和身体建模。3D模型可以支持衣服试穿等用例。

2023年,亚马逊成像团队、AWS的空间计算团队与3D AR可视化平台Hexa达成合作,推出可规模分发、简易的3D AR开发流程,加速电商合作伙伴使用AR来营销、展示的过程。Hexa平台为用户提供基于拖拽等方式的低门槛3D AR开发功能,特点是结合AI美术设计,可帮助品牌和零售商快速创建、管理和分发高质量3D模型、AR、360°视频等内容,并应用于家居、服装等领域。

图:亚马逊身体扫描及虚拟试衣

(六)Snap

2021年7月,Snapchat的母公司收购品牌商品3D模型的AR团队Vertebrae,一家可以让品牌创建和管理其商品的3D资产创建平台,用于3D扫描、AR购物,允许用户虚拟地试穿限量版Gucci鞋品,公司团队50余人。

(七)Adobe

全球软件巨头Adobe2019年仅有的两次收购均围绕着3D产业展开。2019年1月份,加码沉浸式布局,Adobe收购3D编辑工具Substance开发商Allegorithmic。2019年12月,Adobe收购三维雕刻工具Oculus Medium。

2020年10月27日,Adobe发布了3D扫描工具Scantastic,可扫描物理对象用以创建AR体验,Scantastic尚属于实验性质,未向公众开放,3D模型的创建依然是一项极其复杂的任务,需要特定领域的高水平知识。

(八)Epic Ggame

Epic Games2021年3月收购摄影制图工作室Capturing Reality,用来完善Epic Games的3D扫描技术。

2022年,推出了免费的3D扫描App《RealityScan》,原理基于摄影测量3D建模,该应用可实现2D/3D深度地图扫描、激光扫描等功能,生成的3D模型可在Sketchfab平台托管。

(九)Unity

2020年12月,Unity收购以色列3D建模创企RestAR。RestAR是3D建模的计算机视觉和深度学习公司,为时尚品牌、在线零售商和营销人员提供扫描和渲染的高质量3D实物消费产品。收购后RestAR员工加入Unity,其技术与Unity Forma集成,将交互式RT3D技术的功能扩展到所有类型的营销人员。

2023年6月,Unity中国筹备自研本土版引擎,发力XR、3D内容生成工具开发。

(十)Magic Leap

AR明星企业Magic Leap,2017年收购瑞士计算机视觉公司Dacuda的3D成像部门,其长远愿景是实现实时拍摄2D和3D图像,“使制作3D内容如同拍摄视频一样容易”。

(十一)NeXR

2021年1月,欧洲最大服零售商H&M的创新实验室H&Mbeyond与德国VR/AR技术解决方案商NeXR与达成合作,携手开发虚拟试穿方案——“3D数字试衣间”。

NeXR Technologies 虚拟试衣

(十二)GAP

2021年8月,美国服装公司Gap宣布收购基于虚拟形象的3D虚拟试穿方案商Drapr,Drapr专注电商产品可视化领域,旨在通过3D虚拟形象来帮助消费者匹配适合自己的服装,根据自己的风格和体型去寻找合适的服装尺寸和版型。Drapr成立于2019年,其衍生自UC伯克利大学,在3D技术领域有十几年经验。

GAP收购3D虚拟试衣Drapr

海外科技巨头对3D相关收购

四、国内篇——中国军团厚积薄发具备全球竞争力

我国在下一代计算机中心的打造上与美国科技巨头存在一定差距,但在3D内容生产上具备全球竞争力。

(一)景致三维——国内唯一图像建模

1、独创技术深耕领域,填补我国图像建模空白

2016年,由科技奖励专家谢茂(曾长期主管信息技术领域专项科技成果奖励评审工作,多次亲自组织重大科技成果的专项奖励评审,评审委员会主要由两院院士组成,重点关注科学技术的实践性应用)创建。技术团队主要来自中科院,涵盖计算机视觉、计算机图形学、摄影测量、智能信息、网络工程、自动化控制等多个学科专业,在基于图像三维重建领域具有强大的研发实力。

景致三维、景致数据公司创始人介绍

公司成立七年来,一直专注基于图像三维重建技术的研究与应用,拥有国内领先、国际一流的三维数据获取、海量三维数据管理、互联网三维展示等一系列完全自主核心技术并形成完整技术链,建有全球规模最大、技术领先的三维数据生产云中心。填补了我国在三维数字化—图像建模领域的空白。

公司完全自主研发了全自动图像采集系列设备,实现了建模物体全方位原始图像的高效精确采集(10cmx10cmx10cm-100cmx100cmx150cm)。几何精度最高达到亚毫米级<0.1,面数达到3000多万,纹理精度实现像素零损失。根据客户需求提供2K、4K、8K、16K的3D内容。

景致三维自主研发的设备

2、公司具备竞争优势

(1)3D内容质量高。景致在设备、体系上经过长期探索实践,拥有独创的流程和方法,在多品类的建模实现上具有极高的工艺,生产的3D内容色泽及纹理逼真。

(2)适用范围广。公司三维数字化技术无明显短板,能覆盖大部分品类

(3)能大批量生产。公司自研全球独有的全自动智能化关键设备占据技术入口,极大提高图像采集质量和效率,建立了由五大终端组成的全球第一条基于图像3D内容流水化生产线,实现3D内容超大规模批量生产。

(4)自动化水平高。纹理映射是3D内容生产中最困难的环节之一,人工建模和3D结构光,均需要手工将纹理贴至3D模型中。而景致独家研发的自动纹理映射技术,全球首创海量图像云处理技术,极大提升了生产效率。

3、深受阿里、京东、耐克等产业链高度认可

经过多年实践,公司已获得阿里、京东、耐克、小米等电商平台、商家的深度认可。公司深度参与阿里、京东的3D电商体系构建,目前是阿里巴巴XR深度合作伙伴、京东“VR/AR联盟”战略合作伙伴、抖音“3D项目”官方合作伙伴。公司获得多家品牌商的认可,包括耐克(独家)、阿迪达斯、乔丹、OPPO、小米(市场第一)、荣耀、格力、美的、索尼等多家品牌商。其市场份额位居行业前列。

景致覆盖的品牌供商家

(二)易尚展示——结构光的龙头

彭翔教授——我国最早研究、最权威的三维数字化领域的顶级专家。

彭翔教授,毕业于天津大学精密仪器与光电子工程学院,本硕博均学习三维数字化技术,后在德国应用光学研究生从事博士后研究,其研究领域包括三维数字成像及造型、光学信息安全、和现代光学测试技术。

彭翔教授曾主持完成多项三维数字化领域的国家自然科学基金项目、省部级项目、以及企业委托项目,现主持国家自然科学基金、广东省自然科学基金、及深圳市科技计划项目等多项课题的研究。国际和国内重要学术期刊上发表研究论文100余篇,获得授权国家发明专利8项。

研发类别项目名称
国家自然科学基金项目“心动周期的计算机辅助激光诊断”项目负责人
国家自然科学基金项目“基于位相映射的三维光学数字成像视觉及其图像理解”项目负责人
国家自然科学基金项目“多分辨动态三维数字成像及造型”(60275012)项目负责人
国家自然科学基金项目“基于虚拟光学框架的多维信息隐藏及密码学”,(60472107)项目负责人
国家自然科学基金项目“嵌入式三维数字成像与建模流水实现的关键技术”
NSFC/DFG中-德科学中心项目“微系统技术中的先进光学制造与测量学”(GZ 398)项目负责人

彭翔教授主导的部分国家自然科学基金项目

易尚展示2009年引进彭翔教授技术,是我国最早开展三维数字化技术研发的公司,技术研发和产业化培育已有十余年积累。公司与国内四大顶尖院士成立院士工作站,与清华大学、北京航天大学、深圳大学、国家重点实验室等长期开展合作,并承担国家重点研发计划、国家重大科学仪器项目,其技术实力、研发人员、专利储备位列国内第一。

2014开始进行商业化应用,其三维数字技术与云平台引擎在全球范围内均具有领先优势,是阿里巴巴第一个3D数字化合作伙伴,为京东、蚂蚁金服、苹果、华为、字节跳动、茅台、格力、沃尔玛等提供三维数字技术支持及AR内容开发服务。

(三)奥比中光

奥比关注日常生活场景中的物体3D 数字化,推出面向消费者的便捷三维扫描的解决方案,开发了手持扫描仪。

三维扫描仪搭配手机端APP和桌面端软件使用,能灵活地在室内外不同光照度下完成手持式扫描。扫描仪搭载了公司自研的深度计算专用芯片,直接在扫描仪侧完成深度计算,大大降低了对手机和PC 电脑的算力要求,保证了扫描过程的流畅性。扫描仪小巧、轻便适合随身携带,既能快速扫描中大型家具等物体,又能高精度的完成小手办建模。扫描仪搭载高分辨率的RGB相机,支持彩色扫描。

(四)先临三维

公司于2014年8月8日在新三板挂牌。公司总部设于杭州,在北京、德国斯图加特、美国旧金山等地设有子公司。公司业务专注3D数字化及3D打印技术十余年,主营3D数字化与3D打印设备及相关智能软件的研发、生产、销售,主要面向工业端提供3D数字化服务,目前最好的产品之一为3D牙齿扫描及打印,畅销海外。公司自主研发了多项3D领域核心技术,拥有超过300项的授权专利和100多项软件著作权,建有省级重点企业研究院,是我国“白光三维测量系统”行业标准牵头起草单位。

先临三维3D数字化产品

(五)知象光电

公司核心团队来自西安交通大学,主打结构光3D成像模组核心硬件技术和3D人工智能算法,打造高精度3D成像品牌,目前投资者包括国中创投、深创投、软银中国、中科创星等。

知象光电介绍

整体上看,我国三维数字化公司均是“产-研-学”背景,均是高校团队的技术商业化。相关公司的领头羊已经有多年的研发经验。

国内三维数字化技术来源

借用知象光电创始人的一句话,来看这个产业:

我时常在想,我们的国家有那么多大学和科研院所,每年作出数以万计的论文、专利和科研成果,为什么还会在核心技术上受制于人?这也许很难用一句话来回答,但可以确定的是,只有这个国家多数人关心的是需要长期投入的核心技术,而非短期即可变现的核心利益这个问题才会解决。

——知象光电创始人,国家科技重大专项评审专家

国内缺乏产业认知,急需顶层规划和战略支持。三维数字化是新一代科技创新的核心技术,是下一轮信息产业革命的信息源头,其具备技术壁垒高,商业空间大,产值巨大,解决海量就业,是全球科技竞争的战略高地。三维数字化仍需对关键底层技术进行研发,协调跨学科领域科研团队,对硬件产品、软件体系进行升级迭代,不断解决产业化过程中面临的技术难题和商业短板,进而具备全球竞争优势,培育巨大战略产业。

以先进的图像建模技术为例,中国唯一的景致三维与苹果处于同一赛道竞争。苹果推出了图像建模工具Object Capture。由于手机摄像头的清晰度和精准性,目前电视剧、电影,以及专业化的直播、短视频仍采用专业的摄像机拍摄,而3D内容的大小、复杂度、技术难度远高于二维的拍照/摄影,未来仍会以景致三维的专业设备为主。但从中长期看,景致三维仍需不断改良技术,迭代产品,在全球图像三维数字化的技术、商业竞争中持续保持领先。

相较于国外对三维数字化的战略重视,我国在政府层、产业层、大型公司、投资层对此认知不足,急需获得国家战略的顶层规划,由大型央企、国家产业资本、大型互联网战投进行战略投入,帮助中国在三维数字化领域中培育有全球竞争优势的核心产业。

*声明:本文系用户投稿,非VR陀螺官方稿,谨代表作者个人观点立场,法律问题一切与VR陀螺无关。

推荐内容