请选择 进入手机版 | 继续访问电脑版

的卢深视CEO户磊:3D视觉将迎来全面取代2D的拐点

[复制链接]
查看13 | 回复0 | 2020-10-17 18:06:00 | 显示全部楼层 |阅读模式
[购买目录(微信:伊利云)北京]10月16日报道
10月16日,FUS购买了目录。2020年人工智能产业峰会在复兴北京金茂酒店隆重举行。近百名著名的首都咖啡、独角兽创始人、企业家和近千名企业家齐聚一堂。
峰会上,路申时首席执行官雷虎应邀发表了题为“技术落地、规模和体验的试金石——让三维视觉成为机器标准之眼”的主题演讲。他说:随着神经网络基础波的到来,大众认为算法能力的提高,计算能力的加持,数据采集的增多,很快就可以形成AI的大规模应用,所以计算机视觉技术的发展在2018年有了一个高峰。
但是到了2020年,已经进入低谷,因为在发展的过程中,大家意识到真正成熟的计算机视觉或者机器视觉的应用,需要结合行业场景,而不仅仅是简单的行业、系统、算法,才能解决问题。而是要从数据和传感两个方面来设计整个系统,然后结合行业,才能形成真正完整的方案。这个过程与技术的演进和标准规范的构建有关。
雷虎强调,三维视觉帮助机器实现更好的人机交互,这是人工智能升级迭代的核心驱动力之一。经过几年的市场培育,大家开始对AI应用或者可视化应用有了一个认知,养成了一定的用户习惯,开始希望提高体验和效率,应用到更多的行业,更多的场景。然而,对这些应用的规模和安全性的要求已经提高了一个数量级,从而产生并增加了对3D技术的需求。
在3D硬件相对成本比较高的时期,还是要从比较强的刚刚需要的领域切入。随着应用领域和范围的不断增加,硬件规模的不断增大,3D的应用成本会逐渐降低。当3D硬件成本接近2D时,整个系统和产品的差异趋近于零,用户会选择性能更好的,这将迎来3D全面取代2D的拐点。
沈璐视觉成立于2015年,专注于三维视觉,擅长毫米级三维成像、三维重建、三维测量、空之间的定位和跟踪、识别和理解,这是六个核心技术方向。总部设在北京,R&D中心和产品中心分别位于合杭,深圳有营销中心,拥有十余个服务网络,可以提供本地化服务。卢申时一直坚持3D需要软硬件结合。通过系统的垂直集成和系统优化,可以大规模推广交互距离内的高精度三维传感系统和解决方案。
本次峰会由Buy Directory主办,猎云资本、企业管家、猎云金融、夏普透视协办。峰会将会是“AI UP!”以人工智能行业应用为主题,通过展示多领域、多维度的人工智能技术和产品,分享和讨论AI在不同场景下的最新应用,展示人工智能行业应用的最新成果;并围绕人工智能行业的“攻”与“破圈”,探讨AI技术如何赋能行业。
以下为语音分享记录,目录编辑删除:我们卢申时的方向更多的是人与人之间的互动、认可和感知。今天,我们将与你分享我们的一些认知。从高德纳对计算机视觉技术成熟度曲线的发展和预测可以看出,在技术发展的早期有一个高峰,即2018年。因为当神经网络基础的浪潮来临时,大家都认为经过算法能力的提升和计算能力的加持,以及更多数据的收集,人工智能AI的大规模应用很快就可以形成。
然而在2020年,又出现了一个低谷。在这个过程中,大家意识到,真正成熟的计算机视觉或者机器视觉的应用,需要结合行业场景,而不仅仅是简单的行业、系统、算法,才能解决问题。而是需要对整个系统从数据传输到与行业融合进行设计,才能形成真正完整的解决方案。这个过程与技术的演进和标准规范的构建有关。
关于视觉,我们之前说的图像视觉是2D视觉,以人为对象。未来AI应用更多的是机器视觉,以机器为对象,让机器更好的感知和理解世界。同时,机器视觉在未来将是一个非常重要的因素,因为它可以利用机器的快速计算能力和一天24小时的工作时间。
为了让机器更好的理解世界,我们不会完全被原始的图像信息所限制,而是从物理世界中提取更丰富的3D信息并发送给机器,让机器更好的理解。这也将是升级迭代非常重要的核心力量。
另外分享一些3D视觉应用的趋势和方向。首先,经过前几年整个市场的培育,大家开始了解到AI的一些应用或者说可视化应用。落地练习中最常见的应用是人脸识别。经过最初的普及,公众开始习惯于通过人脸进行身份验证,人脸是一种合作度相对较低、不敏感的生物识别。
因此,人们开始希望提高自己的体验和效率,并将其应用到更多的行业和场景中。比如直接凭身份证付款,直接坐地铁。
这些应用的规模和整体安全要求都提高了一个数量级,高于证人验证的现场要求和更高的安全要求,所以逐渐应用到3D技术中。比如在3D刷脸支付领域,我的在线刷脸支付APP上通常使用3D摄像头,对平面假体的保护能力更好。
整体来说,3D刷脸和技术创新可以带来更高的安全性。比如在数据库越大,数据库越大的情况下,可以实现更准确的识别,同时可以提高识别的交互体验,对刷脸的角度有更大的容忍度,包括活体检测和更好的防伪装保护。在数据库规模更大、规模更大、安全性更高的热门应用中,3D人脸识别技术将成为主流。
同时,获取3D信息肯定会带来成本。在感知阶段,需要具备3D硬件或者获取3D数据的能力。但随着应用规模的增加,成本会逐渐降低。我们相信,在3D硬件相对成本比较高的时期,我们还是需要切入更强的、刚刚需要的领域。随着应用领域和范围的不断扩大,硬件的规模也在不断扩大,这将逐渐降低成本。当3D硬件成本接近2D时,整个系统和产品的差异接近于零,用户会选择性能更好的,这将迎来完全取代2D的拐点。我们认为现在成本已经很接近了,预计明年或者次年会有拐点。
三维整体视觉的应用必须从某些领域开始,逐步延伸,这需要一个过程。但在这个过程中,作为一家科技公司,我们需要与行业市场进行整合,在整合的过程中逐步进行技术升级和产品迭代,最终形成一种不断演进的能力。
公司本身的整个技术研发体系非常重要。我们的思路是从市场需求上把技术规划分成两部分,一部分是实现领先的技术规划,另一部分是支持产品落地规划,通过新技术的前期研究和产品验证,再加上产品研发的瀑布迭代,形成量产产品。我们与大学和科学家有着非常密切的合作。同时底层由我们的3D可视化工程平台支撑。
我们将三维视觉工程平台分为四个部分,第一部分是光学,第二部分是算法。我们认为光学和算法是密不可分的,我们有样机验证和可靠性验证设备。另外,做完整的应用产品和解决方案还需要机械和电力。光学、算法、机械、电器一起形成产品迭代和技术开发。
最后,3D视觉是一个完整的产业链,上游前端是光学的起点。无论是结构光还是各种光学器件,中间都会有一个完整的模块组装环节。我们从成像系统的设计开始,然后在上层光学摄像系统中加入3D算法,形成完整的3D软硬件模块,提供完整的算法能力,然后嵌入到产品中,支持下游客户或合作伙伴,形成完整的行业解决方案。
我们相信,随着三维视觉的发展,光学系统和算法系统的紧密结合,或者说是一种交互式的集成设计,是最终能够应用到地面,能够更快地赋予行业力量的最重要的理念。两者是没有办法分开的。
对于3D视觉的应用,我们相对谨慎的是未来会在哪些方面发生更多可能的变化。主要做场景重构,重构后的结构和数据,也可以做医学图像,或者做一些物体,我们整个目标就是人。
我们的哲学一直是人类智能,我们希望最终能做到轻合作到不合作,实现机器与人的互动变得和人一样自然。我们探索的是人们如何认识他人和与他人互动。我们首先要认同自己,然后预测人的行为和想法,沿着这条路继续进化。从整个技术架构来看,我们以“人”为题材,最终希望实现人的精细数字化认知,以及一个3D存在在物理世界中的身份、行为和轨迹。
与一般的图像识别不同,3D有数据,有算法,有传感器。从数据上看,需要海量的3D数据采集和标注,需要建立3D数据库和相关标准。在算法层面,包括人脸识别、面部表情识别、动作捕捉、身体外观,从传感器端来说,需要通过低成本的硬件更好的获取3D原始数据。
最后,通过结构光,包括双目视觉,希望在远距离获得更高的3D感知精度,从而覆盖更大的场景,获得各种光照条件下的3D数据,获得更高分辨率的数据,可以实现更小更低的成本。最终会更好的应用,更好的服务行业。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则