海康威视研究院院长浦世亮:海康AI开放平台如何破解落地应用瓶颈?
|
浦世亮:首先是数据瓶颈的突破。在学术界,ImageNet数据集的推出对于人工智能的学术研究具有强大的推动力,但在工业界和实体行业,还没有出现适用的数据集来助推行业人工智能的发展。至此,我们希望能够做实体行业的领域模型。可以预想,未来物理世界所感知到的信息都可以用各种领域模型去描述,当然,这种领域模型和最终的应用场景之间还是会有一点差距,但我们有一种技术叫迁移学习。在相关领域模型基础之上,系统神经网络已经对某类场景有较强的感知能力,通过少量的用户自我数据,再通过迁移学习方法便可以在这个模型上很好地进行算法训练。 通过系列测试实验,在很多领域上我们已有的领域模型基本可达80%甚至更高的检测精度,用户只需要提供少量的场景数据,精度可提升到95%以上,对于用户而言,这是一个0到1的突破。这是海康威视AI开放平台解决数据问题的第一点。 第二点,我们用了大量诸如图像三维建模这一类虚拟现实技术构建了一个虚拟数据生产引擎,主要是帮助那些数据量少、数据获取难的行业解决数据样本采集难的问题。比如商超零售领域货架补货环节,传统的做法是上新货后人工从各个角度、各种摆放位置拍摄做数据采集,但这个工作量很大,每上一次新货或换一个位置,用户需要重复操作很久。但通过虚拟数据生产引擎系统,用户只需拍少量几张图片上传,系统便可自动生成各种角度、各种大小、各种摆放位置的货品图片,这种方式可以进一步的帮助用户突破数据瓶颈。 其次是在算法层面的突破。以前人工智能算法训练首先要设计神经网络模型框架,然后人工调参,但现在我们可以通过机器自动完成建模,在这个过程中,通过庞大的计算力完成各种模型结构的自动调整、测试和训练,这正是当下学术界热门的网络架构自动搜索技术方向。海康在这方面投入了重大资源,相关技术能力已经上线到我们的AI开放平台,这项能力的推出,将极大地简化算法训练、算法生成的技术门槛。 与此同时,海康还推出了一种自动编译工具,可以帮助用户在平台上进行很好的算法优化。边缘智能的当下,由于受功耗和成本的限制,很多边缘类产品往往只能在一些计算资源和内存资源比较受控的计算平台上运行,如何在这些平台上做算法优化是一项强大的考验。通过自动编译工具可以把各种优化方法做成软件工具,让用户随取随用,无需再另外投入资源去做工具开发。 第三在计算资源方面,我们已经在萤石云上开放了海康内部的并行训练系统,可以让用户共享我们的计算资源,基于高性能并行训练系统,更好的辅助算法训练。 最后在产品层面,海康开放了整个前后端的基础产品,包括操作系统,可以帮助没有产品资源的用户乃至AI创业公司能够基于海康的一系列硬件产品去实现他们自己的算法,自建自己的智能产品。 通过上述这一系列从数据、算法、计算资源到硬件产品瓶颈的突破和能力的开放,海康威视希望可以真正帮助实体行业的合作伙伴贯彻AI能力的落地应用。 关玉娟:从用户角度而言,用户该如何共享海康AI开放平台的这一系列能力? 浦世亮:举个最直接的例子:比如一家连锁商店的老板需要通过AI技术检测商铺门口是否堆有垃圾,但商户本身没有任何技术能力。这种情况下,只需要商户注册成为海康AI开放平台的合作伙伴,在线上传几十张自己拍摄的店门口的垃圾图片,并通过平台上的标定工具标定垃圾信息,同时选定摄像机,将标定后的垃圾数据进行算法训练后关联到选定摄像机,商户即可自行给普通的摄像机DIY出可实现垃圾堆叠检测的AI能力,整个过程只需20分钟左右。 我们的意愿,一是让任何没有算法基础但有行业经验的用户能够DIY出端到端的AI系统解决方案的能力,二是让有算法能力但没有硬件产品的AI创业者能够基于海康的软硬件实现他们自己算法能力的输出。 人工智能产业拥有如此庞大的经济体量和市场潜力,一定会有越来越多的企业和人才加入到这个产业当中,我们希望能够通过我们的开放平台,为更多有不同需求的企业、团队及个人解决AI落地的困境。 自2017年开始上线,目前海康AI开放平台已经面向环保、餐饮、制药、物流、零售等全行业开放,积累了丰富的实用案例。 关玉娟:平台开放一年多来,您的感受和总结是什么? 浦世亮:我们认为这是AI赋能实体行业的一条非常正确的道路。当然这个过程中也经历过曲折,包括前期需要花时间对用户及市场进行教育,让社会和行业对于AI有更为客观理性的了解。同时,在没有先例可以借鉴的行业市场,一门心思扎进来探索这条路是否正确,这也是一个忐忑的过程,好在我们已经摸清楚了方向,并且坚信这是一条非常正确的路。 在面向全行业推出AI开放平台的过程中,通过各类合作伙伴的不断加入及反馈,带来各类数据的接入、标注,算法及需求也在持续丰富,整个开放平台的AI算法、编译工具、神经网络模型,软硬件产品等也都在不断演进升级,在开放平台这个庞大的载体之上,供需双方之间可以构成一个互为驱动力的良性循环。 关玉娟:海康AI开放平台可为用户提供数据、算法、训练资源及产品等一系列服务,这其中的商业模式如何设计,用户需要为哪些服务付费? 浦世亮:实际上我们没有过多就模式而模式。AI开放平台的宗旨,就是能帮助用户落地AI能力,解决实际问题。把用户服务好了,平台自然能够实现商业价值。 目前平台的SDK都是免费的,用户只需要在AI开放平台上注册成为海康威视的合作伙伴就可以享受免费SDK支持。另外,我们已经开放了并行训练系统给到合作伙伴,因此,用户也可以免费调用我们开放平台的训练资源。 我们正在思考更多样的合作形态,比如辅助合作伙伴共建某些行业领域的算法模型产品、建立算法商店等等,这些我们也正在尝试中。通过我们的努力,用户获得的收益会更大。 目前涉及到付费的服务,主要针对那些需要调用我们的云平台做一定规模或比较高频数据分析的用户,因为这个过程有大量计算资源和能耗的成本,还有就是如果要把算法部署到我们的边缘硬件产品,产品是需要收费的。 关玉娟:要真正展开应用,数据融合必不可少,推进物信融合在当前阶段是否仍存在难点? 浦世亮:物联网和信息网,这两张网之间确实仍然存在信息孤岛的问题,与此同时,信息维度和数据维度都还不够,导致相关应用无法很好的展开。我们也看到了这个问题,所以希望通过AI Cloud物信融合数据架构能够很好地促进物信两网之间的数据融合。 AI Cloud架构中设有数据资源池和计算资源池。数据资源池主要起到数据治理和数据汇聚的作用,可以将物联网和信息网的数据放到资源池进行治理和汇聚。 (编辑:52刷机网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
