独家分享!来自中兴的AI大神竞赛心得!首届CSIG图像图形技术挑战赛 “基于短视频的人脸解析比赛” 冠军队伍采访

  • Posted by 马达智数
  • 2020-09-23
  • Updated 2:07 下午

AI竞赛,给许多业内工作者和高校学生提供了一个证明实力、磨练技能的机会。

之前我们分享了季军队伍的经验,今天我们就来听听勇夺冠军队伍的背后故事吧!

冠军队伍“AI-Jieson”由来自中兴通讯股份有限公司的张文昊、郑成建和王勃飞组成。今天马达智数小助手荣幸采访到其中郑成建和王勃飞队员(队员张文昊因工作时间冲突,未能接受采访)。现在来听听他们的见解,一起走进AI的世界,以及中兴通讯在AI领域的研发介绍!

Hanna:你们好,我是马达智数的Hanna,是本次采访主持人,欢迎AI-jieson团队的郑成建、王勃飞队员!祝贺你们在“基于短视频的人脸解析比赛“中获得冠军的好成绩。感谢你们抽出宝贵的时间接受采访,和我们分享和比赛有关的心得经验。我了解到你们来自中兴通讯股份有限公司,所以今天我也想和你们聊聊通讯领域中AI的运用。首先,为了让大家对你们有更深的了解,请做个自我介绍吧!

郑成建:您好,我叫郑成建,上海大学研究生毕业,目前在中兴通讯工作。工作的主要方向是视频图象处理,比如目标检测、目标分割,人脸识别等。

王勃飞:您好,我叫王勃飞,是华中科技大学研究生毕业,现在在中兴通讯也是做视频图像处理分析这一方面,我的工作内容跟成建是类似的。我们两个目前在公司同一个团队,就是做视频处理分析的这一块的算法。

1. Hanna:请问你们是通过什么渠道了解到我们这个比赛的?为什么参加了这个比赛? 

郑成建:我们有个同事是中国图象图形学学会的会员,看到学会发的邮件了解到有这个比赛,刚好我们在团队做这方面的相关工作,所以就把这个信息分享给我们了。我们看到以后,觉得这个比赛比较有趣,就是通过算法将人脸五官等不同语义部位进行分割,可以做一些智能美妆、表情识别、卡通形象等应用。另外,正如刚才讲到的,我们做过相关领域工作,包括目标检测、图象分割等,比较契合,觉得可以把我们掌握的知识应用到这个场景试试。然后就选择参加这个比赛了。

2. Hanna:这次比赛一共有一百多支队伍参赛,你们拔得头筹,获得冠军非常难得。你们有什么获胜的秘诀可以和我们分享一下吗?有用到一些特别的方法吗? 

郑成建:其实也没有什么秘诀啦,主要还是平常工作中的积累。我们一开始直接用实例分割网络对整图做迁移学习,很快就发现背景部分不够干净,会有一些误检,把背景误判为人脸某些部位,产生错误的标签。然后我们就想到先把头部检测出来,只针对检测框区域区域去做分割,这样背景就会很干净,效果立马就有提升。我们还借鉴了以前视频分割中采用的融合思路,对分割结果做简单融合处理,从而进一步提升人脸解析精度。另外,还有就是网络的训练调优技巧,队员之间相互多沟通,避免重复实验,毕竟比赛时间是比较紧的。

3. Hanna:可以和我们分享一下你们通过这次比赛有什么收获吗?对你们的工作是否有帮助?

郑成建:收获挺多的呀,首先非常感谢马达智数工作人员的辛苦组织,很开心能够参加这次竞赛并获得第一名。通过这次比赛,我们对分割网络有了进一步掌握,以前我们更多是对视频中比较大的目标,比如行人、车、动物之类进行分割,这次是对人脸不同部位更细粒度目标的分割。对我们工作还是挺有帮助的,因为可以将人脸解析成果应用到智能美妆等方面。如果让我们做人脸检测或人脸识别时候,比如可以用这个来扩增人脸数据,实验不同妆容对人脸识别的影响,对比一下美颜过后的图片,和没有美颜的图片在人脸识中有没有什么影响,这些都是挺有帮助的。

王勃飞:因为图像分割是属于视觉分析里面的一项比较基础的技术,它的应用领域是比较多的。我们团队在公司其实也是做这样的一个核心技术积累,分割这块技术在公司的比如说智能手机的美颜,视频会议系统里像现在我们用到的背景替换等这些应用,它都是能派上用场的。

4. Hanna:看来两位从比赛中收获到了很多东西。接下来我想谈谈中兴,你们在中兴工作时对AI数据的需求主要在哪个方面?中兴是否有专门数据部门?

王勃飞:数据是AI训练的前提和基础,我们对AI数据的需求主要是对各类结构化、非结构化数据的处理、大量数据的标注,形成高质量的数据来从事算法的探索,中兴有专门的大数据产品线,可以提供数据采集、数据存储、数据预处理、数据治理、数据安全、数据开发,数据对外开放等完整的大数据解决方案,在国内外有数十个局点的广泛应用。

5. Hanna:可以看出中兴在数据这方面是有很多的需求和应用。请问你们能不能和我们介绍一下中兴在AI领域的研发情况呢? 

郑成建:中兴通讯对 AI保持长期持续投入,也有挺多团队在做这方面的工作。成立了Al技术专家委员会负责公司整体 AI 的技术规划,AI领域的研发人员超过 1000人,构建全方位的AI技术能力,涵盖底层Al硬件能力、AI技术框架、AI 算法、AI应用等各层次。公司也有一个统一AI大数据平台,去支持运营商、政企、终端等不同领域的应用。

还有一个统一的AI框架,我们有统一的开发和部署架构,支持主流的深度学习框架如 tensorflow、caffe,机器学习框架如 sklearn、spark ML lib,对并行计算加速、推理剪枝等关键技术进行了自研优化。

我们团队主要关注的Al算法组件:研发了大量算法,包括通信网络、音视频、自然语言处理、机器人运动等各领域。

在AI 应用方面,主要涵盖网络智能化应用、智慧行业应用、智慧终端应用等,全面服务于2B2C各类客户需求。累计申请数百件人工智能相关专利,积极构建自主知识产权,在多个国际/国内标准化及开源组织中担任重要职位,如ITU-T(国际电信联盟)ML5G 架构组主席、ETSI(欧洲通讯标准化协会)ISG ZSM项目创始成员、Linux AI基金会董事及 AdIik项目(模型优化) TSC主席,是国内外标准/开源组织的积极贡献者和参与者。

6. Hanna:你们对AI在通讯领域应用有什么看法,对其未来的展望有哪些?

郑成建:AI在通讯领域的应用有广泛的发展前景,将 AI技术引入通信网络可以为 5G 时代网络运营运维提供全新的能力,将从四个方面发挥重要作用:减少简单重复性网络操作、基于历史数据的前瞩性预防预测、高复杂性多维分析和寻求资源与业务需求的最优解。目前中兴已经规划了 60+网络AI场景,覆盖规划/建设/维护/优化/运营全业务生命周期,已经与全球运营商进行了广泛的合作,落地实践了超过 40个AI商用及试点案例。展望未来,通信网络向智能、自治方向演进是大势所趋,未来 10 年将是运营商网络智能化转型的关键时期,中兴愿意与运营商及各界合作伙伴携手努力,共同推动 AI生态的发展。

7. Hanna:感谢你们非常详尽的介绍。最后,对很多想要从事AI行业或者以及在AI行业耕耘的观众,你们有什么关于AI学习和数据标注的建议吗? 

王勃飞:AI确实是近几年是非常火的一个方向。可以看到,网上也有很多这方面的一些经验分享。如果作为新人入门,我们觉得比较重要的一点就是要多动手尝试。因为“纸上得来终觉浅”。开始可以从一些简单的问题,比如说二分类、手写字的识别(做起),自己先把整个的流程打通。从开始数据的准备和构建,包括网络的搭建,以及网络的前向推理和反向传播。先通过一些简单的问题,把整个的AI深度神经网络系统的训练流程熟练地搞清楚。

在这一步的基础上,就可以结合一些自己需要解决的问题,参考网上的一些论文,或者一些开源代码再进行深入(研究),比如说搭建更复杂的网络、准备更充分的数据、以及数据的清洗、网络调优的细节,包括优化器的超参数,由浅入深。多动手、逐渐的深入,这样让自己从入门,到成为这个领域的熟手,进一步到专家。

关于数据标注这一块,我们觉得比较重要的(有)两个方面。第一个就是标注的规则。因为数据本身和业务场景或者研究内容非常相关,所以规则在开始需要定义清楚,比如到底需要标注哪一些特征。另外标注的具体的事例要指引清楚,否则不同的人在进行标注的时候,可能产生差异性。比如(对于)人脸检测的标注方案,如果规则说的不清楚,可能有的人框得大,有的人框得小,最后对整体的训练可能不是太好。

另外对于标注来说,现在比较重要的一个(方面)就是要开发出一些好的标注工具,或者从网上下载一些好的标注工具,然后进行改进,因为这也是很重要的。其实我们公司现在也很重视这一方面,数据规模大的团队有专门的大数据的半自动的一些标注平台。就是利用自己开发的工具或者是进行半自动的处理,然后再手工对结果进行修正。这样是可以(节省)很多时间,而且标注精度也更有保障。具体这一块,可能贵公司马达智数是专门处理这一业务的,可能比我们的经验更多一点。

Hanna:好的,谢谢,今天各位都分享了很多,非常开心能和各位聊天,大家对通讯领域的AI也有了更深刻的了解。再一次感谢各位专门抽时间接受采访。祝你们之后的总决赛继续取得优异成绩,期待之后和你们会有更多合作机会!再见!

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

【活动介绍】 2021极市计算机视觉开发
CVPR2021视频会议背景分割挑战赛(
由Person In Contex和马达