独家分享！来自中兴的AI大神竞赛心得！首届CSIG图像图形技术挑战赛 “基于短视频的人脸解析比赛” 冠军队伍采访

Posted by 马达智数
2020-09-23
Updated 2:07 下午

AI竞赛，给许多业内工作者和高校学生提供了一个证明实力、磨练技能的机会。

之前我们分享了季军队伍的经验，今天我们就来听听勇夺冠军队伍的背后故事吧！

冠军队伍“AI-Jieson”由来自中兴通讯股份有限公司的张文昊、郑成建和王勃飞组成。今天马达智数小助手荣幸采访到其中郑成建和王勃飞队员（队员张文昊因工作时间冲突，未能接受采访）。现在来听听他们的见解，一起走进AI的世界，以及中兴通讯在AI领域的研发介绍！

Hanna：你们好，我是马达智数的Hanna，是本次采访主持人，欢迎AI-jieson团队的郑成建、王勃飞队员！祝贺你们在“基于短视频的人脸解析比赛“中获得冠军的好成绩。感谢你们抽出宝贵的时间接受采访，和我们分享和比赛有关的心得经验。我了解到你们来自中兴通讯股份有限公司，所以今天我也想和你们聊聊通讯领域中AI的运用。首先，为了让大家对你们有更深的了解，请做个自我介绍吧！

郑成建：您好，我叫郑成建，上海大学研究生毕业，目前在中兴通讯工作。工作的主要方向是视频图象处理，比如目标检测、目标分割，人脸识别等。

王勃飞：您好，我叫王勃飞，是华中科技大学研究生毕业，现在在中兴通讯也是做视频图像处理分析这一方面，我的工作内容跟成建是类似的。我们两个目前在公司同一个团队，就是做视频处理分析的这一块的算法。

1. Hanna：请问你们是通过什么渠道了解到我们这个比赛的？为什么参加了这个比赛？

郑成建：我们有个同事是中国图象图形学学会的会员，看到学会发的邮件了解到有这个比赛，刚好我们在团队做这方面的相关工作，所以就把这个信息分享给我们了。我们看到以后，觉得这个比赛比较有趣，就是通过算法将人脸五官等不同语义部位进行分割，可以做一些智能美妆、表情识别、卡通形象等应用。另外，正如刚才讲到的，我们做过相关领域工作，包括目标检测、图象分割等，比较契合，觉得可以把我们掌握的知识应用到这个场景试试。然后就选择参加这个比赛了。

2. Hanna：这次比赛一共有一百多支队伍参赛，你们拔得头筹，获得冠军非常难得。你们有什么获胜的秘诀可以和我们分享一下吗？有用到一些特别的方法吗？

郑成建：其实也没有什么秘诀啦，主要还是平常工作中的积累。我们一开始直接用实例分割网络对整图做迁移学习，很快就发现背景部分不够干净，会有一些误检，把背景误判为人脸某些部位，产生错误的标签。然后我们就想到先把头部检测出来，只针对检测框区域区域去做分割，这样背景就会很干净，效果立马就有提升。我们还借鉴了以前视频分割中采用的融合思路，对分割结果做简单融合处理，从而进一步提升人脸解析精度。另外，还有就是网络的训练调优技巧，队员之间相互多沟通，避免重复实验，毕竟比赛时间是比较紧的。

3. Hanna：可以和我们分享一下你们通过这次比赛有什么收获吗？对你们的工作是否有帮助？

郑成建：收获挺多的呀，首先非常感谢马达智数工作人员的辛苦组织，很开心能够参加这次竞赛并获得第一名。通过这次比赛，我们对分割网络有了进一步掌握，以前我们更多是对视频中比较大的目标，比如行人、车、动物之类进行分割，这次是对人脸不同部位更细粒度目标的分割。对我们工作还是挺有帮助的，因为可以将人脸解析成果应用到智能美妆等方面。如果让我们做人脸检测或人脸识别时候，比如可以用这个来扩增人脸数据，实验不同妆容对人脸识别的影响，对比一下美颜过后的图片，和没有美颜的图片在人脸识中有没有什么影响，这些都是挺有帮助的。

王勃飞：因为图像分割是属于视觉分析里面的一项比较基础的技术，它的应用领域是比较多的。我们团队在公司其实也是做这样的一个核心技术积累，分割这块技术在公司的比如说智能手机的美颜，视频会议系统里像现在我们用到的背景替换等这些应用，它都是能派上用场的。

4. Hanna：看来两位从比赛中收获到了很多东西。接下来我想谈谈中兴，你们在中兴工作时对AI数据的需求主要在哪个方面？中兴是否有专门数据部门？

王勃飞：数据是AI训练的前提和基础，我们对AI数据的需求主要是对各类结构化、非结构化数据的处理、大量数据的标注，形成高质量的数据来从事算法的探索，中兴有专门的大数据产品线，可以提供数据采集、数据存储、数据预处理、数据治理、数据安全、数据开发，数据对外开放等完整的大数据解决方案，在国内外有数十个局点的广泛应用。

5. Hanna：可以看出中兴在数据这方面是有很多的需求和应用。请问你们能不能和我们介绍一下中兴在AI领域的研发情况呢？

郑成建：中兴通讯对 AI保持长期持续投入，也有挺多团队在做这方面的工作。成立了Al技术专家委员会负责公司整体 AI 的技术规划，AI领域的研发人员超过 1000人，构建全方位的AI技术能力，涵盖底层Al硬件能力、AI技术框架、AI 算法、AI应用等各层次。公司也有一个统一AI大数据平台，去支持运营商、政企、终端等不同领域的应用。

还有一个统一的AI框架，我们有统一的开发和部署架构，支持主流的深度学习框架如 tensorflow、caffe，机器学习框架如 sklearn、spark ML lib，对并行计算加速、推理剪枝等关键技术进行了自研优化。

我们团队主要关注的Al算法组件：研发了大量算法，包括通信网络、音视频、自然语言处理、机器人运动等各领域。

在AI 应用方面，主要涵盖网络智能化应用、智慧行业应用、智慧终端应用等，全面服务于2B2C各类客户需求。累计申请数百件人工智能相关专利，积极构建自主知识产权，在多个国际／国内标准化及开源组织中担任重要职位，如ITU-T（国际电信联盟）ML5G 架构组主席、ETSI（欧洲通讯标准化协会）ISG ZSM项目创始成员、Linux AI基金会董事及 AdIik项目（模型优化） TSC主席，是国内外标准／开源组织的积极贡献者和参与者。

6. Hanna：你们对AI在通讯领域应用有什么看法，对其未来的展望有哪些？

郑成建：AI在通讯领域的应用有广泛的发展前景，将 AI技术引入通信网络可以为 5G 时代网络运营运维提供全新的能力，将从四个方面发挥重要作用：减少简单重复性网络操作、基于历史数据的前瞩性预防预测、高复杂性多维分析和寻求资源与业务需求的最优解。目前中兴已经规划了 60+网络AI场景，覆盖规划／建设／维护／优化／运营全业务生命周期，已经与全球运营商进行了广泛的合作，落地实践了超过 40个AI商用及试点案例。展望未来，通信网络向智能、自治方向演进是大势所趋，未来 10 年将是运营商网络智能化转型的关键时期，中兴愿意与运营商及各界合作伙伴携手努力，共同推动 AI生态的发展。

7. Hanna：感谢你们非常详尽的介绍。最后，对很多想要从事AI行业或者以及在AI行业耕耘的观众，你们有什么关于AI学习和数据标注的建议吗？

王勃飞：AI确实是近几年是非常火的一个方向。可以看到，网上也有很多这方面的一些经验分享。如果作为新人入门，我们觉得比较重要的一点就是要多动手尝试。因为“纸上得来终觉浅”。开始可以从一些简单的问题，比如说二分类、手写字的识别（做起），自己先把整个的流程打通。从开始数据的准备和构建，包括网络的搭建，以及网络的前向推理和反向传播。先通过一些简单的问题，把整个的AI深度神经网络系统的训练流程熟练地搞清楚。

在这一步的基础上，就可以结合一些自己需要解决的问题，参考网上的一些论文，或者一些开源代码再进行深入（研究），比如说搭建更复杂的网络、准备更充分的数据、以及数据的清洗、网络调优的细节，包括优化器的超参数，由浅入深。多动手、逐渐的深入，这样让自己从入门，到成为这个领域的熟手，进一步到专家。

关于数据标注这一块，我们觉得比较重要的（有）两个方面。第一个就是标注的规则。因为数据本身和业务场景或者研究内容非常相关，所以规则在开始需要定义清楚，比如到底需要标注哪一些特征。另外标注的具体的事例要指引清楚，否则不同的人在进行标注的时候，可能产生差异性。比如（对于）人脸检测的标注方案，如果规则说的不清楚，可能有的人框得大，有的人框得小，最后对整体的训练可能不是太好。

另外对于标注来说，现在比较重要的一个（方面）就是要开发出一些好的标注工具，或者从网上下载一些好的标注工具，然后进行改进，因为这也是很重要的。其实我们公司现在也很重视这一方面，数据规模大的团队有专门的大数据的半自动的一些标注平台。就是利用自己开发的工具或者是进行半自动的处理，然后再手工对结果进行修正。这样是可以（节省）很多时间，而且标注精度也更有保障。具体这一块，可能贵公司马达智数是专门处理这一业务的，可能比我们的经验更多一点。

Hanna：好的，谢谢，今天各位都分享了很多，非常开心能和各位聊天，大家对通讯领域的AI也有了更深刻的了解。再一次感谢各位专门抽时间接受采访。祝你们之后的总决赛继续取得优异成绩，期待之后和你们会有更多合作机会！再见！

独家分享！来自中兴的AI大神竞赛心得！首届CSIG图像图形技术挑战赛 “基于短视频的人脸解析比赛” 冠军队伍采访

发表回复 取消回复

发表回复取消回复