杨敏:深耕自然语言处理架起与机器沟通的桥梁
作者头像
  • 核舟酷家
  • 2022-06-08 12:40:19 14

在CCF-A类学术会议上和JCR一区期刊上发表了80多篇高水平学术论文,荣获了中国人工智能学会2018年度最佳青年科技成果奖、2019年度CCF-腾讯犀牛鸟基金优秀专利奖,成为中国科学院青年创新促进会的一员。这份耀眼的履历属于“90后”杨敏,她来自天府之国,对自然语言处理技术充满热情。在香港大学攻读完计算机科学博士学位后,她加入了中国科学院深圳先进技术研究院数字所,开启了自己的科研生涯,目前担任副研究员兼博士生导师。

为何选择专注于人工智能领域?杨敏表示,兴趣与热爱是她最大的驱动力。“数据挖掘研究非常吸引人,因为从大量数据中可以挖掘出有用且令人兴奋的信息。”她也十分看好人工智能技术的发展前景,认为随着人们对便捷生活的追求日益增加,人工智能将在其中扮演关键角色。

让机器理解人类语言

近年来,随着智能技术的普及,机器人逐渐取代人工成为客户服务的主要力量。然而,在“人机对话”中,经常会出现程序复杂、无法准确回应的情况。如何使智能客服更好地理解人类的真实需求?如何更快、更精准地反馈问题的答案?这些都是自然语言处理技术需要解决的问题。

“让智能问答达到人类问答的水平是非常困难的。”杨敏说,“目前我们仍处于弱人工智能时代,需要突破认知智能,才能让机器真正理解问题、进行推理并解决问题,这还需要一段时间的努力。”

为了使机器能够理解人类的语言,杨敏团队尝试根据人类的行为设计深度神经网络模型。“例如,人类在阅读一篇文章时,通常会先粗略浏览全文,然后带着问题仔细阅读寻找答案,最后确认答案的准确性。”杨敏团队从人类阅读认知的角度出发,模拟人类阅读认知过程中的预读、精读、后读三个阶段,提出了基于先验知识的交互感知模型、目标感知的语义蒸馏模型以及基于强化学习的语义反馈模型,以更接近人类阅读认知的方式解决自然语言理解问题。

知识图谱:为机器“补课”

当然,人工智能也有其独特的优势,强大的计算能力和海量的数据使机器能够迅速获取学习资源,但仅有大数据是远远不够的。

“虽然通过大数据分析可以获得许多有用的信息,但单靠数据驱动是不够的,人类之所以能够迅速做出决策,是因为具备丰富的经验和背景知识。”杨敏表示,她们团队尝试结合数据驱动和知识驱动的方法,通过构建完善的知识图谱,弥补人工智能在背景知识上的不足。

此外,模型压缩也是杨敏团队重点关注的技术方向。当模型训练强度加大、数据量增多、精度提高时,计算资源的消耗也会相应增加。特别是在线上运行时,过于复杂的模型会导致反馈结果的时间从毫秒级延长至秒级,从而影响用户体验。

“通过模型压缩,可以在不影响运算精度的前提下,减少参数数量,提高效率,节省训练时间,并降低对数据的需求,从而提升用户体验。”杨敏介绍说,团队目前正在与腾讯、神州泰岳等企业合作进行模型压缩的研究,主要应用于自然语言理解和推荐系统任务。

法律领域的应用

在应用落地方面,杨敏团队与深圳市得理科技有限公司共同成立了“法律人工智能联合实验室”,将自然语言处理和推荐系统的核心算法应用于司法领域,开发了案件判决预测、类案智能搜索和法律智能问答等系统。

为科技之城贡献力量

在加入深圳先进院前,杨敏曾在科技企业工作过一段时间,她觉得科研机构与企业的最大区别在于科研机构能够深入研究一些具有挑战性和研究价值的课题,即使短期内看不到成果,也能投入更多时间和精力专注攻克难题,期望取得突破性进展。

不仅如此,深圳先进院对产学研融合的大力支持也让杨敏感到,她能够真正将基础研究成果应用于实际,打破技术壁垒,快速找到产业界的合作伙伴,验证算法的实用性。

在深圳工作的三年里,杨敏深刻感受到这座城市的魅力。“科研和技术公司非常多,对我们寻找产业合作伙伴和学生寻找实习机会都非常有利。同时,深圳出台了许多吸引高端人才的政策,汇聚了全球顶尖人才,形成了良性循环,对我们年轻人来说极具吸引力。”(刁雯蕙)

    本文来源:图灵汇
责任编辑: : 核舟酷家
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
杨敏自然语言深耕架起桥梁沟通机器处理
    下一篇