机器之心报道:
在自然语言处理领域,EMNLP(Conference on Empirical Methods in Natural Language Processing)是顶尖的学术会议之一。EMNLP 2017于2017年9月7日至9月11日在丹麦哥本哈根举行,共收录了323篇论文,其中包括216篇长论文和107篇短论文。此次会议揭晓了最佳论文奖,涵盖最佳长论文、最佳短论文和最佳资源论文三大类别。
8月16日,由中国中文信息学会青年工作委员会和搜狗搜索联合举办的“自然语言处理前沿技术研讨会暨EMNLP 2017论文报告会”在中国科学院软件研究所成功举行。报告会邀请了部分入选论文的作者介绍他们的研究成果,探讨自然语言处理领域的前沿技术。
来自中科院、清华大学、北京大学和哈尔滨工业大学等科研机构和高校的研究人员、教师和学生分享并展示了他们的论文。整个报告会分为四个部分:文本摘要与情感分析、机器翻译、信息抽取与自动问答、文本分析与表示学习。演讲者与听众之间进行了良好的互动,共同探讨了自然语言处理领域的新技术。
会议期间,最佳论文奖揭晓。以下是获奖论文的简要介绍:
最佳长论文:
Men Also Like Shopping: Reducing Gender Bias Amplification Using Corpus-Level Constraints
- 作者:Jieyu Zhao、Tianlu Wang、Mark Yatskar、Vicente Ordonez 和 Kai-Wei Chang
- 地址:https://arxiv.org/abs/1707.09457
- 摘要:本文研究了多标签目标分类和视觉语义角色标注相关的数据集和模型中存在的性别偏见问题。研究发现,数据集中存在显著的性别偏见,而在这些数据集上训练的模型会进一步放大这些偏见。论文提出了一种基于拉格朗日松弛算法的语料库级约束方法,以减少模型中的偏见放大现象。
Depression and Self-Harm Risk Assessment in Online Forums
- 作者:Andrew Yates, Arman Cohan 和 Nazli Goharian
- 地址:未提供
最佳短论文:
- Natural Language Does Not Emerge ‘Naturally’ in Multi-Agent Dialog
- 作者:Satwik Kottur, José Moura, Stefan Lee 和 Dhruv Batra
- 地址:https://arxiv.org/abs/1706.08502
- 摘要:本文通过实验发现,即使在无人类干预的情况下,智能体之间的交流也可能产生有效的语言,但这些语言往往难以被人类翻译或理解。实验结果表明,自然语言并不是“自然”形成的。
最佳资源论文:
- Bringing Structure into Summaries: Crowdsourcing a Benchmark Corpus of Concept Maps
- 作者:Tobias Falke 和 Iryna Gurevych
- 地址:https://arxiv.org/abs/1704.04452
- 摘要:本文介绍了一种利用概念图生成多文档摘要的方法。为了评估这种方法的有效性,研究团队创建了一个全新的概念图语料库,涵盖了不同教育主题的异质网页文档集。该语料库采用众包方式创建,有助于确定大型文档集中的关键信息。
此外,在会上还展示了其他精彩论文,包括多模态摘要、情感词典构建以及神经机器翻译等方面的研究成果。这些研究不仅推动了自然语言处理技术的发展,也为实际应用提供了更多可能性。