2018年中国人工智能大会(CCAI 2018)于7月28日至29日在深圳举行。李德毅院士在开幕式上表达了对人工智能未来的极高期待,他认为未来的人工智能将为人类带来全新的启示。
中国人工智能学会副理事长、中科院院士谭铁牛在开幕式上强调,理性务实的态度将是未来人工智能的关键路线。他希望参会者能从本次大会中获得丰富的视听体验和深刻的见解。
在2018年中国人工智能大会的首日午后,苏州大学特聘教授、国家杰出青年科学基金获得者张民进行了名为《自然语言处理方法与应用》的主题演讲。这场持续两小时的讲座涵盖了AI、自然语言处理(NLP)及相关方法、应用和前景,张民教授详细介绍了自然语言处理的研究成果。
从农业社会到信息社会,从数据到信息再到知识和智能的演变,体现了人类社会的巨大进步。数据是对现实世界的抽象描述,信息是具有价值的数据流,知识则是信息提炼的结果。智能是指用知识解决问题的能力。人工智能的发展经历了人们对它的恐惧和顿悟,张民教授认为不应过分夸大其影响。
人工智能的外延包括机器人和智能系统,而其内涵则包含四个方面: 1. 脑认知基础和知识建模; 2. 感知智能,即机器感知和模式识别; 3. 认知智能,即自然语言处理和理解。
人类之所以能成为食物链顶端,是因为我们拥有语言。语言是一种符号系统,自然语言是人类沟通的主要工具。自然语言处理就是利用计算机处理人类自然语言的技术,其关键在于分析、理解和生成语言。
自然语言处理面临诸多挑战,包括语言的歧义性、结构复杂性以及语境的影响等。这些因素使得自然语言处理非常困难。
张民教授将自然语言处理分为外延和内涵两部分。外延指的是其实际应用,而内涵则包括自然语言分析、生成和多语言处理等内容。
分词任务是将输入的句子转换成词语序列。目前主流的方法包括CRF和BILSTM-CRF。存在的挑战包括交叉歧义、新词识别等问题。
当前主流方法包括规则系统和机器学习方法。新领域中的实体识别仍然是一个挑战,需要利用各种机器学习方法来解决。
句法分析的目标是将词语序列转换成句子结构。目前常用的方法包括基于图的方法和基于转移的方法,现在还加入了深度学习方法。
语义分析的目标是将文本转换为可计算的知识表示。目前的学术研究包括浅层语义分析、逻辑语义分析和抽象语义表示分析等方法。
篇章分析涉及篇章结构和特征的研究,包括逻辑结构、指代结构、话题结构等。基本特征包括连接性、连贯性、意图等。
自然语言生成方法包括基于规则、基于知识的检索和基于深度学习的方法。每种方法各有优劣,适用于不同的场景。
自然语言处理的应用广泛,包括问答、对话、机器翻译、信息抽取、情感分析等。自然语言处理也在教育、医疗、司法等领域得到了广泛应用。
情感和情绪分析是自然语言处理的重要应用之一,包括问题驱动和模型驱动两个方面。
问答系统需要解决的问题包括问题分类、答案匹配和生成。其中,开放域问答面临数据量、知识库和多模态场景等挑战。
对话系统根据应用场景可分为开放域和封闭域。高精度的上下文建模、对话状态转移模型和领域知识建模是对话系统的核心问题。
知识图谱构建包括实体识别、事件抽取、知识推理等任务。知识图谱是当前学术界和产业界的热点研究领域。
机器翻译已经取得了显著进展,未来将从词序列到语义再到知识进行扩展,同时需要适应产业化的需求。
张民教授认为,目前自然语言处理正处于最佳的发展时机。他表示,自然语言处理在未来将更加关注表示、搜索、推理和学习等方面。同时,他也强调了科学问题的凝练、研究框架的建立以及产学研的结合。
希望通过这些改写,您可以在网站上更好地呈现这些内容。