机器学习中的NLP简介

汇桔云
2019-12-25 18:03:27 10

自然语言处理（NLP）：从概念到应用

在1970年代，许多程序员开始编写“概念本体”，将现实世界的信息转化为计算机能理解的数据形式。这包括了诸如MARGIE（Schank, 1975）、SAM（Cullingford, 1978）、PAM（Wilensky, 1978）、TaleSpin（Meehan, 1976）、QUALM（Lehnert, 1977）、Politics（Carbonell, 1979）和图单元（Lehnert, 1981）等项目。此外，当时还出现了许多聊天机器人，如PARRY、Racter和Jabberwacky。

尽管自然语言处理（NLP）并不是一门新兴学科，但随着人们对人机通信兴趣的增长，以及大数据的可用性、强大的计算能力和改进的算法，该领域正在快速发展。苏格兰皇家银行利用文本分析（一种NLP技术）从客户反馈中提取关键趋势，通过分析电子邮件、调查和呼叫中心对话，找出导致客户不满的根本原因并加以改进。

人类的语言往往包含拼写错误、缩写和不完整的句子。我们在讲话时会带有口音，可能会结巴或借用其他语言的词汇。直到1980年代，大多数自然语言处理系统依赖于复杂的手写规则集。然而，随着计算能力的提升和乔姆斯基语言学理论影响力的减弱，研究开始转向统计模型，这些模型通过分配实际权重来做出概率决策。

HMM（隐马尔可夫模型）是一种常用的统计模型，它通过收听语音片段并将其与预录的语音进行比较，来确定你说的内容，并将其转换为NLP系统可用的文本形式。HMM模型通常会收听10到20毫秒的语音片段，并搜索音素（最小的语音单位）进行比较。每个NLP系统使用的具体技术略有不同，但总体上非常相似，它们试图将每个单词分解为词性（名词、动词等）。

自然语言处理（NLP）是计算机科学、人工智能、语言学和信息工程的交叉领域，主要研究计算机如何理解和处理人类语言。它包括多种任务，如语法校正、语音到文本的转换、情感分析、主题提取和命名实体识别等。

NLP的应用十分广泛，包括但不限于：

情感分析：评估社交媒体上的用户反馈，了解品牌的市场表现。
主题提取：从大量文本中提取关键主题和趋势。
命名实体识别：识别文本中的实体名称，如人名、地名等。
关系提取：识别文本中的关系和事件。
自动问答：构建系统回答用户的问题。

NLP的进步使得计算机能够更好地理解和处理人类的语言，这不仅提升了用户体验，还为企业提供了宝贵的洞察力。例如，亚马逊和Facebook利用NLP技术来跟踪用户行为和流行趋势，而银行和医疗机构则通过NLP来分析客户反馈和医疗记录。

随着深度学习和人工智能的发展，NLP技术也在不断进步。深度学习模型需要大量的标记数据进行训练，以便识别模式和关联。这些技术使得机器能够更好地理解语言的模糊性和多义性，从而在实际应用中更加可靠。

总之，自然语言处理是连接人类与机器的关键桥梁，它在提高效率、增强用户体验和推动业务发展方面发挥着重要作用。未来，随着技术的进一步发展，NLP将继续带来更多的创新和可能性。

图灵汇

责任编辑：：汇桔云

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

机器简介学习 NLP

广东音像展

2019-12-25

自然语言处理（NLP）：从概念到应用

6个你必须知道的机器学习的革命性的教训