虽然很多人已经听说过“人工智能”、“机器学习”和“深度学习”这样的流行词汇,但大多数人认为这些都是高深莫测的技术。如果你现在询问那些在人工智能领域内有所建树的人士,关于如何进入或转型到这一领域需要做哪些准备,他们可能会告诉你: - 必须具备扎实的线性代数基础,并深入了解神经网络的理论知识。 - 要有良好的数理统计和概率论基础,深入理解机器学习的实际应用。 - 最好拥有博士学位,至少也是研究生学历。 - 至少有十年以上的编程或机器学习开发经验。
过去,人们普遍认为从事IT工作需要极高的技术门槛。然而,如今中国的互联网从业人员已经超过1600万。许多从事互联网或科技行业的人员,即使对操作系统内存寻址方法、TCP/IP三次握手协议等不太熟悉,也不影响他们在行业内取得成功。同样地,人工智能也并非遥不可及。
了解机器学习的基本理念,利用现成的工具包进行简单的实践,逐步培养兴趣,然后根据实际需求研究相关理论,就能成为一名合格的人工智能从业者。
因此,我的目标是告诉大家,即使是像我这样的新手,也可以通过使用如TensorFlow.Keras等易于上手的工具,轻松接触看似高深的深度学习。
即便如此,我相信非专业人士也能学会机器学习。
接下来,我要尝试一个非常有趣的任务——模仿海子的风格写诗。
这样做有几个原因: - 海子已经去世,无法创作新的作品。 - 这件事听起来很高端,充满科技感。 - 完成后会很有成就感,甚至可以用来“装逼”。 - 最重要的是,即使最终效果不尽如人意,但诗歌的质量并不重要。
很多人对这三个概念感到困惑,因为它们经常被混淆。从严格的学术角度来看: - 人工智能是一个广泛的领域,包括各种智能系统。 - 机器学习是人工智能的一个分支,专注于让机器从数据中学习。 - 深度学习则是机器学习的一种方法,通过多层神经网络处理复杂任务。
而在实际应用中,深度学习因其高效的性能而被广泛采用,因此许多人将其视为人工智能的代名词。
这项任务分为三个步骤:
首先,我们需要将中文诗歌转换成机器可以处理的数字格式。这里我们采用一种称为“独热编码”的技术,即为每个汉字分配一个唯一的数字,然后将这些数字转换成二进制向量。这种方法简单且不需要复杂的文本处理工具。
传统的编程方法需要人为设定规则,例如:“面朝大海”后面必须是“春暖花开”。而机器学习的方法则不同,它通过大量的数据训练来预测下一个可能的字。
我们采用LSTM模型(长短期记忆网络),这是一种特殊的循环神经网络,能够处理序列数据。通过大量数据训练,机器可以学会预测下一个最有可能出现的字。
在机器学习的过程中,我们不仅可以让机器预测下一个最有可能出现的字,还可以通过一些随机因素,让机器写出带有创意的新诗句。
尽管我没有专业的语言学知识,但通过这种方式,即使结果不尽如人意,也能带来一些惊喜。
让我们来看看机器生成的诗句: - 第一首诗 - 第二首诗
尽管这些诗句显得有些荒诞不经,但整个过程并不需要复杂的语言学知识或高级的编程技巧,只需要几十行代码即可完成。
希望通过这种方式,能够消除大家对机器学习的恐惧,让大家一起参与进来,享受其中的乐趣。
我叫黎晨,英文名LC,是我中文拼音的简称,并非LV品牌。性别男,守法公民,无不良记录。很多朋友说我是个“死变态”,所以我大部分时间都宅在家里。
如果想了解更多完整代码,建议参考Keras创始人编写的一段示例代码。
本文思路完全模仿了他的示例,只不过我使用的是中文,而他用的是英文。