机器学习“剧透”大结局:三傻最先领盒饭,龙妈、小恶魔笑到最后
作者头像
  • 丁伯洋
  • 2019-04-15 14:45:29 1

千呼万唤,权力的游戏最终季终于来了!和众多粉丝一样,我整个上午都在紧张地浏览社交媒体,生怕错过任何剧透。然而,没想到的是,我还是“被”看到了大结局,而这次剧透竟然是来自一个算法。

这波最强剧透来自慕尼黑工业大学。在最终季开播前,该校计算机科学的学生们接到一项特殊的任务:利用机器学习预测谁最有可能登上铁王座。

这个有趣的项目采用了名为“生存机会算法”的技术。具体而言,这个算法通过分析寿命数据得出预测结果。这种研究方法在医学领域已有广泛应用,例如评估治疗方案对癌症患者的影响。

事实上,生存机会算法是慕尼黑工业大学每学期JavaScript研讨课的一部分,这项课题激发了一届又一届学生的兴趣。他们开发了一个应用程序,运用人工智能算法来计算每个角色的死亡概率。早在2016年,第六季开播前,学生们就成功预测了Snow的复活。

那么,这个强大的算法对最终季的大结局做出了怎样的预测呢?

根据算法,丹妮莉丝·塔格利安(龙妈)生存的概率最高,达到99%,而提利昂·兰尼斯特(小恶魔)也有97%的存活率。

以下是存活率排名一览:

  • 波隆和魔山的死亡概率最高。
  • 被预言最长寿的“三傻”(Sansa Stark)的死亡概率也高达73%。

最强剧透是如何实现的?

简单来说,算法通过对原著和已播剧集中的角色特征进行数据分析来做出预测。比如Sansa的例子,分析了她的角色背景、性别、年龄、婚姻状况等因素。

在维斯特洛大陆,贵族通常比平民活得更久,女性角色也比男性角色更长寿。Sansa经历了从北境之王的女儿到最屈辱的贵族小姐,再到临冬城女爵的过程。她的主角光环使她的死亡概率降低了16%。

此外,出身于显赫家族也会延长寿命。史塔克家族的孩子们尽管历经磨难,但除了“少狼主”外都存活了下来。Sansa最终能撑到第八季,但预测她高达73%的死亡概率仍令人期待。

完整的人物名单及生存概率可以在以下网站获取:https://got.show

“算法”与“数据”之歌

据授课教师Burkhard Rost介绍,虽然对权力的游戏人物生存率的预测只是“幻想”数据,但这种研究方法早已应用于现实世界,并对我们的日常生活产生了巨大影响。类似的算法也可用于金融和医疗领域。

数据提取方面,最好的来源是关于《权力的游戏》的维基百科介绍。除了角色的生死状态,还需要提取其他角色特征。

贝叶斯生存分析模型采用贝叶斯推断方法,假设每个角色都有一定的死亡概率。综合考虑各种因素,可以建立一个生存函数。例如,乔恩·雪诺活到60岁的概率是45%,而杰米·兰尼斯特被认为有60%的几率能活到第八季。

使用PyMC3封装的MCMC模拟来训练模型,选择了家庭、爱人、婚姻、地位、主角/配角、性别、神经网络等特征进行分析。

Keras建模

慕尼黑的学生们使用Python的Keras建立了模型。这是一个简单的前馈神经网络,输入值是一个任意维度的实值向量,经过隐藏层处理后输出也是一个数字向量。为了将复杂信息转化为向量,一些信息被编码为标量,另一些则被编码为一组预定义值。

一般情况下,“年龄大小”仍然是导致角色死亡的主要因素。因此,角色当前年龄作为输入的一部分。神经网络输入将“存活概率”确定为0到1之间的数字,从而为单个角色创建约90个不同的输入向量。例如,可能的年龄就会有一个向量表示。如果该角色在该年龄仍然存活,神经网络将为该输入向量预测1.0,否则为0.0。

总的来说,通过训练和验证,算法在原著维基百科中的角色预测准确率达到88.75%,验证准确率为89.92%。从剧集维基百科提取的角色预测准确率为79.64%,验证准确率为85.69%。

    本文来源:图灵汇
责任编辑: : 丁伯洋
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
盒饭最先恶魔结局机器最后学习龙妈、
    下一篇