千呼万唤,权力的游戏最终季终于来了!和众多粉丝一样,我整个上午都在紧张地浏览社交媒体,生怕错过任何剧透。然而,没想到的是,我还是“被”看到了大结局,而这次剧透竟然是来自一个算法。
这波最强剧透来自慕尼黑工业大学。在最终季开播前,该校计算机科学的学生们接到一项特殊的任务:利用机器学习预测谁最有可能登上铁王座。
这个有趣的项目采用了名为“生存机会算法”的技术。具体而言,这个算法通过分析寿命数据得出预测结果。这种研究方法在医学领域已有广泛应用,例如评估治疗方案对癌症患者的影响。
事实上,生存机会算法是慕尼黑工业大学每学期JavaScript研讨课的一部分,这项课题激发了一届又一届学生的兴趣。他们开发了一个应用程序,运用人工智能算法来计算每个角色的死亡概率。早在2016年,第六季开播前,学生们就成功预测了Snow的复活。
那么,这个强大的算法对最终季的大结局做出了怎样的预测呢?
根据算法,丹妮莉丝·塔格利安(龙妈)生存的概率最高,达到99%,而提利昂·兰尼斯特(小恶魔)也有97%的存活率。
以下是存活率排名一览:
最强剧透是如何实现的?
简单来说,算法通过对原著和已播剧集中的角色特征进行数据分析来做出预测。比如Sansa的例子,分析了她的角色背景、性别、年龄、婚姻状况等因素。
在维斯特洛大陆,贵族通常比平民活得更久,女性角色也比男性角色更长寿。Sansa经历了从北境之王的女儿到最屈辱的贵族小姐,再到临冬城女爵的过程。她的主角光环使她的死亡概率降低了16%。
此外,出身于显赫家族也会延长寿命。史塔克家族的孩子们尽管历经磨难,但除了“少狼主”外都存活了下来。Sansa最终能撑到第八季,但预测她高达73%的死亡概率仍令人期待。
完整的人物名单及生存概率可以在以下网站获取:https://got.show
“算法”与“数据”之歌
据授课教师Burkhard Rost介绍,虽然对权力的游戏人物生存率的预测只是“幻想”数据,但这种研究方法早已应用于现实世界,并对我们的日常生活产生了巨大影响。类似的算法也可用于金融和医疗领域。
数据提取方面,最好的来源是关于《权力的游戏》的维基百科介绍。除了角色的生死状态,还需要提取其他角色特征。
贝叶斯生存分析模型采用贝叶斯推断方法,假设每个角色都有一定的死亡概率。综合考虑各种因素,可以建立一个生存函数。例如,乔恩·雪诺活到60岁的概率是45%,而杰米·兰尼斯特被认为有60%的几率能活到第八季。
使用PyMC3封装的MCMC模拟来训练模型,选择了家庭、爱人、婚姻、地位、主角/配角、性别、神经网络等特征进行分析。
Keras建模
慕尼黑的学生们使用Python的Keras建立了模型。这是一个简单的前馈神经网络,输入值是一个任意维度的实值向量,经过隐藏层处理后输出也是一个数字向量。为了将复杂信息转化为向量,一些信息被编码为标量,另一些则被编码为一组预定义值。
一般情况下,“年龄大小”仍然是导致角色死亡的主要因素。因此,角色当前年龄作为输入的一部分。神经网络输入将“存活概率”确定为0到1之间的数字,从而为单个角色创建约90个不同的输入向量。例如,可能的年龄就会有一个向量表示。如果该角色在该年龄仍然存活,神经网络将为该输入向量预测1.0,否则为0.0。
总的来说,通过训练和验证,算法在原著维基百科中的角色预测准确率达到88.75%,验证准确率为89.92%。从剧集维基百科提取的角色预测准确率为79.64%,验证准确率为85.69%。