苏轼曾自嘲道:“问汝平生功业,黄州惠州儋州。”然而,对于苏轼的一生,单凭文字很难完全理解他的颠沛流离。不过,借助《唐宋文学编年地图》,人们可以通过一张中国地图,直观地看到苏轼一生的足迹。
2017年3月,由中南民族大学文学与新闻传播学院教授王兆鹏牵头开发的《唐宋文学编年地图》正式上线。这款产品不仅能让用户查询唐宋时期某位诗人的一生行踪和作品,还能显示某个地方曾接纳过的所有诗人。这一创新改变了传统的文字阅读模式,以直观生动的地图形式呈现,一经推出便受到了广泛关注。最初上线的两天,点击量就超过了220万次。那么,《唐宋文学编年地图》为何会如此受欢迎?新版本又有哪些改进?为此,记者进行了采访。
王兆鹏教授早年在撰写博士论文时,就开始思考能否利用统计学方法解读唐诗宋词,并进行定量分析。当时没有计算机,他只能依靠人工录入数据。多年以来,王兆鹏一直致力于利用大数据解读唐诗宋词,而非一时兴起。他曾出版过《唐诗排行榜》,该书采用统计学方法,列出了唐诗前100名,其中崔颢的《黄鹤楼》位列榜首。
“许多人不理解这种做法,认为‘文无第一’,诗歌怎么可以排名呢?实际上,这本书主要还原了文学评价的历史情境。哪些诗被历代文人提及最多、引用最多、编入选本,都是有迹可循的。排行榜是基于数据得出的结论,并非对一首诗价值的评判,而是对其影响力的一种评价。”
这本书启发了王兆鹏:诗歌不仅可以纸上诵读,还可以借助大数据,还原历史场景,从而进行一种全新的读诗方式。“名诗是一棵棵树,而还原历史,则是重现那片森林。”
随后,王兆鹏带领学生与搜韵公司合作,历时五年,开发出了《唐宋文学编年地图》。这款产品一经上线就广受好评。至今,他们仍在不断维护和更新数据,因为唐宋文学的数据量庞大,需要不断更新。
尽管《唐宋文学编年地图》反响良好,但也收到一些反馈,例如页面卡顿、界面单一等问题。除了改善用户体验,王兆鹏还有更多想法。
“比如一句‘江流天地外,山色有无中’,今天读来觉得很美,但如果身临其境,就能发现风景确实与诗人描述的一致。这不仅能让人更深刻地理解诗句,还能更好地欣赏风景。因此,我希望改进后的地图可以提供‘全景式’呈现唐诗宋词的功能。例如,在地图上点击一首诗,除了文字信息,还能弹出场景画面,重现诗人创作时所见的自然景观。”
为了实现这一目标,王兆鹏和他的团队与多家数据公司合作,不断改进。王兆鹏在采访中频繁提及编程术语,显示出他对技术的熟悉。“我研究古典文学,但从不排斥技术。当今的技术手段可以极大地丰富我们对传统文学的解读方式,古典文学的研究者应多了解新的信息技术。现在技术进步很快,没有什么做不到,只有想不到。了解技术的逻辑,会给我们的研究视野带来极大拓展。”
预计2019年年中,新版《唐宋文学编年地图》将上线。新版本将更多面向大众,优化普通用户的使用体验。王兆鹏表示:“这是一个尊重市场规律的产品,注重用户体验。古典文学不仅是一种读物,也可以成为充满科技感和现代感的产品。”
目前,王兆鹏最关心的问题之一是数据安全。“如何避免他人入侵我们的数据库、窃取我们的整理成果,我们投入了大量精力来解决这个问题。整理一个数据库的工作量很大,但被他人盗取却很容易。”
王兆鹏采取了多种技术手段来保护数据安全。他强调:“安全”是他和他的团队经常提到的一个关键词。
正是在提升数据库安全性的过程中,王兆鹏认识到掌握数据库自主权的重要性。“现在许多数据库的所有权在国外,包括中国文献的数据库也是如此。当前的学术研究中,谁掌握了数据库,谁就拥有学术自主权,别人可以定义你的文献价值和学术方向。我在整理数据的过程中,深刻感受到我们在数据库建设方面的不足,甚至是中国古典文学领域,很多数据库都在国外。”
王兆鹏希望通过梳理文学地图的契机,打造一个详尽、全面且具有学术价值的数据库。“因为我多年来一直利用定量分析方法研究古典文学,心中一直有一个愿望,那就是做出一个优质、属于中国人的数据库,争取学术自主权。”