中转学界最前沿!机器学习成果主站助你永不掉队
作者头像
  • 在前线
  • 2020-06-14 20:43:13 4

机器学习领域近年来取得了飞速的发展,相关论文数量呈指数级增长,平均每15分钟就有一篇新论文发布。这种快速发展也带来了新的挑战:如何从海量的文献中筛选出有价值的信息,确保获取最新的知识?

为了解决这个问题,有一个机器学习成果平台致力于汇集所有的机器学习成果,方便用户及时掌握最新进展。这个平台不仅对研究人员、工程师和爱好者有益,还能促进整个领域的进步和发展。

去年,该平台推出了排行榜功能,以机器可读的格式和免费许可证,整合所有发布的机器学习成果。成千上万的贡献者添加了他们的研究成果,使得该平台成为了全球最大的机器学习成果数据库。

以下是平台最近的一些更新:

新成果界面

用户对排行榜功能的一个主要需求是能够清晰地了解论文中的成果来源。为此,平台推出了一种新的成果界面,可以直接链接到arXiv论文中的原始表格。例如,在ImageNet排行榜上,点击任意一行的结果图标,即可跳转到论文中的具体位置。此外,该界面还支持用户添加自己论文中的成果,并将其与外部表格链接。目前,该功能仅适用于使用LaTeX源代码的arXiv论文。

大型数据库更新

随着新界面的引入和结果提取模型的改进,平台的数据量显著增加。目前已有超过800个新的排行榜和5500多个新结果。平台鼓励所有机器学习论文的作者、工程师和爱好者提交自己的研究成果。平台的数据是免费开放的,所有人都可以贡献数据。所有数据都采用免费开放数据许可协议,并提供JSON格式的数据下载。

自动提取结果

在过去一年中,平台一直在研究如何自动提取机器学习论文中的结果。现在,通过引入一种人工循环系统,结果提取变得更加高效。该系统为每一篇arXiv机器学习论文生成建议,用户可以选择接受或拒绝。这一改进大大提高了结果的质量和覆盖面。此外,平台还在GitHub上发布了用于结果提取的训练模型和评估数据集,以便进一步优化性能。

尽管技术进步使得跟踪机器学习进展变得更加容易,但排行榜也有其局限性。排行榜上的结果通常是点估计,受到多种因素的影响,如额外的训练数据、训练时间和数据选择。此外,数据偏差可能意味着排行榜的进步并不总是反映研究的真实进展。未来,平台将继续探索更有效的比较方法,以便更好地评估不同机器学习方法的效果。

总体而言,这些更新使平台更加全面,即使在机器学习的小众领域,用户也能更好地总结进展并比较不同的方法。访问paperswithcode.com/sota目录,搜索论文并添加成果,享受更全面的体验。

我们期待新功能能为用户提供更好的体验,同时也欢迎您的反馈和建议。让我们一起推动机器学习领域的进步和发展。

    本文来源:图灵汇
责任编辑: : 在前线
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
掉队最前沿学界中转永不成果机器学习
    下一篇