随着机器学习的迅速发展,学习这门新技术似乎已成为时代的必然选择。
然而,阅读相关论文往往缺乏方向,既耗时又费力,甚至可能需要支付高昂费用。
更何况,机器学习领域的论文数量实在庞大。
据Google AI的杰出科学家JeFF Dean进行的精确计算,全球每天平均会发布100篇新的机器学习论文。
而这一数据距离现在已有一年之久。
那么,在如此浩瀚的论文海洋中,如何找到最具价值的研究成果呢?
许多资源中提到一个网站,被誉为“AI各领域最佳资料查找工具”——PapeRs wITh code。

最近,PapeRs wITh code进行了重大更新,并登上了Reddit热榜,许多网友对此赞不绝口。
目前,该网站汇聚了超过2500个排行榜和超过20,000篇论文结果。
此外,用户现在可以直接通过点击Result链接,提取aRXiv中的表格数据。

接下来,让我们深入了解一下这个查论文的神器。
此次更新主要体现在三个方面:全新的Result界面、自动化结果提取以及大数据库更新。
首先,全新的Result界面将结果直接链接到aRXiv论文中的原始表格。
例如,在imageNet排行榜中,用户只需点击某一行的Result链接,即可直接访问论文中的表格,显得更加直观明了。

此外,这一新界面还充当了论文结果的编辑器,允许用户在社区中直接添加论文结果,并与内部表格链接。
需要注意的是,该界面目前仅适用于带有LaTex源的aRXiv论文。
接下来是自动化结果提取功能。
过去一年,该公司专注于从机器学习论文中自动提取结果。
现已推出一种新的人机交互系统,以实现结果提取。我们的模型能够为每篇aRXiv ML论文生成可供人类接受或拒绝的建议,显著提升了系统的性能,使其在实际应用中比之前的先进系统更具可行性。
相关方法已经在aRXiv上发布,并在GitHub上开源,同时发布了一个结构化的注释数据集,用于训练模型和评估其在结果提取任务上的性能,以期进一步优化。
此外,资源数据也得到了大幅扩展,目前网站上已有800多个新排行榜和5500多个新结果。所有数据均获得免费开放数据许可,并可在此处下载JSON格式的数据。
PapeRs wITh code于2018年7月成立,旨在帮助机器学习爱好者跟踪最新发布的论文和源代码,迅速了解前沿技术动态。
网站内容涵盖机器学习的多个领域,包括计算机视觉、自然语言处理、医疗、语音、游戏、时序数据、音频、机器人、音乐、推理和计算机代码等。
所有内容均可编辑和版本化,首页提供直观索引。

在每个领域下,用户不仅可以查看论文排名,还能找到相关代码。
该网站将aRXiv上最新的机器学习论文与GitHub代码进行对应,用户可以通过标题关键词或按流行程度及GitHub收藏数来查询“热门研究”。
以计算机视觉为例。

计算机视觉领域分为五个小类:语义分割、图像分类、物体检测、图像生成和去噪。
点击语义分割这一类,用户将看到简短的介绍和论文排行榜。


点击想要查看的论文及其代码就可以了!
PapeRs wITh code背后的公司Atlas ML位于英国伦敦,由RobeRt Stojnic和RoSS TayloR共同创办。
创始人之一RobeRt Stojnic在2012年于剑桥大学获得计算生物学博士学位,并于2018年7月创立Atlas ML及PapeRs wITh code,目前担任首席执行官。

RoSS TayloR在2014年获得剑桥大学经济学硕士学位,毕业后曾在金融行业从事软件开发和机器学习模型设计等工作,并于2018年共同创办Atlas ML,目前担任首席技术官。

去年底,成立仅一年多的PapeRs wITh code宣布正式并入FACEbook AI,但双方保持平台的独立性,相关服务、社区和网站运营方式不会改变。
在介绍完这个优质资源网站后,或许你会问,如何高效阅读论文呢?
之前,我们有一篇来自清华大学本科特等奖学生高天宇的分享,其中提到了一些查找和研究论文的小技巧。
首先,对论文进行分类:

对于与当前课题相关的论文,需全面掌握,每篇论文都应有所了解。
一方面,这些研究与自身课题息息相关;另一方面,如果碰巧遇到重叠主题,可能你的项目已被他人先行突破。
而其他子领域及不同领域的论文,如果对当前研究没有太大启发,可以略过。但若有对整体研究领域具有指导意义或取得重大突破的成果,则应认真阅读并总结。
针对论文标题,高天宇还提出了水文第一定律:标题越长,水文的概率越大;标题越短,往往干货越多。
