编辑:杜伟、陈萍

快速阅读论文是研究职员不可或缺的一项技能,有人须要很长的韶光才能理解一篇论文,而有的人几个小时就能节制全部内容。
本文中 Kirill Demochkin 仅用 2.5 个小时就能完成论文阅读、写择要到发布博客。
我们不妨看看他是如何实现的。

一万个人心里有一万个哈姆雷特,对付论文写作与阅读,每个人都有自己的不雅观点与方法。

写作和阅读论文是研究职员必备的核心技能。
一篇好的论文涉及多方成分,作者要准确传达核心不雅观点,并证明其是可行的。
想要达到这一目的,作者应该从语句、段落、章节、全文等多方面做好论文的构造。

6个月写50篇AI论文摘要网友这有啥曾15小时内复现一篇论文

AI 领域的论文更是如此,养成良好的写作习气、追求有洞见有影响力的论文、论文极致精髓精辟且阐述只管即便简洁、要有准确的定位,这些履历彷佛已经成为论文写作的准绳。

三星人工智能中央的 AI 研究科学家、Casual GAN Papers 网站创始人 Kirill Demochkin 一贯致力于论文写作方面的履历分享。
近日他发布了新的文章,主题为「过去 6 个月为 50 篇 AI 论文撰写择要,从中学到了什么?」

Kirill Demochkin

在这 50 篇论文中,大约 40% 关于 GAN 或 GAN 干系,别的为 NeRF、Visual Transformers、CLIP 以及其他看起来有趣的主题。

Kirill Demochkin 表示,自己每周写两篇择要已经有一段韶光了,以是想分享一些过程中学到的技巧!

首先,他从头到尾读完一篇论文,写择要,把图形编译成一张图片,然后发布到频道和博客上常日须要 2.5 个小时。
他紧张选择那些看起来有吸引力以及在推特上引起很大轰动的论文。
他还方向于「有趣」的论文,这些论文有酷炫的图像、动态展示结果以及引人瞩目的标题。
一旦决定要为一篇论文写择要,他就会检讨是否有任何与之干系的「必需」阅读,然后弄清楚新方法试图办理什么问题,以及现有方法为什么不足用。

然后,他会浏览「方法」部分,查看论文图表。

末了,确保「实验」部分在数字、指标、基线和溶解方面故意义。

至于为什么要花 6 个月的韶光为 50 篇 AI 论文撰写择要?他认为,快速阅读论文是所有研究职员的一项必备技能,尤其是飞速发展的 AI 领域。
对自己看过论文的 idea 进行总结可以更好地记住它们。

Demochkin 提到从阅读论文到发布博客须要 2.5 个小时。
对此,有网友提问道,「2.5 个小时是全体过程,还是只是阅读论文的韶光?在一次口试中,我被哀求在 1.5 小时内阅读并复现一篇 AI 论文(论文大概 6-10 页),我乃至论文都没看完,显然我没得到那份事情。
我在想是不是只有我一个人该当提高自己的水平,还是在 1.5 小时内不能完玉成部过程很正常。

还有网友表示:「这取决于我想深入研究的深度和我对该领域的熟习程度,但我可能须要几个小时才能彻底阅读一篇不熟习的论文并写出条记。
实现所需的韶光差别很大,但在 1.5 小时内完成所有这些听起来有点猖獗,除非它真的很大略。

还有人以为这听起来很猖獗。

Kirill Demochkin 阅读论文技巧

Kirill Demochkin 查看论文的资源来自 paperswithcode、reddit,以及同事分享的 feedly 列表。

理解背景知识

论文不是凭空写的,险些任何一篇论文都有前期研究,乃至是像 NeRF 这样的打破性研究。
理解前期事情能够帮助我们理解所提方法潜在的优缺陷。
不幸的是,我们不能花费一周的韶光来研究论文中所引用的论文,以构建这一背景知识。
因此最好的策略是通过明确写出一篇论文试图办理的详细任务、现有的替代办理方案、这些办理方案会带来的问题,以及为什么作者认为他们的方法避开了这些问题。

把握文章主旨

阅读文章时首先要阅读章节和小节标题,并将它们与文章中提出的架构 / pipeline 的图形部分联系起来。
这样,在阅读文章细节之前,你会在脑海中勾勒出论文大概框架。

对实验进行全面检讨

文章作者常日会将所做的研究进行打包,以软件包的形式呈现出来。
但是这样做,有时会遗漏一些主要细节。
常日来说,对研究打包是很好的,但是,从另一方面你可以根据遗漏的内容和缘故原由得到更多的见地。
要实现这一点,你须要做到以下几条:

检讨基准:最近有没有什么方法被忽略了?掌握变量检讨:是否对 pipeline 中的每一部分都进行了测试?检讨数据:是否有已知的数据集没有在实验结果中提到?大概,被遗漏的数据集有一个共同的特点,即指出了所提方法的写论文

刘知远为 NLP 领域的学生如何写出一篇合格的论文供应了一些建议,大略总结如下:

论文整体思路:问题务求寻衅,模型务求创新,实现务求准确,实验务求深入。
一篇 NLP 论文的范例构造:择要、先容、干系事情、方法、实验和结论。
每个部分都要各司其职,向学术界同行清晰准确地描述成果的创新点、技能思路、算法细节和验证结果。
先容是对全体事情的全面先容,是决定一篇论文能否被任命的关键。
一样平常情形下:起手先容研究任务和意义;随后简介面向这个任务的已有方法;接着解释已有方法面临的关键寻衅;针对这些寻衅,本文提出什么创新思路和详细方法;末了先容实验结果证明本文提出方法的有效性。
择要可以看做对先容的简介,最大略的做法是,从先容各部分精简 1-2 句话组成择要。
干系事情部分紧张是先容本文任务和方法的干系事情,目标是通过对已有事情的梳理,凸显本文事情的创新代价。
对已有事情的梳理,不应是对每个事情的大略先容,而应该把稳汇总、分类、剖析,或者按照韶光发展顺序,或者按照技能路线划分。
方法部分要详细先容本文创新方法的详细细节,由于涉及非常艰涩的细节,采取「总 - 分」构造来先容。
实验部分要详细先容与实验干系的详细细节。
一样平常先先容实验数据、评测标准和比较方法等基本信息。
论文末了会有总结展望,一样平常用一段来再次总结和强调本文的创新思路和实验结果,然后解释未来建议的研究方向和开放问题。
这部分相对来讲比较固定。
轻微留神的是,在准备论文末了阶段,如果创造论文有哪些应该做还没来得及做的,可以写作本文的未来事情。

总之,刘知远认为,要想写出一篇合格的 NLP 论文,首先是态度问题,只有态度重视,才有可能不厌其烦地反复修正,才会「不择手段」地探求各种办法来尽力改进论文(找学长找外教借助 Grammarly 工具等)。
其次是动手问题,只有写下来,才可能不断改,只要改就能不断进步。
末了是履历问题,要写得精彩可能须要天赋,而要写得合格,只要坚持写,不断根据评阅人和其他人的见地进行思考和修正,就可以进步。
总之,坚持便是胜利。

读论文

在 CS230 课程中,吴恩达对付研究方案与如何读论文也提出了他的一些建议。

如果要高效地阅读论文,吴恩达表示我们想要知道论文的来源,例如 arXiv 或个人博客等。
下面,如果我们列出 5 篇待读论文,那么吴恩达的习气是每一篇列一行,表示从 0 到 100 的阅读进度。
最开始我们只须要阅读每一篇的 10% 旁边,如果创造论文 2 不是我们想要的,就闭幕它。
如果论文 3 是主要的,那么仔细阅读到进度 100%。

由论文 3,我们可以创造其它干系研究,因此也可以加到论文列表中,例如第 6、7 篇。
读完论文 3 大概会创造论文 4 也非常故意思,那么结合 4、6、7 连续阅读,并记录阅读进度。

末了,如果阅读 5-20 篇论文,差不多我们对该领域就有一定的理解了。
如果高效阅读 50 到 100 篇论文,那么对该领域的理解就比较完全了。
Ng 的背包内每天都会带一个文本夹,里面的纸质打印论文便是他的论文列表。

那么详细如何阅读一篇论文呢?吴恩达表示,从第一个词浏览到末了一个词,这是最差的办法。
一样平常而言,我们要多次浏览论文,且每一次的目的都不相同。

首先第一遍该当只看标题、择要和图表,择要能见告我们论文讲了什么,而对付深度学习研究事情,很多都能总结成一两张图表。
第二遍该当连续看序言、结语和图表,其它的内容我们可以暂时不管。
把稳在看序言时,干系研究部分也可以不管,虽然该部分对付理解研究脉络很有帮助,但第二遍该当须要捉住紧张思想。

第三遍阅读就要纵览论文主体了,但同时那些耗费韶光的数学与推导部分可以暂时跳过,我们节制整体脉络与框架就行。
第四遍须要阅读所有的内容,但这时候肯定还会有一些部分不能理解,那么暂时跳过它们往后再攻坚。

干系阅读:

清华大学刘知远:如何写一篇合格的 NLP 论文

机器学习研究者的养成指南,吴恩达建议这么读论文

参考链接:

https://www.reddit.com/r/MachineLearning/comments/pgitms/d_here_is_what_i_learned_from_writing_50/

https://www.casualganpapers.com/how-to-learn-to-read-ai-papers-quickly/How-To-Read-AI-Papers-explained.html