论文写作算法

在《自然》杂志作者指南上,推荐了哥伦比亚大学 Chris Wiggins 教授的一篇很有趣味(amusing)但是很贴切(pertinent)的一个论文写作算法(algorithm)。我觉得这个算法简明扼要、容易理解,应该会很受年轻孩子们的欢迎。

我觉得 Chris Wiggins 教授能想出这个算法,是因为他非常独特的背景:首先,他懂数据和算法,喜欢编程。作为哥伦比亚大学数学系数据科学方向的教授,他还是纽约时报的首席数据科学家,发布了好几个开源的数据处理软件包;其次,他在通识教育上有亲身的经验。他在哥伦比亚大学和另一位历史系教授联名开发了一门和数据有关的通识教育课程《数据:过去、现在和未来》。这门课程要求会编程的同学多写一些人文历史方面的论文,而来自人文历史学科的同学多学一些编程,很有意思;最后,他喜欢和年轻人打交道、热心公益、热衷于社区建设。他在2012年,联合另一位纽约大学教授,发起了纽约青年编程 HKNY 社区,每年组织编程马拉松等活动,持续至今,产生了较大的影响。因此,他的这个写作算法,让我感觉很实用,也很贴合年轻人的心理。

所谓算法,就是能够计算机编程实现的流程。所以,他的这个“算法”,换个名字,叫“流程”也可以,对不熟悉编程的同学来说,更容易理解。这个算法一共有14步,其中3步是写作论文的3个部分:导论、正文、结论。那剩下的11步是什么呢?你看了他的算法后,就理解这些步的重要的。我们下面就来看他的原文吧。

最近有个学生问我怎么写论文。这是我建议的算法。根据个人的情况,有足够的偏离空间。

一、妙语(punchline)

读者、审稿人,以及 5 年后的你,都希望有一种简洁的方式来记住你的这篇论文。这就是你的“妙语”,或论文的关键点。“主要结果”是什么?你学到了什么?如果回答这个问题需要很长时间,那么你可能还没有很好地理解这个主题,或者你可能需要把它分解为 2 篇论文。

二、昵称

我从事的大多数项目都有该项目的一个昵称(一帅注:比如 Hadoop, TabTransformer)。有时它只是你的 cvs/svn/github 存储库的名称。它可以帮助您和您的合作者定义一口能咬下去的研究量(a bite-size quantum of research)。

三、* 图片

决定哪些图片是必要的,以说明你的“妙语”。决定哪些图片放在正文中,哪些放到补充材料中。我在“图片”这个词前面加 * 号,是表示:这是人们阅读论文的方式 —— 他们会先浏览图片和参考文献。

四、* 参考文献

决定你应该引用哪些参考文献,来支持你的论点(argument),并设置该论点的背景和上下文。* 意味着人们会先读参考文献。为什么呢?我认识的人曾经对我说,她或他在论文阅读中做的第一件事是看参考文献,看她或他的工作是否被引用。我仍然不确定她或他说这句话是否是认真的。

五、大纲

接下来写一个大纲。我非常严肃地说(seriously),你需要这样做。不要只是坐下来开始写东西。

六、摘要

现在你可以写摘要了

七、(w) 导论(Introduction)

现在写论文的开头。 (w) 表示这是大多数人在想到“写论文”时,想到的算法的部分。

八、(w) 结论

现在写下结论:你展示了什么,你想在后续论文中做什么,在哪里可以找到源代码。

九、(w) 中间部分

现在写论文剩下的部分

十、给已经明确的合著者看

如果您还没有给他们看,请确保现在向将成为合著者的人展示。

十一、给潜在的合著者看

如果您还没有,请将其展示给可能或可能不想成为你的合著者的人看。大方一些(be generous)。

十二、致谢

想想每个帮助过你和资助过你的人。大方一些。那些没有成为你的合著者的人,也应该得到感谢。

十三、标题

十四、代码

如果您的工作包括编程和数据处理(包括建模和统计工作),请将所有代码 + 数据上传到中立的第三方网站(例如 code.google.com、github.com、sourceforge.net)。

十五、向会议或期刊提交论文,并发布到 arxiv.org

我不确定上面的哪个应该先出现,但对我来说,一个人向期刊投稿后,尽早地发布到 arxiv.org,并在评论中注明“已提交出版”,这似乎是合理的。

最后两个是关于结果重现的,它们更多的是关于如何提交,而不是如何写。

小结

我特别喜欢 Chris 教授从“妙语”开始的论文写作过程。首先,通过“妙语”、“昵称”、“图片”、“参考文献”,就把论文的“故事”基本上刻画出来了。这和我们前面学习过的论文写作方法,是完全一致的,只是 Chris 教授把它们提炼成了四个词。这样同学们理解起来,就觉得容易了很多。毕竟,现在是抖音、或者漫画的时代,大家的脑容量都希望占用得越少越好。

然后,就是具体的写作过程了。写作,从大纲开始,这是一个基本的共识。前面的论文写作方法也提过这一点。然后是摘要,导论、结论。它们给出了论文的论点、论据、结论,也勾勒出了论文的结构。这样,整篇论文就有了一个基本的框架、一个主心骨和统领。这时,再去写中间的正文部分,就知道对内容应该怎么取舍,逻辑应该如何组织,详略应该如何控制了。

写完后,Chris 教授提出的要给“已明确的合著者”和“可能的合著者”看,这一点,也很有意思。这是西方学术界的一个很好的传统,我国的研究生对此理解还不深。因为对西方学术界来说,他们看重的是论文作为一个交流工具产生的价值,因此,论文写完后,送给各种人交流,得到反馈,一起修改,是作者觉得很高兴的一件事。他最后提到的代码分享,也是实证科学领域越来越被强调的一个方面。学生们看到这个,就会觉得很现代,对这个算法产生认同。

因此,我把这个算法讲给我的研究生听,他就觉得很容易理解、欣然接受。这是 Chris 教授厉害之处。非常感谢。

参考文献


Index Previous Next