arXiv,20岁生日快乐!

(今天本来想吧写到一半的星震的文章搞定,突然发现astrobites网站上贴出了一篇为arXiv网站庆祝20岁生日的文章,觉得自己也该写点儿什么,就参考了Nature上arXiv创立者自己写的一篇文章跟大家聊聊;当然,希望大家首先去看看 astrobites 上面的文章)

文章:ArXiv at 20

arXiv,是一个涵盖物理学,天文学,数学等学科的庞大论文预印本文库,到上个周日为止,她已经整整20岁了; arXiv的每日论文预印本更新是我们建立天文理科人网站的主要动机之一,而且毫不夸张的说,对于每个在天体物理学以及其他物理学分支内学习的同学,每天,或者至少定期的阅读arXiv更新是学习的过程中不可缺少的重要项目。可能并不是我们的每位读者都熟悉这个网站,这里我们就简要的介绍一下arXiv,再跟随着他的创立者,回顾一下历史,展望一下未来吧。


fig1

Fig.1: 1991年,在Los Alamos国家实验室的这台电脑上,Paul Ginzberg建立了arXiv网站前身的邮件系统。图片来自Cornell大学

arXiv是一个主服务器设置在美国Cornell大学的论文预印本文库,到目前为止,一共涉及物理学,天文学,数学,生物学,金融和统计学几个学科,其中物理,天文,数学下面,又按照不同的方向和领域进行分类,比如天体物理学方向下就分成了,星系和宇宙学,行星科学,银河系,高能天体物理,仪器与方法,恒星和太阳物理,6个子方向;这是一个完全公开的网站,来自全世界的科学家可以在这里浏览每天同行们更新文章的摘要,下载原文,并即时的上传自己的工作。arXiv 有很多的镜像站点,其中中国也有自己的镜像

arXiv网站的创立者是Los Alamos国家实验室的一名高能物理学家,Paul Ginsparg,20年前,他刚刚开始到Los Alamos工作的时候,虽然还没有今天的互联网(WWW),但物理学家们已经首先开始频繁的使用电子邮件交流,Paul就在Los Alamos设置了一个邮件服务系统,用来贮存和传播科学论文,最开始,他的目的仅仅是帮助自己工作领域内的几百名高能物理学家,最早使用的邮箱就是 hep-th@xxx.lanl.gov,这也是为什么目前Los Alamos实验室的arXiv镜像依然是xxx开头的缘故。当时,欧洲的CERN已经在开发WWW,不过Paul也承认,他对什么是互联网一无所知,他的设想仅仅是每年在这个邮件系统里接受100篇论文预印本,每篇保留3个月的时间就删除,不过他的邮件系统瞬间就变的非常的流行,在大家的要求下,所有的论文都被保留了下来,而且很快的,他就加入了互联网的怀抱并有了arXiv.org这个更加被我们熟知的名字,发展到今天,arXiv已经成了每年接受75000篇左右论文,保存预印本总量超过70万篇的庞大科学资源;几乎每周,都会有来自世界各个角落的40万名用户在 arXiv上下载超过100万篇次的文献。在和天文相关的领域内,这20年间,截至到2011年8月3日,共有123902篇文献被上传到arXiv上。


fig1

Fig.2:20年里,arXiv对物理学,天文学和其他科学都起到了极大的促进作用。图片来自Nature网站

作为一个无审查体系,完全公开的预印本文库, arXiv除了在规模上的扩大外,也一直在不断的改进,比如2004年引入的“endorsement”机制,就是为了对提交预印本的可靠性做一个初步的限制。发展到现在,仅仅就天文学领域而论,arXiv的影响有多大,真的是无法估量的,比如大家已经可以经常在论文中看到以 arXiv 编号引用的论文预印本,比如很多原来非常难得的资料,如ARA&A综述文章,重要的天文暑期学校的讲义,都可以很容易的从arXiv上下载,再比如常用的ADS论文搜索系统也把arXiv作为正式的搜索资源之一,我们日常使用的一些文献管理软件也支持利用arXiv编号进行论文检索和整理,等等。。更有甚者,有人研究了近些年天文领域的论文发表情况,发现在arXiv上提交过预印本的文献比那些未提交的,在发表后几年的引用率要明显偏高。。。可以说,论文预印本文库arXiv已经从很多意义上改变了我们学习和科研的方式

不过这并非意味着arXiv就没有缺点和不足;Paul Ginzberg自己表示,他当初的设想是花几个小时设置好邮件系统,然后自动运行,只要闲暇时间管理一下就好了,没想到这个飞速发展的项目几乎占去了他职业生涯的大部分精力,今年9月,arXiv将正式的全权移交给Cornell大学进行管理,不过Paul仍然是科学意见委员会中的重要一员,而且他自己也表示,arXiv在不远的将来,需要大的翻修甚至彻底的改变以适应新的需要。

的确,有人把arXiv称为科学发表界的一场民主改革,这个改革无疑是非常成功的,但首先,有人对arXiv的无同行审阅机制 (peer review) 提出了质疑,而有人又坚持这是arXiv最大的优点,这方面的争议从来没有停止过;其次,arXiv本身虽然经过改良,但依然基本保留了他20年前的作用 ,论文的收集,储存,发布,而生活在数字时代的科学家显然要求的更多。这些年我们已经看到了一些尝试,比如,一些专门讨论和介绍arXiv文章的blog和论坛 (比如物理界的arXiv blog; 再比如面向宇宙学的Cosmocoffee),这些网站起到了筛选,讨论争议文章,推广重要工作的作用,当然还有越来越多的科学家以个人blog为平台做这样的事情,也包括像astrobites和我们天文理科人这样的网站,从某种意义上说,这似乎预示着将来更好的论文预印本文库会加入科学家自行组织,“crowded-source”的论文审阅机制;再比如一些网站已经开始尝试对arXiv论文进行更好的分类和组织,例如arXiv structure网站在arXiv自己提供子领域分类之前就开始进行类似的事情,并给出相关领域的统计比较,尽管这个网站似乎在08年以后不再更新,但目前仍然可以用来在搜索arXiv上的综述文章;再比如 arXivsorter网站则致力于改善个人阅读体验,根据你自己输入的作者列表,网站会根据Friend-of-Friend (这个算法常用来在星系巡天和模拟中的环境研究)算法来排列当天的更新文章,会自动把和你喜好领域相关的文章靠前排列,根据我个人的实验,发现还是很靠谱的,这些网站也预示着将来的arXiv还可以提供更人性化的服务。

我们有理由相信,在这样的一个时代,科学结果的发表和科学问题的讨论将会变的更加的便捷和开放,天文学家们已经开始用Twitter组织跨越研究机构的Journal Club,用Youtube短片配合arXiv文章介绍自己的工作,就连Nature这样的顶尖期刊也允许对论文进行在线的评论,arXiv也一定会向着更新,更好的方向演变,让我们拭目以待的同时,也希望大家对新的时代做更好的准备,正如我们天文理科人网站所致力的方向那样,学会搜索,获取,评价信息,懂得交流和分享的意义!

    分享到:

4 Replies to “arXiv,20岁生日快乐!”

Leave a Reply

Your email address will not be published. Required fields are marked *