本書把握當今信息時代數字化、互聯(lián)網、大數據三大技術特征,著眼于當代科學活動及科學文本的大數據引領科學計量學深刻變革的理論,從理論基礎和應用兩個方面介紹科學計量大數據的最新進展。
更多科學出版社服務,請掃碼獲取。
大數據時代的科學計量學新方向
科學家的一天,似乎與常人不同,但既非不食人間煙火,也無什么驚人之舉。后者,迄今科學史上僅有一例,1869年3月1日這一天,俄羅斯化學家門捷列夫(1834-1907)發(fā)現(xiàn)了化學元素周期律,史稱“偉大發(fā)現(xiàn)的一天”。業(yè)經手稿、檔案的嚴密考證,確認了門捷列夫一天內編制出完整的元素周期表,同時又查明之前他在寫作《化學原理》的過程中對元素分類進行了堅持不懈的探索和嘗試①。平時積累,成就一天。正如科學計量學之父普賴斯(Derek John de Solla Price,1922-1983)的一句名言所說:“科學如今清楚地表明,巨大進步集成于各種方式的小步之中!雹诋斎,一項巨大進步未必集中在一天。
普賴斯的這句名言再次為最近的一項研究結果所印證。該項研究通過實時追蹤世界各地科學家借助互聯(lián)網每天從數字文檔數據庫中下載科學論文的大數據分析,獲得每天0~24小時論文下載量波動的周期曲線,證實了科學家群體的每一天確非平常,平時熬夜、周末加班系工作常態(tài)。這項研究以“探索科學家的工作時間表”為題在國際期刊《信息計量學學報》(Journal of Informetrics)公開發(fā)表后,引起強烈反響,國內外媒體紛紛加以轉發(fā)、報道或評論。
現(xiàn)在,作者王賢文博士在《科學計量大數據及其應用》這部專著中,披露了那篇論文的機緣、由來與傳播盛況。這項有趣的研究,不獨直觀地展現(xiàn)出科學家夜以繼日探賾索隱的不倦努力,并暗示科研成果源于“積小步,成大步”所鑄就,而且初露當今數字化、互聯(lián)網、大數據時代的科學計量學新方向。
正是取代紙質出版物的數字文檔,才使得科學論文可以被不斷下載而不會像紙質論文那樣被不斷消耗,我們也才有了計量和分析的新對象;正是有了遍及全球的互聯(lián)網,才使得宏大的數字文檔數據庫吸引遍布世界各地的科學家前來搜索、瀏覽和下載所需的論著,我們也才有了監(jiān)測和追蹤科學家網上活動的有效手段。顯而易見,僅僅監(jiān)測和記錄論文下載的少量數據,不足以顯現(xiàn)科學家下載論文的世界空間分布特征與時間分布周期規(guī)律,因此這是一項需要大數據且能夠產生大數據的計量研究。
在這本著作中,作者敏銳地把握住當今信息時代數字化、互聯(lián)網、大數據三大技術特征,著眼于當代科學活動及科學文本的大數據引領科學計量學深刻變革的理念,將全書分為兩大部分。第一部分為科學計量的大數據基礎,分四章先后論述了數字出版、互聯(lián)網與科學計量大數據,面向科學計量的數據體系,科學論文的使用數據和論文使用數據的開放獲取優(yōu)勢;第二部分為論文大數據在科學計量中的應用,分四章分別探討科學家的工作時間表,科學論文在社交網絡中的傳播機制,實時追索論文使用數據呈現(xiàn)的研究熱點與研究前沿,以及基于使用、引用等多重指標的單篇論文評價體系。
王賢文,大連理工大學副教授、博士生導師,主要從事科學計量、科技政策與管理研究,擔任英文國際期刊Frontiers in Research Metrics and Analytics副主編,以及JAS/ST、Scientometrics、Research Evaluation等SSCI期刊的評審專家。主持課題10余項,其中國家自然,社會科學基金項目3項。在國內外期刊發(fā)表學術論文70余篇,其中SSCI論文18篇,CSSCI論文49篇。研究成果曾多次引起Nature關注,被Nature、光明B報、法蘭克福匯報、德國廣播電臺、澳大利亞廣播公司、中國科學報等全球數十家主流媒體專文報道,在國內外產生較大影響。
目錄
序 大數據時代的科學計量學新方向
前言
第1章數字出版、互聯(lián)網與科學計量大數據/001
1.1科學論文出版:從紙質出版到數字出版/001
1.2應運而生的科學計量大數據/004
1.3歷史上IT技術引領科學計量學的大變革/005
1.4新的變革正在科學計量學領域悄然發(fā)生/008
1.5本章小結/011
第2章科學論文的科學計量分析:數據、方法與用途的整合框架/013
2.1科學計量學的研究數據體系:四大數據對象/014
2.2四大數據對象的比較/018
2.3科學計量學研究方法與各數據對象的針對性使用/021
2.4本章小結/027
第3章科學論文的使用數據/028
3.1數字出版、互聯(lián)網與科學論文使用數據的形成/028
3.2使用數據的相關研究/030
3.3使用數據的產生機制/033
3.4使用數據的獲取來源/034
3.5本章小結/048
第4章科學論文使用數據的開放獲取優(yōu)勢/049
4.1開放獲取運動的洪流/049
4.2關于開放獲取優(yōu)勢的爭論/054
4.3研究設計/057
4.4基于相關性分析的多重指標抽取/061
4.5開放獲取論文的優(yōu)勢對比分析/064
4.6分學科領域的開放獲取優(yōu)勢對比分析/078
4.7本章小結/100
第5章探索科學家的工作時間表/102
5.1基于科學家下載論文的大規(guī)模時間數據分析/102
5.2各國科學家工作時間表的共性與地區(qū)差異/108
5.3美國、德國、中國大陸的深入比較分析/115
5.4本章小結/117
第6章科學論文在社交網絡中的傳播機制研究/119
6.1網絡時代科學論文的傳播/120
6.2科學論文在社交網絡中的傳播機理/123
6.3案例分析/126
6.4本章小結/130
第7章研究熱點與研究前沿的實時挖掘/131
7.1科研新趨勢的探測/131
7.2基于論文的使用數據實時捕捉科學家的研究想法/133
7.3理論與方法體系/134
7.4基于DIKW體系的計算神經學領域的研究趨勢挖掘/137
7.5本章小結/163
第8章連續(xù)、動態(tài)和復合的單篇論文評價體系構建研究/165
8.1科學論文的學術影響力與社會影響力綜合評價/165
8.2單篇論文評價的時機已經成熟/176
8.3構建單篇論文評價體系的必要性/178
8.4單篇論文評價體系的構建與實證研究/180
8.5本章小結/186
參考文獻/189
附錄來自全世界的關注/201
附錄1Nature——實驗室生活:平衡的藝術/201
附錄2法蘭克福匯報——自由時間?科學家有空閑時間嗎?/206
附錄3中國科學報——一個考察科研人員生存狀態(tài)的獨特視角發(fā)現(xiàn)/208
彩圖/213