自從2016年谷歌的人工智能AlphaGo戰(zhàn)勝李世石后,人工智能技術(shù)就開始進入大眾視野,逐漸從實驗室走向商業(yè)化應(yīng)用。剽竊檢測工具助力學(xué)術(shù)出版?zhèn)鞑ィ瑫r至今日,人工智能也應(yīng)用到學(xué)術(shù)出版領(lǐng)域,并且有效提高了學(xué)術(shù)出版的運營效率。
第一,人工智能可輔助學(xué)術(shù)出版環(huán)節(jié)進行反剽竊和智能匹配同行評審專家。過去反剽竊主要依靠逐字逐句審查文本的方式,很難監(jiān)測到隱蔽的剽竊行文。當(dāng)前,運用人工智能技術(shù)不僅可以逐字逐句審查論文,還可以進行整個段落的識別。如致力于推進在線學(xué)術(shù)資源互聯(lián)的CrossRef協(xié)會,就設(shè)置了專門的剽竊檢測工具CrossCheck,可供學(xué)術(shù)機構(gòu)將提交的稿件和已經(jīng)發(fā)表的文獻進行段落、長句、短句、文字綜合對比,同時自動生成匹配度報告。此外,每年發(fā)表的學(xué)術(shù)論文數(shù)量巨大,僅2018年全球就有300萬篇學(xué)術(shù)文章發(fā)表,人工審稿的工作量是非常驚人的。利用人工智能技術(shù),可以快速輔助人工完成論文抄襲檢查以及數(shù)據(jù)篡改等初步環(huán)節(jié),大大減少審稿工作量,提升審稿效率。在專家評審環(huán)節(jié),此前評審專家由于對研究領(lǐng)域不熟悉,出現(xiàn)了評審耗時過長、有主觀偏見等情況。近年來,人工智能技術(shù)也被用于分析和匹配論文潛在同行評審人,幫助論文評審更加高效、專業(yè)。
第二,人工智能可在學(xué)術(shù)文獻存取環(huán)節(jié)進行智能學(xué)術(shù)搜索。近年來,每年都有超過250萬篇學(xué)術(shù)文章在2萬余種英文學(xué)術(shù)期刊上發(fā)表,以生物醫(yī)藥領(lǐng)域為例,每天發(fā)布的論文約3000篇。大量學(xué)術(shù)文獻提供的信息量是巨大的,對學(xué)術(shù)研究者來說,閱讀所有論文有一定難度,而人工智能技術(shù)的應(yīng)用可以幫助學(xué)術(shù)研究者在學(xué)術(shù)文獻存取環(huán)節(jié)進行智能學(xué)術(shù)搜索。如微軟的學(xué)術(shù)搜索就是基于人工智能知識圖譜技術(shù)開發(fā)的,并且在這一技術(shù)下又開發(fā)了微軟學(xué)術(shù)項目,可支持訪問超過1.6億篇學(xué)術(shù)論文搜索,可識別期刊、作者、論文以及研究領(lǐng)域。該項目通過遞歸算法幫助判斷論文的重要性,從而分析學(xué)科中影響力最高的科學(xué)家和學(xué)術(shù)出版物,并對其進行排行,而且該排行是動態(tài)的,每日都會更新。再如米塔可以分析用戶的搜索歷史,并推斷用戶的興趣領(lǐng)域,從而給用戶推薦相關(guān)的研究論文,并自動創(chuàng)新展示已發(fā)布的論文之間的圖譜關(guān)系,及時跟蹤學(xué)者的研究進展,快速識別研究領(lǐng)域的發(fā)展趨勢。雖然當(dāng)前這些技術(shù)尚未得到大規(guī)模的應(yīng)用推廣,但毋庸置疑的是,智能學(xué)術(shù)搜索將為學(xué)術(shù)出版?zhèn)鞑碇匾獌r值。
第三,人工智能可在學(xué)術(shù)文獻質(zhì)量評價環(huán)節(jié)進行文獻智能計量。評價學(xué)術(shù)文獻的質(zhì)量可以客觀評定學(xué)者的作品質(zhì)量,能夠促進學(xué)術(shù)文獻的質(zhì)量提升。以往評價學(xué)術(shù)文獻一般是通過期刊影響因子,但這 一方法有很大局限性。主要是因為同一期刊上被引用的文獻分布偏差較大,一些文章被大量引用,部分文章卻鮮被引用,所以同一期刊上的所有文章被判斷為同等質(zhì)量,顯然并不合理。此外,引文分析具有一定滯后性,往往一篇論文發(fā)表后,經(jīng)過很長時間甚至數(shù)年才能大致判斷其引用情況,這一滯后性嚴(yán)重影響了學(xué)術(shù)期刊的選題策劃和組稿工作。在文獻計量領(lǐng)域,人工智能發(fā)揮了重要作用。如文獻計量智能的開拓者元文獻計量智能,就通過人工智能的機器學(xué)習(xí)算法,對全球數(shù)百萬篇學(xué)術(shù)文獻進行學(xué)習(xí)訓(xùn)練,從而挖掘各領(lǐng)域被引用最多的文章的特征模型。一旦系統(tǒng)接收新稿件,元文獻計量智能就會利用算法從這篇新論文中挖掘數(shù)百個特征,并與相關(guān)領(lǐng)域中被引用最多的論文特征模型進行匹配,從而預(yù)測新論文未來可被引用的次數(shù)及影響。大規(guī)模的應(yīng)用表明,元文獻計量智能預(yù)測新稿件影響級別的準(zhǔn)確性是人工預(yù)測的2.5倍。
全媒體時代,學(xué)術(shù)出版的內(nèi)容生產(chǎn)以及內(nèi)容出版?zhèn)鞑ザ及l(fā)生了改變,內(nèi)容的分眾化、個性化需求日益凸顯,出版?zhèn)鞑サ钠脚_化成為主流,數(shù)字技術(shù)以及人工智能等新一代信息技術(shù)與學(xué)術(shù)出版更是日趨深度融合,這將為學(xué)術(shù)出版的傳播帶來深刻變革。時代的變化,要求出版機構(gòu)靈活高效整合優(yōu)質(zhì)專業(yè)內(nèi)容,活用數(shù)字技術(shù)、人工智能技術(shù)等,構(gòu)建高端學(xué)術(shù)出版?zhèn)鞑テ脚_,最大限度釋放學(xué)術(shù)出版價值。
