|
|
不符合預(yù)期的數(shù)據(jù)絕不能隨便刪除 |
|
科學(xué)是以數(shù)據(jù)說話的,任何科學(xué)結(jié)論都需要數(shù)據(jù)支持。數(shù)據(jù)不嚴(yán)謹(jǐn),會產(chǎn)生不嚴(yán)謹(jǐn)?shù)慕Y(jié)論,甚至是錯誤荒唐的結(jié)論。這對社會的影響是極大的,尤其是涉及國計民生問題時,錯誤的數(shù)據(jù)很可能會導(dǎo)致錯誤的決策,進(jìn)而造成巨大的損失。所以,實驗科學(xué)無論怎樣強調(diào)數(shù)據(jù)都不為過。
最近,我和學(xué)生們在組會上又聊到了數(shù)據(jù)取舍的問題。我的研究生剛剛獲得了一個實驗的部分?jǐn)?shù)據(jù),需要統(tǒng)計處理組與對照組的差異,但統(tǒng)計后他發(fā)現(xiàn),有一組數(shù)據(jù)標(biāo)準(zhǔn)差太大,統(tǒng)計結(jié)果是“差異不顯著”。
我們的實驗研究需要檢驗處理組和對照組之間的差異,或不同因素處理的效應(yīng),在這一過程中,令研究人員最頭疼的問題就是實驗結(jié)果與預(yù)期不一致,本該有差異顯著性的數(shù)據(jù),卻檢測不到差異顯著性,概率值大于0.05。在我們平時的科研工作中,這種情況很常見。
在討論的時候,我跟他說:“如果個別數(shù)據(jù)偏離了整個樣本的變化趨勢,要特別重視,首先分析自己的實驗過程是否有問題、樣品是否有問題等。不符合預(yù)期的數(shù)據(jù)是絕對不能隨便刪除的,可以在分析數(shù)據(jù)的散點圖和標(biāo)準(zhǔn)差后,決定是重復(fù)一次實驗,還是增加樣本數(shù)。”
數(shù)據(jù)取舍,是我們組會上經(jīng)常討論的問題。我一般會跟我的學(xué)生說,出現(xiàn)個別偏離的數(shù)據(jù),要認(rèn)真分析是不是這個樣本有問題,并結(jié)合這個樣本的其他參數(shù)予以考慮。比方說,如果同一個動物實驗中,多個參數(shù)都出現(xiàn)了問題,就要考慮可能是動物樣本的問題;如果僅是某個參數(shù)不符合預(yù)期,可以分析測定過程是否出了問題。但基本原則是,不能隨便刪除數(shù)據(jù)。
面對個別偏離的數(shù)據(jù)時,我們的處理方法一般有以下三種。第一,再重復(fù)測定一次;第二,如果問題依然存在,又不好解釋,按照數(shù)據(jù)散點圖,將偏離平均值范圍太大的數(shù)據(jù)在散點圖上標(biāo)記出來,統(tǒng)計分析時,說明這個數(shù)據(jù)沒有被統(tǒng)計進(jìn)來;第三,根據(jù)統(tǒng)計學(xué)中判斷奇異值的方法,進(jìn)行個別數(shù)據(jù)取舍。
有時我們會發(fā)現(xiàn),統(tǒng)計結(jié)果是由個別數(shù)據(jù)引起的,如果去掉偏離平均值范圍大的數(shù)據(jù),差異顯著性就出來了。這時,有些研究人員就會產(chǎn)生一種取舍數(shù)據(jù)的沖動,想刪除這個不理想數(shù)據(jù)。但這是很危險的,因為隨便取舍數(shù)據(jù),或根據(jù)自己的需要取舍數(shù)據(jù)、選擇性使用數(shù)據(jù),就觸碰到了學(xué)術(shù)不端的紅線。
我認(rèn)為,研究人員產(chǎn)生數(shù)據(jù)不當(dāng)取舍行為的一個直接原因是功利化心態(tài)、浮躁心態(tài)。例如,研究生有畢業(yè)發(fā)表論文的需要,年輕學(xué)者有晉升和申請各種名譽獎項的需要等。如果沒有正確對待科學(xué)的心態(tài),沒有對待科學(xué)數(shù)據(jù)嚴(yán)謹(jǐn)?shù)膽B(tài)度,而是論文至上,再加上沒有強有力的監(jiān)督機制和懲罰措施,出問題是不奇怪的。
為避免不當(dāng)?shù)臄?shù)據(jù)取舍,應(yīng)該對實驗的原始記錄給予高度重視。我們實驗室每周都有組會,大家有數(shù)據(jù)就會在組會上討論。研究生和導(dǎo)師交流時,也要提供原始數(shù)據(jù)。
在我以前工作的中國科學(xué)院動物研究所,我負(fù)責(zé)研究生教育工作多年,研究所學(xué)位委員會制定了導(dǎo)師檢查研究生實驗記錄的制度,每學(xué)期都要進(jìn)行檢查,記錄本上有導(dǎo)師的簽字。導(dǎo)師檢查學(xué)生實驗記錄,也是研究生中期考核、申請學(xué)位論文答辯的一個重要條件。研究所為此專門定做了實驗記錄本,每頁都有頁碼,不能隨便撕掉。實施效果還是不錯的。
總之,做實驗要尊重原始數(shù)據(jù),嚴(yán)肅認(rèn)真對待每一個數(shù)據(jù),對待科研和實驗過程的每一個步驟,認(rèn)真做好實驗記錄。不可以更改數(shù)據(jù),不可以選擇性地取舍實驗數(shù)據(jù)!
(作者系山東大學(xué)生命科學(xué)學(xué)院特聘教授,記者倪思潔/采訪整理)
《科學(xué)新聞》 (科學(xué)新聞2022年8月刊 封面)