人類基因組中有成千上萬的基因:DNA和RNA扭曲結合在一起,使我們每個人都具有獨一無二的特徵和特性。每個基因都有一個名稱和字母數字代碼。
根據 The Verge報導,在過去一年左右的時間裡,約有27種人類基因被重新命名,而原因也許你會覺得荒唐,因為 Microsoft Excel 不斷把基因代碼誤判為日期。
這種低級的錯誤並沒有超越你的想像,你不會感到很驚訝,但是確實發生了;舉例來說,“MARCH1”是“Membrane Associated Ring-CH-Type Finger 1”的縮寫, 但是 Excel 將其判讀成日期-3月1日(1-Mar)。
根據研究,在2016年發表的3597篇基因遺傳相關論文中,約有20%的遺傳數據受到 Excel 錯誤的影響。這樣的數據錯誤相當危險,而且科學家只能手動修正,不用多加說明,這個繁瑣的過程十分令人沮喪。
避免這種情況的唯一方法是更改儲存格的數據格式。但是,科學家可能可以修正自己的數據,一旦其他人在 Excel 中打開同一表格而卻忘記修改,那麼錯誤將再次發生。歸根究柢,因為 Excel 不提供關閉此自動格式設置的選項。
所幸,負責標準化基因名稱的科學機構-HUGO基因命名委員會(簡稱 HGNC)於本週發布基因命名的新指南。為了遷就 Excel的自動格式,人類基因及其代碼將有新的名稱,比如“MARCH1”現在已變為“MARCHF1”,而“SEPT1”已變為“SEPTIN1”,依此類推。並且 HGNC 將存儲舊代碼和名稱的記錄,以避免將來造成混亂。
據 The Verge 報導,目前已有27個基因依照新的標準修正了,不過由於新指南在本周才公布,因為會諮詢了各自的研究社群來研議更新時程,此外也會通知已經發表的論文作者來做修正。
更動名稱這件事主要還是共識問題,但這又不禁令人思考,「為什麼重命名人類基因比改變Excel的工作方式更容易?」,為什麼在Microsoft與整個遺傳學界之間的鬥爭中,是科學家們不得不退縮?
事實上,微軟沒有回應學界的請求,但是根據 HGNC 協調專員 Elspeth Bruford 的說法,迫使微軟改變是毫無意義。他說:「微軟幾乎沒有動機對龐大的Excel用戶社群所廣泛使用的功能進行重大更改。」,畢竟,Excel 應用的層面太廣泛,實在無法為了某種目的去修改基礎操作的功能或工作邏輯。
總之,Bruford 對這種情況並不痛苦,求人不如求己,與其等待尚未知的Excel更新來解決這些問題,還不如直接由科學家自己提出長期解決方案。在時間長河裡,Excel 軟體可能稍縱即逝,遠不及基因的價值。
總之,微軟 Excel 改寫了人類基因的...名稱,這齣小小插曲有點令人無言,不過所幸遺傳學家已經有了解決方案。
消息/圖片來源:The Verge |