| 主頁 | 頻道首頁 | 本站地圖 | 論壇留言 | 合作聯系 | 本站消息 | |
科技動態 技術發展 文化研究 生物生態 人的研究 生命起源 基因工程 科學普及 科學探索 專題其他

數了20年,科學家為何還在爭論人到底有多少個基因

2018-06-29
人到底有多少個基因
數了20年,科學家為何還在爭論人到底有多少個基因?
原創: Nature自然科研 Nature自然科研

原文以New human gene tally reignites debate為標題

發布在2018年6月19日的《自然》新聞上

原文作者:Cassandra Willyard

研究人員對人類基因組進行測序已有十五年左右的時間,但是人類究竟有多少基因,仍未有統一答案。


一群微醺的遺傳學家、美國紐約州冷泉港的一間酒吧、純粹的猜測,這些元素構成了估算人類基因組基因數目的最初幾次嘗試之一。

在人類基因組項目完成十多年后,鑒定基因仍然是一個挑戰。

來源:Alan Phillips/ Getty

時間回到2000年,當時人類基因組測序仍處于繪制草圖的階段;遺傳學家則在進行一場“豪賭”:人類究竟有多少個基因。有的認為有幾萬,有的認為有幾十萬。將近二十年過去了,手握實際數據的科學家們依然無法就這一數字達成一致意見——他們認為這個知識缺口會阻礙人們發現疾病相關的基因突變。


5月29日,人們為填補這個缺口而做的最近一次嘗試,其結果發布在了預印本服務器BioRxiv上。這項研究使用了來自數以百計的人體組織樣本的數據,發現了約5000個之前未曾發現的基因,其中近1200個帶有制造蛋白質的指令。得出的蛋白質編碼基因總數超過21000個,較之前的估算——20000個左右——有了較大提升。


然而很多遺傳學家并不相信所有這些新基因都能經受住學界進一步的推敲。他們的批評凸顯了鑒定新基因,甚至定義基因是什么有多么地困難。


美國約翰·霍普金斯大學的計算生物學家Steven Salzberg說:“人們在這一領域已經努力了20年,但卻依然沒有得到答案。”正是他的團隊得出了最新的基因計數。


難下定論

2000年,基因組學學界對能發現多少個人類基因的問題爭論不斷,在這樣的背景下,現任歐洲生物信息學研究所(EBI)聯席主任的Ewan Birney發起了一項名為GeneSweep的比賽。他在一次遺傳學年會期間在一間酒吧里下了第一筆賭注,比賽最終吸引了超過1000名參與者,總獎池達3000美元。針對基因數目的下注范圍低至26000個以下,高至312000個以上,平均在40000個左右。時至今日,人們的預估范圍已經縮小了——大多數估計都在19000至22000個之間,但分歧依然存在(詳見“基因計數”)。

來源:M. Pertea & S. L. Salzberg

考慮到分析數據、分析工具和剔除假陽性的標準的不同,基因計數可能存在差異。在最近的這次計數中,研究人員選用了一個規模更大的數據集、與以往不同的計算方法以及一個較寬泛的基因定義。


Salzberg團隊使用的是來自基因型-組織表達(GTEx)項目的數據。GTEx對幾百具尸體的30多種不同組織的RNA進行測序。RNA是DNA和蛋白質中間的媒介。研究者想鑒定出編碼蛋白質的基因和那些非編碼但仍然在細胞里扮演重要角色的基因,因此他們把GTEx的9000億微小RNA片段組裝起來與人類基因組進行比對。


然而僅憑一段DNA可以被表達為RNA這一點,并不能說明它就一定是一個基因。因此,團隊嘗試采用了一系列手段濾除數據噪音。例如,他們把自己得到的結果與其它物種的基因組進行比較,這背后的邏輯是親緣關系較遠的生物間共有的序列很可能是因為有某種用處而被演化所保留,所以這些序列有可能是基因。


最后,研究團隊得到的是21306個蛋白質編碼基因和21856個非編碼基因——遠遠超過目前使用最廣泛的兩個人類基因數據庫。EBI維護的GENCODE基因數據庫包括19901個蛋白編碼基因和15779個非編碼基因,美國國家生物信息技術中心(NCBI)運行的數據庫RefSeq則包括20203個蛋白編碼基因和17871個非編碼基因。


NCBI的基因組研究人員、RefSeq前負責人Kim Pruitt認為數目上的差異在某種程度上可能是由Salzberg團隊所分析的數據量導致的。另外還有一個重大的區別:GENCODE和RefSeq都依靠手動管理——有專人審核每一個基因相關的證據并做出計入與否的最終決定,而Salzberg團隊則完全由計算機程序來篩選數據。


“如果人們認可我們的基因清單,那么也許幾年后我們將成為人類基因研究領域的權威。”Salzberg如是說。


模棱兩可的計數

但是許多科學家都說他們需要更多的證據才能相信清單是準確的。EBI的計算生物學家Adam Frankish負責協調GENCODE的手動注釋工作,他說他和他的小組掃描了Salzberg團隊鑒定出的約100個蛋白質編碼基因。根據他們的評估,其中似乎只有一個是貨真價實的編碼基因。


Pruitt的團隊檢查了十幾個Salzberg小組得到的新蛋白編碼基因,但發現沒有哪一個能滿足RefSeq的標準。其中一些與似乎屬于逆轉錄病毒基因組的部分區域重疊(這些病毒過去侵入了人類祖先的基因組),而另一些則屬于其它重復片段——它們很少被翻譯成蛋白質。


但Salzberg認為有些重復序列可以被認為是基因。ERV3-1就是其中一例:它被收錄在RefSeq中并且編碼一種在結直腸癌中過表達的蛋白質。Salzberg也承認他的團隊所發現的新基因還有待他們自己和其他研究組的進一步驗證。


基因并沒有一個明確且不變的定義,這使得計數工作變得更為復雜。生物學家過去認為基因就是編碼蛋白質的序列,但后來了解到一些非編碼的RNA分子在細胞里也起重要作用。裁定哪些序列是重要的、應該被視為基因,是存在爭議的,這或許可以解釋Salzberg與其他人的計數之間存在的部分差異。


瑞士日內瓦大學的遺傳學家、GTEx項目的聯席主席Emmanouil Dermitzakis認為,Salzberg團隊鑒定出的基因至少有一部分仍可能被證明有效。考慮到GTEx數據集巨大的規模,在看到該研究團隊得出的蛋白質編碼基因計數較之前增加5%時,他并沒有感到太驚訝。


準確掌握人類基因的全部數量對于揭示基因與疾病之間的關聯具有重要意義。Salzberg說沒有被統計進來的基因即便是帶有致病的突變,也常會被人們忽略,但Frankish則認為貿然添加新基因亦有其風險。被錯誤計入的基因可能會誤導遺傳學家,導致真正的問題被無視。


數據庫不一樣,基因數目就不一樣,Pruitt認為這對研究人員來說是個棘手的問題。“人們只需要一個答案,”她補充道,“可生物學是很復雜的。”ⓝ

Nature|doi:10.1038/d41586-018-05462-w



雙胞胎太空實驗,DNA發生神秘突變
轉基因已經OUT,基因編輯食物或會端上餐桌
DNA譯碼,身體生病是因為意識生了病
一篇文章揭秘轉基因食品真相
用DNA做的「有機計算機」可以處理人體內的數據
人類胚胎DNA是條不得跨越的界線
市民起訴農業部升級:北京法院追加孟山都為轉基因連帶被告
世衛組織稱孟山都農達除草劑可能致癌
日媒:美國借轉基因技術謀求世界糧食霸權
最新研究發現人體存在145個“外來基因”
文化如何影響人類的基因
許智宏院士在轉基因問題的立場是科學和理性的嗎
注入人腦基因Foxp2老鼠破解迷宮變快了
醫學諾獎得主:警惕轉基因對物種的影響
湖北多地種轉基因大米 農民種兩稻一種吃一種賣
科學家通過基因剪輯技術首次“刪除”艾滋病毒
轉基因利益集團浮出水面:科研工作者與大型企業聯姻
藏人帶有已滅絕的古人類基因
老鼠吃轉基因長腫瘤的論文經過同行評議,再次發表!
中國出臺:轉基因食品未標識不得銷售
轉基因食品辨識上的兩個誤導
科學家稱:我們的DNA此時此刻正在變異
廣州軍區:禁向駐軍提供轉基因糧油
武漢大米檢測三成樣品含轉基因 公眾被實驗十年
美將用雙胞胎對比太空對DNA的影響
袁隆平:轉基因不能一概而論 抗蟲抗病者應特別謹慎
表觀遺傳學及其相關研究進展
表觀遺傳學
環境如何影響人類基因
美國孟山都陷入轉基因漩渦 成消費者公敵
生物學家:遺傳非決定一切 思維可掌控基因
農業部“引導”骨干種子企業研發轉基因新品種
美或搜集華人基因 欲用基因戰不戰而勝
農業部:堅定不移推進轉基因重大專項研究
陳錫文:中國食用轉基因農產品只有木瓜
農業部:轉基因研發要積極 推廣應用要慎重
袁隆平:正研究把玉米基因轉入水稻 可提高產量
美日高價進口中國非轉基因大豆:不僅吃還做藥
轉基因種子能不能留種
科學家發現了DNA暗藏的第二套編碼
專家:轉基因技術滅絕人類 學界支持因利益誘惑
新技術可確定DNA源于母親還是父親
美國科學家發現DNA生物時鐘
農業部刊文:吃轉基因食品會導致絕育純屬造謠
上海自貿區禁止投資轉基因
事實勝于雄辯——“轉基因”不增產
院士聯合簽名發公開信稱郎咸平等造謠轉基因
含有草甘膦的轉基因大豆嚴重危害人類健康
我為郎咸平說幾句話-轉基因事件
如何辨別轉基因農產品和傳統農產品
安徽轉基因大米調查:常規檢測無轉基因一項
如何科學理智地對待轉基因產品?
轉基因作物影響生豬健康 胃炎比例高于傳統飼養
Science:大型研究尋找“高學歷”基因
農業部公布我國部分轉基因食品名單
轉基因抗蟲效果存疑 基因污染或致超級雜草
隱藏在轉基因作物中的“秘密病毒”
轉基因三十問
轉基因玉米和非轉基因玉米的營養區別
孟山都在農業院校頒獎攬人才
“反轉基因斗士”倒戈,卻稱自己不吃轉基因
人類細胞中發現四螺旋DNA結構
領導基因rs4950決定你是否未來會當領導
饒毅:轉基因期待理性
孟山都第一帝國興衰史
我們97%的DNA都有著更高級的目的而不是“垃圾”
“垃圾DNA”的逆襲
科學家發現人類400萬基因開關有助控制疾病
參加《“黃金大米”疑云》網絡訪談感想及再說倫理問題
“黃金大米試驗合法且有意義”
科學家成功將一本書的內容寫進DNA序列
全球首批“轉基因嬰兒”誕生引發倫理爭論
中國輸歐大米踏"刃"起舞 歐盟將實施最嚴苛檢查
巴西五百萬農戶起訴孟山都公司
教授質疑孟山都轉基因大豆審批 美國廣告成科學依據
DNA測序和活體細胞內實現DNA可擦寫數據存儲
英公眾與科學家爆發“轉基因沖突”
日研究發現一個基因能遏制癌癥
印度: 禍起“轉基因棉花” 13年棉農自殺近20萬
中山大學年輕帥氣教授找到調節基因突變的方法
袁隆平談轉基因實驗
科學家發現離婚基因-催產素受體基因
基因組序列新技術重現遠古人類DNA全貌
匈牙利摧毀了孟山都所有的轉基因玉米田
我國進入RNA診斷新時代
諾貝爾得主稱DNA分子可以被“空間傳送”―量子點印記實驗效果
男性晚育更易引起基因突變但“效果”存在不確定性
歐盟加強管控中國大米產品值得關注
轉基因后院起火,孟山都表現異常
自殺行為與自殺基因有關
科學家已證實DNA能夠通過詞匯和頻率 進行重新編碼
紐約大學科學家研制出可自我復制的人造DNA結構
轉基因農作物安全評估
微小RNA研究報道匯總
微小RNA調控人體內靶基因表達的方式影響人的生理功能
曹明華:轉基因食物在美國的爭議
基因預測能“定命”你信不信
基因組分析和漸進性的演化改變
美用DNA制造出首個人造神經網絡
研究發現與男性不育有關的基因突變
全球轉基因作物累計種植面積逾10億公頃
基因改造豬角膜皮膚內臟都可移植給人
全世界都在反對轉基因ZT
人類學家顛覆經典理論:文化發展源自基因突變
中國轉基因猴子誕生記
鄭風田:印度為什么拒絕了轉基因品種
轉基因玉米惹禍
基因在腦記憶區發育中扮關鍵角色
劃時代的論文與劃時代的問題
基因糧食的人體危害
中國科學家發現白癜風易感基因
基因研究再次證明長壽是遺傳的
轉基因食品是天使還是魔鬼
基因譜分析證實尼安德特人與現代人交配
科技隨筆:基因并不決定一切
英國Nature基因組研究
中國科學家首次成功解析肥胖蛋白基因結構
湖北等地轉基因水稻形成規模種植
人體“第二基因組”初現端倪
綠色和平調查報告稱轉基因作物代價慘重
Science基因地理組計劃
基因預測:遇見未來的自己
基因歧視第一案探觸社會公平
染色體:諾獎得主的不完全答案
公眾DNA測試意義何在
轉基因棉引發減產之憂
基因未來(Genentech)
GENETIC CLUES TO LUNG CANCER AMONG SMOKERS
dna,基因1 dna,基因2

本欄目主要介紹基因工程方面,包括人類基因組計劃、轉基因、基因技術、數了20年,科學家為何還在爭論人到底有多少個基因等。特別關注有關人與文化方面的研究。

『科學頻道首頁』 『本欄頁首』 『關閉窗口』

神龙宝石救援彩金