文章轉(zhuǎn)載自“安捷倫診斷與基因組學(xué)”公眾號(hào)
全外顯子組測(cè)序的應(yīng)用場(chǎng)景越來(lái)越多,根據(jù)不同應(yīng)用場(chǎng)景打造更適配的檢測(cè)產(chǎn)品,使之成為一種高效、便捷的測(cè)序方案。
從 2009 年至今,基于 SureSelect 液相雜交捕獲技術(shù),安捷倫持續(xù)推出更優(yōu)秀的 WES 檢測(cè)產(chǎn)品。SureSelect WES V8 即最新上市的產(chǎn)品體系,機(jī)器學(xué)習(xí)驅(qū)動(dòng)的探針鋪設(shè)方式帶來(lái)了更優(yōu)異的數(shù)據(jù)表現(xiàn)和極高的設(shè)計(jì)占比。
區(qū)別于既往 V6/V7,V8 在核心版本之外,還包含 NCV/UTR/CNV Backbone/Mito 等版本,為什么需要這些不同的產(chǎn)品組合以及它們各自適應(yīng)于什么樣的應(yīng)用場(chǎng)景,則是本文的重點(diǎn)。
我們將從基因組結(jié)構(gòu)與功能(上篇)、應(yīng)用案例(下篇)兩個(gè)維度進(jìn)行闡述。
圖 1:安捷倫最新 SureSelect WES V8 產(chǎn)品家族
WES+NCV
NCV: Non-coding Clinical Variants
存在即合理,BUT,存在即有用嗎?
事實(shí)上,每個(gè)基因中都有編碼區(qū)與非編碼區(qū),非編碼區(qū)在對(duì)基因的表達(dá)調(diào)控中發(fā)揮重要作用,如啟動(dòng)子,增強(qiáng)子,終止子等都位于該區(qū)域。所以,非編碼序列并非“垃圾 DNA”。
人類基因組中 98.5% 是非編碼序列,非編碼區(qū)雖然不編碼蛋白質(zhì),但對(duì)于遺傳信息表達(dá)是不可缺少的。
對(duì)遺傳病而言,近 90% 的易感變異位于基因組非編碼區(qū),其下游調(diào)控機(jī)制未知,亟需解析其分子調(diào)控機(jī)制,才能將基因組學(xué)的發(fā)現(xiàn)最終轉(zhuǎn)化為臨床藥物靶標(biāo)。
人類基因組非編碼區(qū)的注釋和變異致病性的預(yù)測(cè),及變異機(jī)制的解析,是當(dāng)前遺傳學(xué)領(lǐng)域的研究熱點(diǎn)和難點(diǎn)。
2022 年 7 月,Genome Medicine 雜志發(fā)表了一篇《對(duì)基因組非編碼區(qū)發(fā)現(xiàn)的變異的臨床注釋建議》的文章,為改善罕見(jiàn)病的診斷,以及評(píng)估其他非編碼變體的致病性提供了更明確的指導(dǎo)。
在腫瘤的研究當(dāng)中,non-coding somatic mutations 也非常重要,例如肝癌等多種腫瘤中的 TERT 啟動(dòng)子、T 細(xì)胞急性淋巴細(xì)胞白血病中 TAL1 基因的增強(qiáng)子,結(jié)直腸腫瘤中 CTCF/cohesin-binding sites 等等。
非編碼基因組具有高突變率和重復(fù)性的特點(diǎn),這就導(dǎo)致了較高的背景突變以及潛在的 mapping errors;因而,對(duì)于功能性非編碼區(qū)域的識(shí)別與特征分析,相比于編碼區(qū)的驅(qū)動(dòng)突變,有著獨(dú)特的挑戰(zhàn)。
圖 2:基因結(jié)構(gòu)示意圖
相比于其他同類產(chǎn)品,安捷倫 SureSelect WES V8+NCV 產(chǎn)品,更好的覆蓋了 HGMD,ACMG,ClinVar 數(shù)據(jù)庫(kù)中的致病和可能致病的遺傳變異,為遺傳學(xué)家提供了更有力的研究復(fù)雜遺傳疾病的利器。
安捷倫 SureSelect WES V8+NCV 的覆蓋情況
WES+UTR
先來(lái)看看什么是 UTR?
UTR: 即 untranslated region,非翻譯區(qū),是 mRNA 分子兩端的非編碼片段。
當(dāng)從 DNA 轉(zhuǎn)錄為成熟 mRNA 后,會(huì)從第一個(gè) AUG (起始密碼子)開始翻譯產(chǎn)生蛋白,這即是我們熟悉的中心法則。
但是請(qǐng)注意,翻譯起始位點(diǎn)并不是從第一個(gè)外顯子最前端開始的,而是 5’ 端第一個(gè) AUG,那么,在起始密碼子之前的序列就是 5’UTR exon (untranslated region)(即圖 2 中第三個(gè)條的深藍(lán)色部分);相應(yīng)的,在 3’ 端的終止密碼子之后,也有一部分不翻譯的外顯子被稱為 3’UTR exon (即圖 2 中第三個(gè)條的后端綠色區(qū)域)。
簡(jiǎn)單一個(gè)小題目,快速記憶:哪個(gè)區(qū)域參與基因組翻譯過(guò)程?
A:3’UTR exons
B:5’UTR exons
C:CDS exons
點(diǎn)擊下方空白處查看答案
正確答案:C
5’UTR 與 3’UTR,其長(zhǎng)度是多少呢?
真核生物 5′ 非翻譯區(qū)的中位數(shù)長(zhǎng)度一般約為 150 核苷酸(nt),但有些可長(zhǎng)達(dá)數(shù)千堿基。有些病毒和細(xì)胞的基因有著非常長(zhǎng)和結(jié)構(gòu)性的 5' 非翻譯區(qū),這可能會(huì)影響基因表達(dá)。平均而言,3′ 非翻譯區(qū)往往是 5′ 非翻譯區(qū)的兩倍長(zhǎng)。
舉一個(gè)例子:
CDK4 基因,在乳腺癌中是非常重要的藥物靶點(diǎn)。它的第一個(gè)外顯子加上第二個(gè)外顯子的前半部分,都是 5'UTR Exon,從 exon2 中間位置的 ATG 才開始翻譯(圖 3 中紅色方框)。
圖 3:CDK4 基因的部分結(jié)構(gòu)示意圖
UTR 區(qū)域有許多調(diào)控元件, 例如,uORFs(upstream ORFs)、IRESs(Internal ribosome entry sites,內(nèi)部核糖體進(jìn)入位點(diǎn))、poly(A) 信號(hào)、miRNA 結(jié)合位點(diǎn)等。
5’UTR 主要功能包括:調(diào)控 mRNA 出細(xì)胞核,核糖體招募,調(diào)節(jié)翻譯起始、調(diào)節(jié) mRNA 穩(wěn)定性等等;
3'UTR 主要功能包括:調(diào)節(jié) mRNA 的穩(wěn)定性,調(diào)控 mRNA 的定位表達(dá),調(diào)控 mRNA 的翻譯,通過(guò)結(jié)合多個(gè) RNA 綁定蛋白來(lái)行使調(diào)控功能等等。
圖 4. 5’ and 3’UTR elements and how they are co-opted in cancer.
引自:Trends Cancer. 2019 April ; 5(4): 245–262. doi:10.1016/j.trecan.2019.02.011.
關(guān)于這些調(diào)控元件的生物學(xué)作用,例如在學(xué)習(xí)與記憶、神經(jīng)退行性疾病、惡性腫瘤等疾病中的作用,依然有很多待回答的科學(xué)問(wèn)題。
對(duì)于真核 UTR 的結(jié)構(gòu)和功能開展廣泛和深入的研究,去闡明各類基因翻譯背后的精密調(diào)控機(jī)制,為針對(duì)更精細(xì)翻譯水平的新診療策略研究鋪平道路,是當(dāng)前研究的重要問(wèn)題。
安捷倫 SureSelect WES V8+UTR 的覆蓋情況和測(cè)序表現(xiàn)
WES+CNV backbone
CNV(Copy number variation,拷貝數(shù)變異)是人類遺傳病的一大重要原因,由基因組發(fā)生重排而導(dǎo)致。
與 CNV 變異相關(guān)的疾病示例
隨著測(cè)序技術(shù)的快速發(fā)展,被鑒定發(fā)現(xiàn)的 CNV 數(shù)量越來(lái)越多,已有超過(guò)數(shù)萬(wàn)個(gè) CNV 位點(diǎn)被記錄在 DGV 數(shù)據(jù)庫(kù)(Database of Genomic Variants)中,這些 CNV(主要為微缺失和微重復(fù))所覆蓋的染色體范圍約占人類全基因組的 20% 以上。
CNV 在全基因組范圍內(nèi)都可能發(fā)生,如果僅針對(duì)外顯子區(qū)檢測(cè)會(huì)導(dǎo)致大量的疾病相關(guān) CNV 的漏檢。為了更全面的檢出 CNV,需專門添加可提高 CNV 檢出準(zhǔn)確度的高密度 SNP 骨架。這樣一方面有利于提高檢測(cè)分辨率,另一方面可以覆蓋沒(méi)有基因編碼區(qū)的致病性區(qū)域。
安捷倫 OneSeq 可在一次經(jīng)濟(jì)有效的 NGS 分析中檢索所有的變異類型,快速發(fā)現(xiàn)疾病有關(guān)的新型變異,揭示疾病相關(guān)的生物學(xué)通路。安捷倫提供了兩套不同檢測(cè)分辨率的 SureSelect OneSeq CNV Backbones,分別可以實(shí)現(xiàn) 1 Mb CNV 檢測(cè)分辨率 和 300 kb CNV 檢測(cè)分辨率。
OneSeq CNV 骨架捕獲探針設(shè)計(jì)用于靶向具有最佳 GC 含量和可定位的基因組區(qū)域。這樣即可產(chǎn)生高度一致的測(cè)序深度分布,并最終獲得可靠的全基因組 CNV 檢測(cè)。
而且,OneSeq CNV 骨架捕獲探針可與任意 SureSelect 目錄外顯子組聯(lián)合使用,以進(jìn)行 SNV、插入和缺失檢測(cè)。即使在 CNV 骨架捕獲探針存在的情況下,這些區(qū)域仍然具有極佳的覆蓋率,從而可確保檢測(cè)的準(zhǔn)確性。
WES+Mito
線粒體是普遍存在于生物體細(xì)胞內(nèi)提供能量的細(xì)胞器,而且線粒體中含有遺傳信息,是一個(gè)獨(dú)立的遺傳體系。
線粒體 DNA 示意圖
人類線粒體基因組(Mitochondria DNA,mtDNA)的全長(zhǎng) 16.6kb, 是一種雙鏈環(huán)狀 DNA,不具有內(nèi)含子 — 外顯子結(jié)構(gòu),僅含有 37 個(gè)基因。線粒體基因組具有獨(dú)特的特征,包括結(jié)構(gòu)簡(jiǎn)單、編碼區(qū)域高度保守、母系遺傳、重組率低、拷貝數(shù)高、異質(zhì)性等。
部分線粒體疾病示例
每一個(gè)細(xì)胞中含有數(shù)百至數(shù)千個(gè) mtNDA 拷貝。通常 mtDNA 具有異質(zhì)性,即同時(shí)存在突變以及野生型的 mtDNA,并且每個(gè)細(xì)胞、組織中的 mtDNA 的突變比例及拷貝數(shù)并不一致。
線粒體 DNA(mtDNA)突變,會(huì)導(dǎo)致多種線粒體遺傳病和線粒體功能異常,如帕金森綜合征、阿爾茲海默癥、糖尿病、腫瘤等。捕獲完整的線粒體基因組有利于對(duì)線粒體基因病的檢測(cè)與研究。
以 SureSelect WES V8 為核心,安捷倫提供了以上優(yōu)異的產(chǎn)品組合,并可實(shí)現(xiàn)個(gè)性化定制,滿足不同應(yīng)用場(chǎng)景的基因組學(xué)研究項(xiàng)目。SureSelect WES 產(chǎn)品深度解析(下篇)將聚焦應(yīng)用案例,展示 SureSelect 產(chǎn)品的廣泛應(yīng)用。
以上內(nèi)容僅限研究使用。不可用于診斷目的。
友情提醒 |
本信息真實(shí)性未經(jīng)中國(guó)工程機(jī)械信息網(wǎng)證實(shí),僅供您參考。未經(jīng)許可,請(qǐng)勿轉(zhuǎn)載。已經(jīng)本網(wǎng)授權(quán)使用的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:中國(guó)工程機(jī)械信息網(wǎng)”。 |
特別注意 |
本網(wǎng)部分文章轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。在本網(wǎng)論壇上發(fā)表言論者,文責(zé)自負(fù),本網(wǎng)有權(quán)在網(wǎng)站內(nèi)轉(zhuǎn)載或引用,論壇的言論不代表本網(wǎng)觀點(diǎn)。本網(wǎng)所提供的信息,如需使用,請(qǐng)與原作者聯(lián)系,版權(quán)歸原作者所有。如果涉及版權(quán)需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)?5日內(nèi)進(jìn)行。 |