Hi-C輔助基因組組裝

每個基因組都需要一個Hi-C

產品介紹

Hi-C技術是將染色質構象捕獲與高通量測序結合的一種新技術。 該技術將線性距離遠、 空間結構近的DNA片段進行交聯富集后Pair-end測序, 通過對測序數據分析即可揭示染色質的各DNA各區段的交互作用,從而推導出基因組的三維空間結構和基因之間可能的調控關系。

23
染色體分級示例圖 (Ezgi Süheyla et al., Nature Plants 2018)

不借助遺傳圖將基因組掛載到染色體水平。每一個基因組都需要一個Hi-C

HI-C特點

90%掛載到染色體
不需要借助群體數據
相對遺傳圖既省時又省力
智能的自動排圖算法

Hi-C技術原理

 

Hi-C建庫測序實驗采用Hi-C的類型是in situ Hi‐C,主要包括細胞交聯、內切酶酶切、末端修復、環化、DNA純化及捕獲和二代上機測序等步驟。

Hi-C技術應用方向

Hi-C輔助基因組組裝

Hi-C染色質結構變異檢測

Hi-C染色質互作研究

66

 

 

Hi-C輔助陸地棉與海島棉基因組染色體水平組裝

Wang et al.,Nature Genetics 2018)

 

 

Hi-C輔助陸地棉染色體結構變異檢測

(Yang Z?et al.,Nature Communications 2019)

77
88

 

 

 

Hi-C輔助TAD結構研究

Wang et al., Nature Commuications 2018)

Hi-C輔助基因組組裝優勢

 

1、Hi-C無需群體,單一個體就能實現染色體定位

很多物種都無法構建遺傳群體,包括大部分高等動物、野生動植物、林木、果樹等等。Hi-C是通過染色體上空間距離、線性距離的不同而導致的交互頻率的不同來完成染色體的定位,所以不需要構建群體。

2、標記密度更大,序列定位更完整

相比遺傳圖譜,染色質之間的交互頻率具有更高的標記密度,如此高密度的圖譜不僅可以掛載上長的Scaffold,較短的Scaffold也可以被定位,所以通過Hi-C技術,一般可以將90%以上基因組序列定位到染色體。

3、可以對已組裝的基因組進行糾錯

通過Scaffold間的交互頻率大小,可以對已組裝的基因組序列進行糾錯。

分析內容

1 .數據統計和過濾;

2 .Hi-C文庫評估;

3.Hi-C染色體定位;

? ? ? 組裝序列染色體群組劃分;

? ??? 組裝序列各群組內排序;

? ??? 組裝序列各群組內定向;

4.?Hi-C定位后統計評估;

? ? ?? 近緣物種參考基因組評估;

? ? ?? 遺傳標記評估;

hic-zhanghl0721

百邁客HiC技術優勢

完成近300個物種,近千個文庫構建;
針對物種推出定制化內切酶服務;文庫含酶切位點有效數據比例最高達93%以上,平均比例高達68%;
實現多倍體物種的Hi-C輔助基因組組裝,掛載效率最高達100%;
實驗+生物信息分析專利保護;
獨創可視化調圖軟件:軟件實現block移動、block取反、撤銷和重做,實現用戶管理功能。

服務流程

  • 樣品寄送

  • 建庫測序

  • 數據分析

  • 出具報告

  • 售后答疑

50+項目分析人員

30X更高深度覆蓋

60+的項目分析案例

優化的交互式報告

11年+項目分析經驗

專業而熱情的售后服務

三個分布式集群服務器

閃電般的分析速度

三代+光學+HIC拯救復雜基因組—-大麥基因組Nature篇

新鮮出爐的消息,新版大麥基因組又發nature啦!
大麥基因組到底經歷了怎樣的困局?到底是什么解救了大麥基因組?后續大麥基因組還會發Nature嗎?重復序列比例過高如何解決?新技術的到來更新基因組的必要性到底如何?

大麥基因組的困局:
大麥作為重要的經濟作物,其在農業上的重要性毋需本編過多描述。大麥基因組破解工作本處于第一梯隊,為何初版基因組在2012年才發布呢?原因就是大麥基因組的屬于高重復的復雜基因組,通過當前技術是無法很好解決的。雖然只有7條染色體,但是基因組的重復序列比例高達84%,同時基因組大小在5.1 Gb,相比于人,水稻等簡單基因組,技術上存在很大的難度。
和人類基因計劃一樣,通過集齊全世界科學家的努力,構建了大量的BAC文庫,得到了物理圖,同時基于遺傳圖譜,得到了初版基因組。雖然通過綜合各種技術,得到的了基因組序列在4Gb 左右,但其可靠性,準確性難以保障。就拿二代數據來說,當時只組裝出了1.9 Gb contig的序列,指標更是無從說起。雖然全世界科學家的努力不可否認也不容質疑,但現在看來,初版大麥基因組給人的感覺只能是有勝于無!

到底是什么解救了大麥基因組?
廢話不多說,看看人家的組裝結果(表1)。

文章中使用的技術手段包括BAC+Illumina+BioNano+HiC+Genetic Map,得到了4.79 Gb基因組序列,最終利用HIC和遺傳圖分別將95%和97%的序列掛到了染色體的水平。相比于初版基因組,組裝水平高了不只是一大截啊,這就是技術上的勝利!話說,基于此版基因組,預測出的基因編碼區至占到了整個基因組的1.4%,而轉座原件(重復序列的一個大類)卻占到了整個基因組的80.8%。所以說,大麥基因組的難度的確大??!
請看文章中描述的組裝技術路線:
構建87085個BAC,利用Hiseq 進行PE及MP文庫測序得到4.5 Tb二代數據,之后將每個BAC的測序數據分別進行組裝;
通過物理圖譜將BAC間的關系確定;
利用遺傳圖+光學圖譜,通過組裝好的BAC序列構建Superscaffold;
利用群體遺傳圖(POPSEQ)進行Superscaffold分組(97%分組);
利用HiC進行Superscafold排序及定向(95%掛載);
基因組評估+基因預測+后續分析。
文章中有哪些意思的點?(文章中都做了啥分析?)
1. 染色體間外大小臂之間的交互
通過HIC熱圖作者發現無論是染色體內部還是染色體間的長短臂之間都存在較強的交互信號。按照HIC的原理來說,染色體上空間作用越強則實際DNA間的物理距離越近,染色體大小臂及不同染色體間的相互作用應該是極弱的。為了找出原因,作者通過對大麥葉核間期的細胞進行著絲粒及端粒熒光雜交,發現所有染色體的端粒和著絲粒在空間上的位置都純在極性,且排列方式也極其相似,不同染色體間的大小臂其實在空間上距離很近,因此確實存在染色體內外大小臂之間大量的交互作用的可能。


染色體上重復序列及基因密度
利用染色體位置信息,通過對20-mer頻率將染色體進行劃分成了三種區域,每種區域上在基因密度,重組率,LTR插入時間以及GC含量上都存在一定的規律。

基因家族分析
通過對大麥基因組進行基因家族收縮擴張分析發現,收縮擴張的家族中最顯著的部分都與植物防御及抗病相關。另外,作者對麥芽品質相關的amy家族及糖代謝相關的SWEET家族進行了亞家族分類,多倍化及表達模式相關的分析。


遺傳多樣性及單體型分析
基因組在分子遺傳育種中具有極其重要的作用,本文中作者對來自歐洲的冬季及春季小麥兩個群體進行了遺傳多樣性及單體型相關分析。最終發現,這兩個群體在不同的染色體位置上的多樣性程度及連鎖強度都存在不同特點。如果沒有一個好的基因組,很難全面了解群體間的變異情況,會給功能育種上帶來困難。


大麥基因組還能發Nature嗎?重復序列比例過高如何解決?
雖然此版基因組已經發表,但是本編覺得就目前的技術而言,大麥基因組還是有很大的提升空間。有咩有發現,此版大麥基因組沒有使用當前主流基因組所使用的三代測序技術?雖然此版本基因組相較于第一版基因組提升較大,但是基因組裝的過于零碎仍舊是事實。畢竟此版基因組的contigN50才79Kb,而super scaffold N50也才1.9Mb。一旦過于零碎,肯定會導致許多基因無法被預測出,這將對后續基因組的功能解讀及研究增加困難。目前,三代測序技術在基因組完整性上能夠有很好的發揮,同時在基因組結構變異上也能夠有所保障。針對大麥基因組,已經有了如此多的數據,本編認為,如果后續如果再加入純三代測序數據,contigN50達到Mb級別是極其輕松的!在這里可以和大家透露下,本編最近接觸到另一個高重復的物種(預測出的重復序列比例高達84%),通過純三代+HiC組裝,在組裝指標及完整性上都秒殺了此版本的大麥。所以大麥還會不會發Nature,大家都應該明白了!

A chromosome conformation capture ordered sequence of the barley genome

成功案例

什么是Hi-C技術?

Hi-C技術是染色質構象捕獲技術( Chromosome conformation capture )與高通量測序( High-throughput sequencing )結合衍生的一種技術。主要是利用全基因組范圍內整個染色質DNA在空間位置上的關系,對染色質內全部DNA相互作用模式進行捕獲,結合生物信息學方法,來獲得染色體水平的基因組序列并得到染色質三維結構信息。此外還可以并與Chip-seq、轉錄組數據聯合分析,從基因調控網絡和表觀遺傳網絡來闡述生物體性狀形成的相關機制。

Hi-C在輔助基因組組裝時有什么作用?
  1. Hi-C最主要的作用是將零散的基因組序列錨定到染色體上(這一點類似遺傳圖譜);
  2. 還可以對組裝的基因組進行糾錯處理;
  3. 在某種程度上進一步提升Contig N50.
Hi-C技術與遺傳圖譜的差異?
  1. Hi-C應用單個個體就可以完成染色體構建;
  2. Hi-C掛載染色體效率高達90%以上;
  3. 但Hi-C技術不能進行QTL定位。
Hi-C技術的樣品要求?
  1. 植物樣品要選擇活體幼苗;
  2. 動物樣品首選全血;
  3. 其他樣品請咨詢百邁客。
快手上劈砖头能赚钱吗 怎么定义胆码和拖码 极速11选五技巧 七星彩前四位打法技巧 江西11选5遗漏 爱配资网址导航 四川快乐12开奖结果图,一 幸运飞艇历史开奖结果筛选 七位数今天预测号码 东方6加1走势图大中小 江西11选5开奖过程