RELATEED CONSULTING
在线咨询
选择下列产品马上在线沟通
服务时间:8:30-17:00
你可能遇到了下面的问题
关闭右侧工具栏
高通量测序
  • 作者:admin
  • 发表时间:2017-10-19 10:02
  • 来源:未知

1.    高通量量测序技术及其发展现状

高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(Next-generation" sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
高通量测序技术堪称测序技术发展历程的一个里程碑,该技术可以对数百万个DNA 分子进行同时测序。这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,因此也称其为深度测序(deepsequencing)或下一代测序技术(next generationsequencing,NGS)。
根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA纳米球测序(DNA nanoball sequencing)等。

2.    高通量量测序技术的类型及原理

目前,所说的高通量测序技术主要是指454 Life Sciences 公司、ABI 公司和Illumina公司推出的第二代测序技术以及Helicos Heliscope TM 和Pacific Biosciences 推出的单分子测序技术。

图 测序技术发展历程

2.1 第二代测序技术

2005年,454 Life Sciences 公司( 现已被Roche公司收购) 首先推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统,开创了第二代测序技术的先河。该技术的原理是酶级联化学发光反应: 首先将PCR 扩增的单链DNA 与引物杂交,并与DNA 聚合酶、ATP 硫酸化酶、荧光素酶、三磷酸腺苷双磷酸酶、底物荧光素酶和5'-磷酸硫酸腺苷共同孵育。在每一轮测序反应中只加入一种dNTP,若该dNTP与模板配对,聚合酶就可以将其掺入到引物链中并释放出等摩尔数的焦磷酸。焦磷酸盐被硫酸化酶转化为ATP,ATP 就会促使氧合荧光素的合成并释放可见光。CCD 检测后通过软件转化为一个峰值,峰值与反应中掺入的核苷酸数目成正比。
此后,Illumina 公司和ABI 公司相继推出了Solexa和SOLiD(supported oligo ligation detetion)测序技术。它们与焦磷酸测序法的原理类似,核心思想都是边合成边测序(sequencing by synthesis),即生成新DNA 互补链时,要么加入的dNTP 通过酶促级联反应催化底物激发出荧光,要么直接加入被荧光标记的dNTP 或半简并引物,在合成或连接生成互补链时释放出荧光信号。通过捕获光信号并转化为一个测序峰值,获得互补链序列信息。由此可见第二代测序技术无需进行电泳,操作极为简便。这不但大大节省了成本和时间,而且可以在芯片上进行高通量分析。该测序技术单次反应可以对数以百万计的样品进行分析,这样庞大的测序能力是传统测序仪所不能比拟的。假如利用这种方法进行人类基因组的测序,那么在数天内就可以完成,而且成本也将大大降低。

图 二代测序的原理图。不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息
 
Illumina公司目前拥有三种测序平台,分别为HiSeq 2000、HiSeq 1000、Genome Analyzer IIx ( http://www.illumina.com/ );ABI 公司则主要是SOLiD 3 和SOLiD 4 两个测序平台。HiSeq 2000 测序平台单次反应可以读取200G的数据,而SOLiD 4 仅为100G 左右。从通量这个最直观的数字看来,HiSeq 2000领先于SOLiD 4。更高的通量就意味着更低的成本,利用HiSeq 2000以30倍的覆盖度对两个人类基因组进行测序,每个基因组的费用不到1万美元(http://www.illumina
.com/systems /hiseq_2000.ilmn)。就测序读长来说,454 测序平台读长最长,目前已经达到400nt。因此,454 平台比较适合对未知基因组从头测序,但是在判断连续单碱基重复区时准确度不高。Solexa 测序读长较454 短,仅为100nt 左右,但测序通量高、价位低,适合基因组重测序等。SOLiD 读长也较短,但测序精度较高,特别适合SNP 检测等。

图 不同厂商提供的NGS技术特征

2.2 单分子测序技术

在第二代测序平台不断完善和广泛应用的同时,以对单分子DNA进行非PCR测序为主要特征的更新的测序技术也初显端倪。2008年4月Helico BioScience公司的Harris等在Science上报道了他们开发的基于全内反射显微镜(total Internal reflection microscopy, TIRM) 的测序技术—单分子测序技术。该技术完全摒弃了上述测序平台所基于的PCR扩增的信号放大过程,真正达到了读取单分子荧光的能力。具体原理为: 首先,将待测DNA样品随机打断成小片段,在每个小片段的末端加上poly-dA; 然后,将小片段DNA模板与固定在检测芯片上的poly-dT 引物进行杂交并精确定位,并逐一加入荧光标记的末端终止子。在掺入了单个荧光标记的核苷酸后,洗涤、成像,之后切开荧光染料和抑制基团,洗涤、加帽,允许下一个核苷酸的掺入。这样通过掺入、检测和切除的反复循环,即可实时读取大量序列。随后,他们利用该技术对M13基因组进行重测序。M13噬菌体是一种单链DNA病毒,基因组全长6407个核苷酸。他们共获得了28万条序列,开创了单分子高通量测序的先河。这之后不久,Pacific Biosciences 公司又开发出了另一种单分子测序技术———单分子实时技术(single molecule realtime,SMRT)。该技术利用单分子技术和DNA聚合酶,在聚合反应的同时就可以读取测序产物。SMRT测序技术在测序速度、读长和成本方面有着巨大的优势和潜力。虽然目前的读取速度为3bp/s,但他们声称将在2013年前实现3min测完人类基因组的目标。从而又向1000美元测定一个人类基因组的目标迈出了一大步。
 

2.3 Ion PGM测序技术

与Sanger双脱氧链终止法测序技术相比,上述测序技术在测序速度和成本方面都有了革命性的变革。但是,测序仪的价格非常昂贵。例如,目前Helico BioScience公司的HeliScope测序仪售价近百万美元,这是一般实验室和科研单位所不能承受的。2010年年底,Life Techologies公司推出的Ion Personal Genome Machine (PGMTM) 测序仪价格仅为普通测序仪的1/10,很好的解决了这一问题。Ion PGM测序仪的设计是基于半导体芯片技术,在半导体芯片的微孔中固定DNA链,随后依次掺入ACGT。随着每个碱基的掺入,释放出氢离子,在它们穿过每个孔底部时能被检测到。与其它新一代测序仪相比,它不需要激光、照相机或标记,价格当然要便宜很多。这种独特的流体体系、微体系机械设计和半导体技术的组合,使得研究人员能够在2h内获取从10Mb到1Gb以上高精确度序列(http://www.iontorrent.com/products-ion-pgm/)。

2.4 高通量测序技术的优点

高通量测序技术有三大优点是传统Sanger测序法所不具备的。第一,它利用芯片进行测序,可以在数百万个点上同时阅读测序,把平行处理的思想用到极致,因此也称之为大规模平行测序(massively parallel signature sequencing,MPSS),这一点是大家所熟知的。第二,高通量测序技术有完美的定量功能,这是因为样品中某种DNA被测序的次数反映了样品中这种DNA的丰度。这一点有望取代以前的基因表达芯片技术用于基因表达的研究。第三,成本低廉。利用传统Sanger测序法完成的人类基因组计划总计耗资27亿美元,虽然比预计的30亿美元节省了不少,但仍是一个耗资巨大的工程。而现在利用高通量测序技术进行人类基因组测序,耗资不到传统测序法的1%。
 
表 测序技术与芯片技术的比较
  测序 芯片
检测未知基因 可以检测未知基因 只能检测已知基因
分析内容 分析内容多(可变剪切,融合基因) 可分析内容少
检测范围 比较能反应真实的表达情况(最小1个read,最大10E+6) 限于检测仪的荧光强度和灵敏极限(10E+4)

2.5     高通量测序的参数

Reads 读长
测序深度coverage depth(比如10X、30X)
测序数据量(比如6G、20M等)
覆盖度coverage ratio(比如80%)
PE150 双端测序 SE50 单端测序
注:假设一个基因大小为2M,测序深度为10X,那么获得的总数据量为20M。

3.    高通量测序技术的应用

高通量测序技术的迅猛发展,将基因组学水平的研究带入了一个新的时期,也使经典分子生物科学家对基因组学的认识和思考上升到一个新的水平。高通量测序技术不仅可以进行大规模基因组测序,还可用于基因表达分析、非编码小分子RNA的鉴定、转录因子靶基因的筛选和DNA甲基化等相关研究。

图 测序技术的应用领域。不同物种基因组、不同个体的变异、同一个体中的不同细胞、描述细胞机制等。

高通量测序技术在全基因组测序中的应用

全基因组测序对全面了解一个物种的分子进化、基因组成和基因调控等有着非常重要的意义。但是,高通量测序技术在发展初期由于读长较短,使其在对
未知基因组从头测序( de novo Sequencing) 的应用受到限制,只能用于基因组重测序。基因组重测序是指对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。2008年4月17日的Nature杂志上,美国的科学家发表了首个利用新一代高通量测序技术得到的人类全基因组,这个基因组正是“DNA之父”James D.Watson的。整个测序过程在2个月内就完成了,花费不到100万美元。随着高通量测序技术的不断完善,独立应用该技术进行全基因组从头测序成为可能。2010年1月21日,由深圳华大基因研究院发起,中国科学院昆明动物研究所、中国科学院动物研究所、成都大熊猫繁育研究基地和中国保护大熊猫研究中心参与的大熊猫基因组测序成果以封面文章的形式发表在国际权威杂志Nature上。这是全球第一个完全使用高通量测序技术完成的基因组序列图。

3.2 高通量RNA测序及其在转录组和基因表达调控

研究中的应用转录组研究是基因功能及结构研究的基础和出发点,是全基因组测序完成后首先要面对的问题。最近科学家们将高通量测序技术应用于转录组分析开发出了RNA测序技术(RNA-Seq) ,该技术能够在全基因组范围内检测基因表达情况,进行差异基因筛选分析。由于RNA-Seq技术具有通量高、可重复性高、检测范围宽、定量准等特点,已经广泛应用于细菌、拟南芥、水稻和人类等生物转录组的研究。我国在应用RNA-Seq进行水稻转录谱分析方面走在了世界的前列。王俊和韩斌领导的研究小组利用RNA-Seq技术分别对水稻的转录组进行高分辨率的分析,发现水稻具有可变剪切模式基因数目远远高于预期。转录组研究是从整体水平研究基因功能以及基因结构。但是,多数研究人员感兴趣的是某一特定的生物过程、发育阶段或处理后的基因表达情况。基因芯片技术曾在该领域的研究中发挥了重要的作用,但它只能检测已知序列的特征,对于未知的序列无能为力。而建立在高通量测序基础上的数字化基因表达谱(digital gene expression profiling)分析无需预先针对已知序列设计探针,即可对任何生物整体转录活动进行检测,因此应用范围更加广泛。最近,Eveland等成功地将数字基因表达谱应用于玉米雌穗发育的研究,并发现了一批调控花序结构的基因。高通量RNA 测序技术另一个广泛应用的领域是小RNA 的研究。小RNA在植物的生长、发育和外界胁迫应答等方面具有重要功能。但由于小RNA序列短、同源性高,因此利用基因芯片检测小RNA非常困难。高通量测序技术不但能够克服这一难题,而且能够发现新的小RNA。目前,高通量测序技术已经成功的应用于拟南芥、水稻和小麦等生物小RNA的研究。

3.3 ChIP-Seq 技术及其在DNA和蛋白质相互作用研究中的应用

染色质免疫共沉淀(chromatin immunoprecipitation,ChIP) 技术是研究体内蛋白质与DNA 之间相互作用的强有力工具,在转录因子结合位点或组蛋白特异性修饰位点的研究中被广泛应用。最近诞生的染色质免疫共沉淀测序(chromatin immunoprecipitationsequencing,ChIP-Seq) 技术充分结合了ChIP和高通量测序技术的优势,能够在全基因组范围内高效地研究目的蛋白的结合位点。该技术的原理是: 首先通过ChIP技术利用抗体特异性地富集交联的目的蛋白-DNA复合体;然后再将得到的DNA片段进行高通量测序; 最后将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白或转录因子等互作的DNA 区段信息。该方法克服了以往染色质免疫共沉淀-芯片(chromatin immunoprecipitation chip,ChIP-chip) 技术依赖于实验者选择探针的不足,可以为任何生物测序。2007年,应用ChIP-Seq技术获得研究成果分别发表在Science、Nature和Cell三大顶级刊物上。我们在体细胞胚胎发生的研究中发现了一个PGA37 基因,该基因编码一个R2R3-MYB转录因子,在植物体细胞胚胎发生和脂肪酸生物合成过程中起着重要的调控作用。分离并鉴定PGA37的靶基因是阐明该基因生物学功能的关键。为此,我们正与有关测序公司洽谈,利用ChIP-Seq技术来筛选PGA37的靶基因。

3.4 高通量测序技术在基因组DNA 甲基化分析中的应用

DNA甲基化在维持细胞正常功能、遗传印记和胚胎发育过程中起着极其重要的作用。新一代高通量测序技术使得基因组整体水平高精度的甲基化检测成为现实。
目前,已经建立了至少三种依赖于高通量测序的DNA甲基化分析技术: 甲基化DNA免疫共沉淀测序( methylated DNA immunoprecipitation sequencing,MeDIP-Seq)、甲基结合蛋白测序(methyl-binding protein sequencing,MBD-Seq ) 和亚硫酸氢盐测序( bisulfite-sequencing,BS-Seq)。
它们之间的区别在于前两种方法首先通过特异性结合甲基化DNA的MBD2b 或5'-甲基胞嘧啶抗体富集高甲基化的DNA,然后再对富集到的片段测序,而第三种方法不经过富集直接测序。虽然MeDI P- Seq 和MBD-Seq 都是基于富集的原理,但二者是相辅相成的策略。MeDIP-Seq 对高度甲基化和高密度的CpG 更加敏感,而MDB-Seq 对高度甲基化和中等CpG 密度更加敏感。
目前,高通量测序技术已经广泛应用于拟南芥、水稻、蚕和人等生物DNA甲基化的研究,并取得了丰硕的成果。

1.    高通量测序技术存在的问题及其发展趋势

尽管高通量测序技术有诸多的优势,但其局限性也不容忽视。
第一,测序速度提高了,但后续的海量测序数据的分析却成为一大难题。
第二,高通量测序技术不适合小规模测序。虽然高通量测序技术的价格不断降低,但一次反应仍需几千至上万元的花费。这对于PCR产物和质粒等数十到数千个碱基的测序,一般客户将是很难接受的,这时传统Sanger测序法无疑还是最佳的选择。
最后,新一代测序仪价格昂贵,动辄几百万元,一般的小型实验室难以承受。
因此,传统Sanger 将与高通量测序技术长期并存,在短期内还不会被淘汰。另外,高通量测序技术只是研究的开端,现在我们所能解释的生物学现象和机制还很有限,即使获得了基因组信息,如何去解释和应用它,仍是一个长远的问题。
 

高通量测序技术流程


图 高通量测序类型与平台

 

高通量测序流程


图 测序流程

样本准备和运输

样本采集、包装过程中的注意事项 
1. 在包裹样本的铝箔或冷冻保存管表面,用油性记号笔标明样本编号及样本类型。并且不要与乙醇等有机溶剂接触。 
2. 不要用纱布、纸张直接包裹样本,而是用铝箔或冷冻保存管包裹后再装入样本袋中。 3. 不要把标签纸或其他纸制的说明性文件放入样本袋内,因为纸张在液氮中是易碎的。  4. 不要用玻璃容器在液氮中保存样本;样本包装中不要使用透明胶带。  5. 标签纸应该贴于样本袋绳上,不要贴于容器表面以免脱落造成样本混乱。  
6. 不要在一只样本袋中放过多的样本,以防无法放入液氮罐或无法从液氮罐中取出。样本袋在使用前先在液氮中预冷。  
7. 客户在填写《样本登记单》时应当详细描述样本的类型、处理方法、储存条件以及储存时间等相关细节,以便技术人员确定合理的实验方案。

图 样本准备及运输
 
示例1:动物及临床标本组织收集和保存运输


 
示例2 血清样本收集及保存运输

 

样本质检

    28s和18s是真核生物rRNA(核糖体RNA)的两个主要亚基,在体内含量较多.RNA提取过程中可能发生各种途径的降解,28S/18S即为衡量提取的RNA完整性的指标,28S/18S比值:>1.5为高质量,1.3-1.5勉强可用,<1.3为较差质量.
    260/280比值:这一比值用于反应RNA浓度与蛋白浓度的比值。理想值应当在1.8-2.0,如果比值低于1.8,表明存在蛋白或其他污染。
    RNA Integrity Number (RIN): > 7为高质量,6-7勉强可用,< 6为较差质量。
表 质量评价
A RIN值,rRNA 28S/18S,O.D:260/280.比值均符合质量要求 样品总量满足2次或2次以上实验要求量 可以实验
B RIN值,rRNA 28S/18S,O.D:260/280.比值均符合质量要求 样品总量满足1次但不足2次以上实验要求量 可以实验
B- RIN值,rRNA 28S/18S,O.D:260/280.比值均符合质量要求 样品总量不足1次实验要求量 由合作伙伴确认是否继续实验
C RIN值,rRNA 28S/18S,O.D:260/280.比值三者中任一项或多项略低于质量要求   可以尝试风险实验,但不保证实验质量
D 不符合上述三项指标的质量要求   不建议用于实验

文库构建

文库质检说明:
1)  Qubit 定量:采用特异性染料结合的方式特异性的检测样本浓度来实现精确定量。
2)  2100 bioanalyzer检测片段大小:其峰值大小应该是目的片段大小加上接头的序列长度。
 

图 文库构建方法

上机测序

Illumina 高通量测序平台,主要由HiSeq测序仪和MiSeq测序仪组成。
HiSeq 2500平台
    转录组测序、小RNA测序
HiSeq 4000平台
    转录组测序、外显子组测序、甲基化测序
X-ten平台
    人类基因组测序
MiSeq 平台
    微生物多样性分析(16s、18s、ITS)
    宏基因组测序

数据分析

标准分析
数据质控和筛选过滤,得到高质量数据
根据不同的测序类型进行差异基因分析、功能注释、预测新的基因等
高级分析
重要通路分析、重要的调控网络分析、重要的预测分析等
给出给出研究方向相关的重要基因、重要通路;重要的分子、漂亮的图、表等

转录组测序

一、        技术简介:
    转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和。基于高通量测序平台的转录组测序技术能够全面获得物种特定组织或器官的转录本信息,从而进行基因表达水平研究、新转录本发现研究、转录本结构变异研究等。
二、         技术路线:

三、        测序策略
样本要求 测序策略 测序数据量 周期/工作日
Total RNA ≥ 2ug
浓度 ≥ 100ng/ul
HiSeq4000
PE150
推荐6G clean data 45
 
 
四、        应用案例
(1)      Michael H Farkas, Gregory R Grant, Joseph A White et al., Transcriptome analyses of the human retina identify unprecedented transcript diversity and 3.5 Mb of novel transcribed sequence via significant alternative splicing and novel genes. BMC Genomics. 2013. 14: 486.  IF= 3.986  (眼科)
(2)      Xiaoling Zhang, Jane Y. Jin, Joseph Wu et al., RNA-Seq and ChIP-Seq reveals SQSTM1/p62 as a key mediator of JunB suppression of NF-κB-dependent inflammation. J Invest Dermatol. 2015 135(4): 1016-1024.  IF= 7.216  (皮肤)
(3)      Rebekah Henry et al., The transcriptomic response of Acinetobacter baumannii to colistin and doripenem alone and in combination in an in vitro pharmacokinetics/pharmacodynamics model. J. Antimicrob. Chemother. 2015. 70(5): 1303-1313.  IF= 5.313  (药代动力学)