高通量测序的应用与进展.ppt
高通量测序应用与进展高通量测序应用与进展 报告纲要报告纲要 高通量测序简介高通量测序简介 高通量测序平台的介绍高通量测序平台的介绍 高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍相关生物信息学分析软件介绍 高通量测序简介高通量测序简介 高通量高通量测序测序:一次性对一次性对几百万到十亿条几百万到十亿条DNA分子进行分子进行并行测序并行测序,又称为,又称为下一代测序技术下一代测序技术,其使得可对一个物种的转录组和基因组进,其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为行深入、细致、全貌的分析,所以又被称为深度测序深度测序。High-throughput Sequencing Next Generation Sequencing Deep Sequencing3 高通量测序流程高通量测序流程文库扩增低通量A Sanger测序 B 高通量测序并行测序高通量无需建立文库,两端加测序接头PCR扩增 报告纲要报告纲要 高通量测序简介高通量测序简介 高通量测序平台的介绍高通量测序平台的介绍 高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍相关生物信息学分析软件介绍 高通量测序技术的起源与发展高通量测序技术的起源与发展 1992年Lynx Therapeutics MPSS 2003年Polony Sequencing(哈佛)2005年454 Pyrosequencing 2006年Solexa Sequencing-by-Synthesis 2007年ABI SOLiD 2008年Helicos tSMS Sequencing 2010年Ion torrent Semiconductor Sequensing 2011年Pacific Biosciences SMRT Sequensing6 高通量测序技术的传承关系图高通量测序技术的传承关系图Lynx MPSSSolexaABI SOLiD454Ion TorrentHelicosSMRTIllumina SolexaRoche 454Polony SeqABI Ion Torrent 现有主要高通量测序仪开发商现有主要高通量测序仪开发商测序仪品牌技术原理开发商Roche 454焦磷酸测序RocheIllumina Solexa 边合成边测序IlluminaABI SOLiD基于磁珠的大规模并行连接测序ABIHelicos单分子荧光测序 HelicosIon Torrent半导体测序ABISMRT单分子实时测序 Pacific Bio 454 Pyrosequencing 基于磁珠的焦磷酸测序:A 磁珠制备设备B 454测序仪C 454测序原理 454 测序流程测序流程 454 测序流程与测序流程与Base Calling 454 的特点与主要应用的特点与主要应用 读长较长,400600bp 通量较低,1Run 1M 序列,400600Mb 相对成本较高 主要应用:de novo测序 Illumina Solexa简介简介 桥式PCR 边合成边测序 可逆终止物HiSeq 2000 Illumina Solexa 测序流程测序流程 Illumina Solexa 桥式桥式PCRdioldiol1st cycle denaturation1st cycle annealingdioldioln=35total1st cycle extensiondioldioldioldiol2nd cycle denaturation2nd cycle annealingdioldioldioldioldioldiol2nd cycle extension Illumina Solexa Base Calling123789456T T T T T T T G T T G C T A C G A T Solexa 的特点与主要应用的特点与主要应用 读长较短,100150bp 通量高,25G每天,120-150G每Run 主要应用:RNA测序、表观遗传学研究 ABI SOLiD 简介简介 SOLiDSequencing by Oligo Ligation/Detection Oligo连接测序:通过连接酶连接,再对oligo上荧光基团进行检测SOLiD 5500 xl ABI SOLiD测序前期制备测序前期制备A 样品片段化磁珠连接B 乳化PCR3末端修饰C 磁珠富集转到测序玻片 ABI SOLiD测序原理测序原理 ABI SOLiD荧光结合和结果示例荧光结合和结果示例SRR029969.1 VAB_5551_12_381_F3 length=35T11.0203.3.1113211010332111302330201+SRR029969.1 VAB_5551_12_381_F3 length=35!36!8/8:!:!4626=(8.)43),(95,A.SOLiD Oligo荧光基团模式图B.SOLiD 测序结果示例(Color Space)SOLiD 的特点与主要应用的特点与主要应用 读长较短,50-75bp 精度高,可达Q40 通量高,20-30G每天,1Run 可达120G 主要应用:基因组重测序、SNP检测等 三种平台的技术差异三种平台的技术差异平台平台454454SolexaSolexaSOLiDSOLiDPCR磁珠乳化PCR桥式PCR磁珠乳化PCR测序载体磁珠玻片玻片测序方式焦磷酸、荧光可逆终止物、荧光连接酶、荧光结果序列FastQFastQCSFastQ 三种平台的效能参数差异三种平台的效能参数差异平平 台台读长读长通量通量周期周期精度精度Solexa HiSeq2000Single-end:1 x 35 bpPaired-end:2 x 50 bpPaired-end:2 x 100 bp25 Gb/d1.5d4d8d50 bp 85%以上以上Q30100 bp 80%以上以上Q30SOLiD 5500 xlSingle-end:75 bpPaired-end:75 x 35 bpMate-pair:60 x 60 bp20 30 Gb/d1d/1lane7d/12 lane7d/12 laneQ40454 GS FLX400-600 bp400 600 Mb/Run10hQ20 报告纲要报告纲要 高通量测序简介高通量测序简介 高通量测序平台的介绍高通量测序平台的介绍 高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍相关生物信息学分析软件介绍 高通量测序应用范围高通量测序应用范围 DNADNA测序测序全基因组全基因组de novo测序测序基因组重测序基因组重测序宏基因组测序宏基因组测序人类外显子组捕获测序人类外显子组捕获测序 RNARNA测序测序转录组测序转录组测序小小RNA测序测序电子表达谱测序电子表达谱测序 表观基因组研究表观基因组研究ChIP-SeqDNA甲基化测序甲基化测序 基因组测序基因组测序 基因组测序是对物种的基因组测序是对物种的基因组基因组DNADNA打断后进行高通打断后进行高通量测序,根据是否有已知基因组数据主要分为量测序,根据是否有已知基因组数据主要分为de novo全基因组测序和全基因组测序和基因组重测序基因组重测序。De novo 基因组测序是对基因组测序是对未知基因组序列未知基因组序列的物种的物种进行基因组从头测序,利用生物信息学分析手段进行基因组从头测序,利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因对序列进行拼接、组装,从而获得该物种的基因组图谱。组图谱。全基因组重测序是对全基因组重测序是对已知基因组序列已知基因组序列的物种进行的物种进行不同个体的基因组测序,并在此基础上对个体或不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。群体进行差异性分析。基因组测序策略基因组测序策略Paired-EndMate-End基因组测序流程两种测序策略 Paired-end 原理原理29100bps100bps3000bps Paired-end 基因组重排分析基因组重排分析 Paired-end和测序深度对测序效果的影响和测序深度对测序效果的影响 Jun Wang,et al.Nature 456,60-65(6 November 2008)基因组测序的生物信息学分析基因组测序的生物信息学分析 数据产出处理数据产出处理:图像识别与:图像识别与Base Calling去除接去除接头序列、检测与去除污染序列等;头序列、检测与去除污染序列等;基因组组装基因组组装:原始数据统计、测序深度分析、组:原始数据统计、测序深度分析、组装结果统计等;装结果统计等;基因组注释基因组注释:Coding Gene注释、注释、RNA分类注释分类注释、重复序列注释等;、重复序列注释等;基因功能注释基因功能注释:GO功能分类、功能分类、Interpro功能分类功能分类等;等;比较基因组及分子进化分析比较基因组及分子进化分析:SNP/InDel/CNV检检测等。测等。References1、Erin D.Pleasance,Philip J.Stephens,Sarah O Meara,et al.A small-cell lung cancer genome with complex signatures of tobacco exposure.Nature,2010,463:184-190.2、Michael James Clark,Nils Homer,Brain D.O Connor,et al.U87MG Decoded:The Genomic Sequence of a Cytogenetically Aberrant Human Cancer Cell Line.PloS Genetics,2010,6(1):e1000832.3、Wei Chen,Reinhard Ullmann,Claudia Langnick,et al.Breakpoint analysis of balanced chromosome rearrangements by next-generation paired-end sequencing.European Journal of Human Genetics,2010,18:539-543.4、Van Tassell CP,Smith TP,Matukumalli LK,Taylor JF,Schnabel Rd,et al.Whole-genome sequencing and variant discovery in C.elegans.Nat Methods,2008,5(2):183-188.5、Jun Wang,Wei Wang,Ruiqiang Li,et al.The diploid genome sequence of an Asian individual.Nature 456,60-65(6 November 2008)6、Huang SW,Li RQ,Wang J,et al.The Genome of the Cucumber(Cucumis sativus Linnaeus).Nature Genetics 2009;doi:10.1038/ng.4757、David Hernandez,et al.De novo bacterial genome sequencing:Millions of very short reads assembled on a desktop computer.Genome Res.2008.18:802-809 33 基因组重测序案例分析基因组重测序案例分析 Erin D.Pleasance,et al.The compendium of somatic mutations in a small-cell l