生命科学算力解决方案白皮书.docx
《生命科学算力解决方案白皮书.docx》由会员分享,可在线阅读,更多相关《生命科学算力解决方案白皮书.docx(36页珍藏版)》请在优知文库上搜索。
1、一、生命科学研究领域1(一)基因组学2(二)生物信息学2(三)蛋白质结构研究4(四)分子动力学模拟方法8(五)计算机辅助药物设计9二、生命科学算力解决方案12(一)高性能计算生命科学解决方案121、生命科学的主要软件和特点122、生命科学高性能计算参考架构14(二)人工智能加速生命科学解决方案191、Al发展加速生命科学的应用192、联想人工智能解决方案框架21(三)生命科学算力平台解决方案21三、生命科学参考客户案例24(一)某医院组学和深度影像学习平台241、学科平台需要支撑运行的软件252、算力平台建设要求和主要特点26(一)北京大学算力平台“未名生科一号”28图目录图1生命科学高性能计
2、算架构14图2Al应用加速行业转型19图3AI加速生命科学领域应用20图4联想人工智能算力框架21图5联想生命科学算力平台22图6组学分析系统架构28图7”未名生科一号”29图8水合离子的微观结构和幻数效应31图9DNA复制起点识别复合物3-A分辨率结构31图10”未名生科一号”节点使用率和用户作业数32图11“未名一号”节点使用率和用户作业数32图12兄弟院校前来参观交流33表目录表1主要生命科学学科的工作负载13表2学科平台需要支撑运行的软件25一、生命科学研究领域生命科学领域是对微生物、动物和植物等所有生物进行研究的科学领域,同时也包括生物伦理学等相关领域。生命科学的研究是为了提高人类的
3、生活品质。目前生命科学已经在医疗、农业、保健、食品工业和制药等行业得到广泛应用。生命科学的研究不断造福人类。虽然当前生物学仍然是生命科学的中心,但随着分子生物学和生物技术的发展,生命科学已经成为一个专精化、多学科交叉并且已经进入快速发展的领域。全球范围内来看,从21世纪开始,全球生命科学领域的发展进入快车道,尤其是人类基因组计划的实施、干细胞研究的不断深入、克隆技术的不断发展等因素都将生命科学领域的发展推向了新的高度,与之相对应领域的研发投入也在不断增加。作为对科技信息技术有强依赖的典型代表,生命科学行业的药物研发和基因测序分析领域面临着计算资源紧缺、研发周期长等问题。为了解决这些问题,相关企
4、业一方面自建高性能计算平台,另外一方面也开始从传统IT转向上云,希望借助云计算平台的资源来从事和加速药物研发速度、提升测序数据分析效率,加快业务创新步伐,为用户创造更大价值。新药的诞生通常需要经历药物发现、临床前研究、临床试验和审批等阶段后,最终才可以获批上市。在靶点发现、化合物合成等药物发现阶段以及化合物筛选等临床前研究阶段,往往需要借助高性能计算强大的计算能力才能加速研发过程辅助药物设计。(一)基因组学基因组学是指对生物体所有基因进行基因组作图、核甘酸序列比对分析、基因定位及基因功能分析的一门学科,而基因测序则是针对基因组学研究的检测分析技术。基因组学所对应的研究主要包括结构基因组学和功能
5、基因组学两个方面。结构基因组学代表基因组分析的早期阶段,一般以基因组测序为目的,得出生物样本的静态碱基序列,并构建生物体的基因图谱,一般基于高通量测序技术生成生物的碱基序列。功能基因组学也称作后基因组学,基于结构基因组所提供的数据及信息,结合计算机科学,同时对多个基因片段进行系统性的分析研究,主要研究内容包括:基因突变检测(SNP,InDeD基因表达分析及基因功能发现等。基因测序的业务流程主要包括样本上机(测序仪)、测序文件生成、基因序列比对及结果分析(计算机),并将结果数据及报告交付至各科研医疗机构。其中,基因序列比对及分析环节极为耗时,涉及大量的生信领域专业软件,计算资源的算力性能及方案优
6、化对生信研发效率起着至关重要的作用。(一)生物信息学进入21世纪以来,随着人类基因组计划的相继完成和各种模式生物的基因组计划的顺利实施,以及基因测序技术的不断进步,生命科学研究得到了巨大的发展。同时,海量的有关生物序列的数据量不断增加。这些数据具有丰富的内涵,其中蕴含着大量的人类尚且不知道的生物学奥秘。生物信息学是研究生物信息的采集、处理、存储、传播、分析和解释等各方面的一门学科,与以观察和实验为主的传统生物学研究不同,它通过综合利用生物学、计算机科学和信息技术而揭示大量而复杂的生物数据所蕴含的生物学奥秘。生物信息学把DNA序列、蛋白质序列以及其它相关生物数据作为分析对象,力求揭示DNA编码区
7、、蛋白质、RNA基因以及其基因组中非编码序列的信息实质。DNA测序技术是现代分子生物学研究中最常用的技术。自1977年第一代测序技术问世以来,经过三十多年的发展,DNA测序技术取得重大进展,以高通量为特点的第二代测序技术逐渐走向市场,以单分子测序为特点的第三代测序技术也已经出现,其分别在测序特点上占有不同的优势。测序技术的快速发展,使小型化/台式高通量测序仪成为现实,这意味着大规模基因组测序将不再是大型实验室或科研中心的专利,中小型实验室、公司、临床检验中心都将能够利用高通量测序技术快速高效的获取大量信息,进行科研或开发应用。DNA测序包括全基因测序和基因组重测序。新一代高通量测序技术的发展,
8、使得物种全基因组测序变得速度快、效率和准确率更高,越来越多的物种基因组信息相继公布。全基因组测序主要应用与基因组序列未知的物种,DNA片段测序后,用生物信息学软件对序列进行拼接、组装,从而获得该物种的基因组序列图谱。基因组重测序是指该物种基因基因组序列已被测序,有参考基因组序列的测序工作。第2代高通量测序技术目前应用最为广泛的领域就是对已知基因组物种进行重新测序,基因组结构变异、单核甘酸多态性、群体多态性、突变热点等重要信息都是通过重测序研究发现的。目前已知的序列比对方法很多,依据不同的划分方式有不同的分类。根据同时进行比对序列的数目分为两两比对和多序列比对,从比对范围考虑分为全局比对和局部比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生命科学 解决方案 白皮书
