震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

时间 • 2025-05-06 03:19:46
科技最狂潮

 2017年5月,19岁的这科技最狂潮是世界围棋第从有个人柯洁九段在和Alpha科技最狂潮Go的围棋终极人机大战以0:3完败,这只是这正 人类意识顶尖高手与这台机器相互的只是这正 三次较量,同年10月 《Nat科技最狂潮Ure》杂志发表了以上它几乎基本版本的AlphaGo Zero。又一胜利向这是世界展示了下建科技最狂潮立子系统来于 学提前完成复杂完成任务的可是,而其背后所属于这正 运算能力强,是计算机科学的分支三大领域 --高能计算(High Performance Computing),可是际应用而且沦是为小国家综合自身实力的体现,更给广大民众的日常只是这正 生活 带来震撼了发生明显变化,现阶段该技术方面已在航空航天、核试验模拟、天气预报、生命旅程科学、高新制造(汽车、电子)等三大领域 胜利了广泛应用。

以生命旅程科学三大领域 举例,越来越大生命旅程遗传密码(基因组)的越来越大破解,人的生老病死又一复杂这件也更不能 以用数字化的以此具体综合分析呈现,以期提前完成疾病的精准综合分析、诊断和治疗中,让广大民众远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,整体提升人均预期寿命,并大幅度整体提升社会中卫生负担。

二十年来,从有个人全基因组测序的成本以“超摩尔定律”的减慢下降,而高能计算在测序综合数据综合分析一个方向的应用也会发生了翻天覆地的发生明显变化。现阶段这是世界主流的基因组测序综合数据综合分析工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项生命旅程科学三大领域 公认的最佳工作后流程提前完成两从有个人的全基因组(Whole Genome Sequencing,WGS)30X综合数据综合分析也更不能 1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算三大领域 已胜利突破进展,于日失败提前完成6分钟提前完成30X WGS全流程的综合分析完成任务,相较于GATK统一标准计算时长提速300倍。

可以根据NIH公布的最新资料,越来越大测序技术方面的发展中,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟提前完成30X WGS完成任务是由华大基因自主研发的LUSH工具集提前完成的,打破了该该软件在2020年1月创造的15分钟极限减慢。共有 的黑科技这正 采用先进了新的结构 的结构 底层架构采用先进,技术方面提供了概念基础中央处理方式器和图形处理方式器相相结合对其基因综合数据综合分析的高能减慢方案,在整体提升集群计算资源消耗、整体提升检出减减慢而且,提前完成了全程自动化、有关信息化,有记录可回溯,也更不能 以更好地地用于精准医学的应用场景。

LUSH工具集减减慢新的结构 底层架构逻辑

LUSH工具集技术方面提供又另外一种“CPU+GPU”的高并行软硬件两个解决好方案,概念基础经典流程里的该软件模块BWA、SAMTOOLS和GATK,以此GPU的通用运算技术方面,对其计算引擎和减慢引擎的新的结构 架构采用先进,提前完成算法优化和并行化处理方式,并相结合华大自主研发的超高通量测序仪,提前完成碱基综合数据流的超高速综合分析,只是这正 已胜利准确的综合分析只是这正 。

LUSH工具集减慢流程示意图

这正 可是生命旅程数字化进程也更不能 严谨的科学人的精神,而其应用场景而且体可是精准医疗、健康管理等与人类意识健康的的息息有关的三大领域 ,可是各并不同于之外高能计算三大领域 ,基因组综合数据综合分析对精度有极高的各种要求。而可是高能和准确并更不能基本兼得,综合数据区域范围、分布和浮点精度、峰值能和内存总是会产生影响算法的选择放弃,而且涉及到最大最优解和似解的算法可是大相径庭。LUSH工具集这正 对其在经典流程算法的概念基础上以此了其新的结构 采用先进的底层架构下一步增加了前面只是这正 的读写,并以此CPU提前完成基因综合分析完成任务的智能分发,以此GPU数千计算核心提前完成百万完成任务的极速并行处理方式,而且两个解决好了经典流程计算密度较高、频繁地存储器访问等两个解决好,多次反复测试其统一标准品的准确只是这正 与经典流程一致,以上99.86%,基本其也更不能 以在计算只是这正 的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是几乎高能计算应用三大领域 的研发追求长远目标。对减慢组件的能持续研发来于 对减慢无止境的追求,正如部手机芯片行业未来的发展中是越来越大移动端产品需求的旺盛,技术方面才得以越来越大地迭代和进步。从基因组学概念基础系统研究到临床系统研究及应用,提前完成测序工具的自主可控的而且也也更不能 提前完成数学形式上也自主研发,而更不能是追求芯片的底层下潜开发。对后者是无止境的追求,而需要需要前者的基本可控更不能 提前完成从跟随模仿到需要需要超越的可是,从核心算法的研发上助力中国目前目前精准医疗自主可控的发展中进程。