AI正是高质量总结,HPC修改是基因测序普惠万众的

原标题:AI就是高性能计算

原标题:基因探秘:HPC创新是基因测序普惠万众的捷径

SUN说:网络就是计算机。

著名未来学家库兹韦尔在《奇点临近》中,预言在2045年随着基因、纳米和机器人三大技术实现革命性突破,技术力量会以指数规律快速发展,人类亘古追求的“永生”将有望变为现实,而基因技术则是这一切的基础之一。

联想说:AI就是HPC(高性能计算)。

原来做一次完整的基因测序在几年前需要数万美金,但现在一套基因测序只需要一千美金左右,那么未来基因测序在价格上还有多大的让利空间?一套完整的基因测序动辄会产生数GB基本的庞大数据,在后期分析这些基因样本时需要怎样的计算力去做支撑?现在做基因检测大概要等一周甚至更长的时间,那么未来有没有可能像做血液检查一样,可以在数小时内就得到检测结果?

抱歉,联想没有说。这是小编总结的。

图片 1

尽管联想没有明确这样说,但在8月31日举行的2018联想全球超算峰会上,联想对外发布了全新AI产品家族,将HPC、AI紧紧关联在一起。

在2018年联想全球智慧超算峰会的生命科学圆桌会议上,带着以上诸多问题我们采访了诺禾致源副总裁吴俊和联想数据中心业务集团制造行业总监许子牛,在他们的解答中,我们可以看出超算已经成为了基因技术进一步发展的重要推力。

图片 2

style="font-size: 16px;">基因测序行业再次印证“螺旋加速定律”

这也是AI就是HPC的灵感来源

有人曾把基因碱基链,比作破解生命密码的终极钥匙。其实现在基因检测已经不再是阳春白雪般的存在,利用基因测序技术,可以对孕妇进行无创伤的产前先天遗传缺陷检测,也可以通过检测肿瘤基因特征片段提早预防癌症,还可以通过基因技术来寻找最优的药物治疗方案。基因技术已经被公认是,有可能改变人类命运的关键技术。

早已经是产业共识

图片 3

AI就是高性能计算,这已经是产业界的共识。

基因技术站在了自然科学的风口,而诺禾致源则站在了基因行业的风口之上。据吴俊介绍,诺禾致源的业务覆盖科技服务、肿瘤基因检测及遗传检测三大领域,为全球研究型大学、科研院所、医院、医药研发企业、农业企业等提供基因测序、质谱分析和生物信息技术支持等服务。其中科研服务的内容是为大专院校、医院、药企提供测序的服务,从测序到后续的数据分析,最后给到客户分析报告,客户根据相应的实验设计挖掘出数据具体的生物学意义。目前诺禾致源已在全球运行25台NovaSeq、20台PacBio Sequel、30台HiSeq X、11台HiSeq 2000/2500/4000、4台MiSeq、4台NextSeq 500、6台Life Ion Proton(DA8600)、2台S5XL和5套Q Exactive HF-X等最先进的基因测序仪,建立了亚洲通量规模最大的基因测序平台,将实现每年280,000人全基因组测序的超高通量。

但以小编知识结构,其实一时转不过来,没有领悟其中的奥秘。

在半导体产业有著名的摩尔定律,而基因测序技术的技术更新甚至超越了半导体发展的速度。有相关统计数据显示,2007年全球基因测序市场规模仅为800万美元,而到2018年全球基因测序市场规模将有望达到117亿美元,这是典型的指数级增长实例,也是高新技术常出现的性能飞速提升、价格快速下降、用户规模几何级数增长的“螺旋加速定律”的鲜活案例。

HPC为AI提供了计算引擎,大数据为AI提供了数据引擎;反过来,AI、大数据给HPC带来了新的业态。”这就是结论。

吴俊在采访中表示,在几年前测一个人的基因组需要一万美金,现在大概只需要一千美金,整体的测序成本降速是非常快的,相比于半导体产业著名的摩尔定律,整个基因测序产业的成本降幅速度甚至超过了摩尔定律的。这就面临一个亟待解决的现实问题,在基因测序成本降得迅速、测序样本数量又在快速增大的前提下,找到能满足基因测序行业特定需求的HPC解决方案就成为必须解决的问题。

如何理解这个结论呢?

style="font-size: 16px;">基因测序应对爆发性成长,需要HPC有新突破

先说说AI,如今AI有泛化的趋势,无助于人们的理解。

据吴俊介绍,基因测序行业因为自身的业务特性,所以对HPC的选择上有鲜明的行业特征要求:

简单说,这一波AI浪潮的兴起和深度神经元网络和机器学习有关。AlphaGO就是最初的表现。其中最关键的技术是以大数据处理为基础的机器学习,对于算法模型的不断调优,从而使得其具备智能判断、分析的能力。

第一,要满足大数据量需求。基因测序产生的数据量都是TB级别,以诺禾致源为例,每台测序机器一天产生的数据量是6TB,按照目前60台测序机器产生的数据量,2018年产生的数据量将达到30PB,这就必须要求HPC系统具有海量数据存储能力。

说到AI,很容易和人脸识别、语音识别、步态识别等具体技术联系在一起。

第二,对内存需求量大。在后期基因序列分析时,往往会进行序列对比,这就要求要将海量数据一次性的载入到内存并加以处理,而不适宜分批导入,这就对内存有了非常严苛的容量要求。

但实际上,AI分为重型AI和轻型AI**。**

第三,对计算力要求高。根据实际测试,目前基因测序所用的专用软件,用GPU来跑还不够成熟和稳定,所以对CPU的性能要求就变得更高。

图片 4

经过缜密的选型,最终诺禾致源选择了联想HPC。据了解,联想提供的刀片是高性能运算系统,配置超过10PB的存储空间,单节点配置了最高达2TB的超大容量内存。并且通过统一的集群监控管理、作业调度,不单保证了整套系统的稳定性,而且还可以利用调优来不断释放系统的计算潜力。经过改造升级,如今诺禾致源已经拥有全球领先的高性能计算平台,数据中心运算能力已提升至1727T flops,总内存410TB,总存储60.2PB,有效地支撑着生命科学研究和医疗健康两大领域对大数据分析和存储的需求。

其中,轻型AI在消费级产品领域应用比较快,更加容易被人们所熟悉,例如AI手机,如摄影模式的智能判断和选择等

吴俊在采访时表示,在不考虑成本、投入巨量算力的前提下,现在基因测序的后期数据处理周期可以从2.5天缩短到20分钟,所以诺禾致源对HPC的算力提升有殷切的期待,尤其是当E级计算实现之后,软件不断会针对GPU加速和多核调优,那么做一次基因测序后期比对的时间缩短到一个小时内是可以期待的。

轻型AI的特点是针对目标硬件进行裁剪,可以通过硬件固化,如AI芯片,来实现秒级处理的效果。

图片 5

但对于重型AI来说,体现出来的特点就是大数据、大模型和多任务。其模型训练需要大数据和大机器,其中HPC首当其冲。追求的是高吞吐率的智能推理以及复杂的关联关系分析。

许子牛在接受采访时表示,联想作为计算工具提供商来说,当提供的工具越好、商业化程度越高,对客户来说采购风险就会越低。未来基因测序需求大爆炸,会对HPC有更多要求,联想认为HPC跟普通的个人计算机不同,它往往担负着核心业务或者尖端科研计算的重任,所以单纯去谈HPC的价格没有意义,而是应该考量HPC在整个生命周期的成本。就比如,现在基因测序的数据中心不像传统IDC的数据中心,可以建在像内蒙古等能源丰富的地方,而更多地建在重点中心城市,这就对单位能耗、对节能有更高的要求,所以联想的重点会放在切实降低用户整体成本上。其实对于一个HPC数据中心而言,峰值计算能力有多高仅仅在设计和验收时有意义,更多时候是考验HPC的稳定性和耐久性,联想计算团队在后期维护和技术保障上有口皆碑,会帮助用户不断调优,从而能让用户以经济的投入获得更高的算力回报,联想认为这才是能给用户带来持久价值的选择。

简单说,当今的AI可以理解为算法、机器学习和人工经验的结合,是基于数据和结果,对于控制参数进行调优的结果。

style="font-size: 16px;">HPC style="font-size: 16px;">不只是巅峰算力,还决定人类探索未知的新边界

绕不开的GPU话题

在过去,人类是用双脚丈量世界,但在探索太空的过程中,人类可以利用射电望远镜、HPC来探测更遥远的太空奥秘。让我们引以为傲的“神舟十一号”载人航天工程中,联想HPC提供了强大的技术保障。尤其是在轨道计算、模拟仿真、航天器设计等关键事件中,承担了大量重要的计算工作,稳定可靠的品质完美匹配“航天级”苛刻要求,大量节省了实验经费,大大缩短了计算周期,提高了航天器设计的可靠性。

谈到AI,GPU是一个绕不开的话题。

过去监测海洋环境主要依靠依靠人工采样,不但耗时费力,而且时效性也不佳。而利用HPC和遥感技术,则可以实时动态地对海洋环境进行监测。联想为国家海洋局搭建的高效海洋环境监测预警高性能平台,大幅提高了监测数据的计算、分析、处理功能,充分满足了国家海洋局的科研需求。

实际上,不仅是GPU,围绕着复杂繁多的AI应用场景,如今GPU、TPU、HPU、BPU、IPU、NPU、VPU、XPU等百花齐放。几乎26字母都已经被用到。

图片 6

原因很简单,没有任何一款通用处理器或者芯片可以满足所有AI应用场景的需要。

联想联想集团高级副总裁、数据中心业务集团中国区总裁童夫尧在做主题演讲时表示,在前不久刚刚结束的世界超算大会(ISC2018)上,联想凭借117套入围的成绩,成为HPC TOP500榜单中全球最大的HPC解决方案供应商。作为首家获此殊荣的中国厂商,联想正在以“科技创新”赋能行业变革,为科研、教育、航天、气象、汽车、石油石化、生命科学等多个领域提供领先成熟的解决方案。

似乎这些和HPC无关。

图片 7

说到HPC,离不开Top500排行,以Link Pack测试性能指标为前提的排行。

正如国防科大计算机学院院长廖湘科所言,拥抱新技术是HPC继续辉煌的必由之路,未来的智慧超算时代,必然离不开HPC、大数据与人工智能的融合创新。在峰会当天,联想发布了自主研发的AI产品家族,其中包括专为HPC和AI优化的全新人工智能服务器ThinkSystemSR670、Think SystemHG680、ThinkSystemHG690;全新的LiCO GENE Edition;此外,联想还推出第三代温水水冷解决方案“海王星”系统,走在了HPC与AI融合创新的行业潮头。

HPC、超级计算机的性能被誉为一个国家科技实力象征,王冠上的明珠。

人类被称为万物之灵长,与动物最大的区别,就在于人类能够利用和发明工具。人类在陆续发明蒸汽机、电动机、计算机和互联网等重要发明之后,人类改造世界的能力在不断增强。从某种程度上来说,HPC现在代表的已经不只是人类的巅峰计算力,而是人类探索未知世界的新边界。我们也衷心期待联想为代表的中国HPC力量,在不久的将来能够第一个实现E级计算的历史性突破,中国HPC产业能够在硬件、软件、应用等方面不断成熟,从而建立起更加有竞争力的智慧超算新生态,也让HPC成为中国未来科技发展和融合创新的基石。返回搜狐,查看更多

中国在Top500排行榜上取得了突破性的进展,天河2号和神威太湖之光连续6次和4次拿到了冠军,连续5年占据榜首。今年,才刚刚被美国Summit超过,行内人透露,用不了多久,也许就是半年之后,就会被国产机超过。

责任编辑:

这个成绩是怎么取得的呢?

图片 8

答案就是抓住了“异构并行计算”的机会。其中,GPU、FPGA和APU功不可没,从百万亿次,千万亿次,都是靠这样的一个技术。

HPC接下里的目标是E级计算,靠“异构并行计算”,靠花钱是没有办法突破E级计算的,接下来要面临“访存墙、通信墙、可靠性墙、能耗墙、并行计算可扩展性”等一系列难题。

简单说就是互联、网络、可靠性和功耗。

E级计算有用吗?

除了象征意义之外,计算能力也是非常重要的。

图片 9

诺禾致源高级副总裁吴俊

在采访中,诺禾致源高级副总裁吴俊表示,作为一家开展基因测序服务和研究的公司,从测序仪产生的海量数据处理,到最终结果的分析判定,都需要强大的数据处理能力。

此前,1台基因测序仪产生的数据量是200GB~300GB,如今已经快速发展到6TB,时间也从7天~8天,缩短到2.5天。基因测序的成本,也从1万人民币暴跌到1000元左右,具备了商业化应用的前景。

HPC计算性能的提升,显然有助于服务流程的优化,快速相应需求。但是与此同时,也要根据商业模式选择合理的方案,没有办法无限制的追逐高性能。

相比于性能,诺禾致源更加看重的可靠性、稳定性以及节能的水平。联想在温水冷却等节能技术上独树一帜,在IBM x86服务器的基础上,有很多读到技术和可靠性、稳定性保障,这也是他们选择联想高性能计算的原因。

吴俊表示,现有基因测序分析软件并不适用于GPU。但在AI助力方面,HPC的计算能力、数据处理能力仍然是可以信赖的基础。

联想数据中心业务集团制造行业总监许子牛表示:HPC助力AI是一个方面,另外AI也可以助力HPC,例如能耗问题,访存效率的提升,都可以借助AI技术。这对于E级计算机的实现,也具有重要意义。

即使对于E级计算,“异构并行计算”仍然是首选的技术,各种XPU加速技术也有助于目标的实现。

未来的HPC不仅针对科学计算,将同样适用于大数据、AI的应用场景,这将会是一个应用领域兼顾的过程。

本次联想全球超算峰会,联想发布自主研发的AI产品家族:ThinkSystem SR670、ThinkSystem HG680、ThinkSystem HG690共3款产品,其实是HPC、AI优化的结果。联想还推出第三代温水水冷解决方案“海王星”系统,其中包括Direct-to-Node温水水冷技术、后门热交换器、以及由空气和液体冷却组成的混合冷却技术,使数据中心的运行效率提升高达50%。

图片 10

这就是联想接地气的结果。

在本次峰会上,联想没有披露更多E级计算机进展,但其并不遥远。

小结

AI技术思路的突破,正在颠覆、改变就有的格局。以HPC为例,也在从科学计算、工程计算,渗透到大数据和AI,HBM(High Bandwidth Memory)、XPU、3D NAND、Optane等新技术产品的出现,也会极大改变现有的商业格局。

世界正在快速变化中,HPC当然也不例外!返回搜狐,查看更多

责任编辑:

本文由威尼斯正规官网发布于科技展览,转载请注明出处:AI正是高质量总结,HPC修改是基因测序普惠万众的

相关阅读