0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息携手北京英信 基于分布式存储 助力求臻医学解锁生命密码

全球TMT 来源: 全球TMT 作者: 全球TMT 2023-04-21 17:27 次阅读

北京2023年4月21日 /美通社/ -- "一花一世界",这句话在蛋白质、DNA所在的微观世界里体现得淋漓尽致,大到动植物、小到细菌,都蕴含着独特的DNA,例如人体内就包含着23对染色体、30亿个碱基对的数据量。探索这些碱基对蕴藏的"生命密码",对于肿瘤早筛、罕见病诊治、靶向药物研制、遗传演化和精准医学研究等方面有重大助益。近期,北京英信未来科技有限公司(以下简称北京英信)联合浪潮信息,为求臻医学的高通量测序平台提供了分布式存储平台,为全国数百家医院的肿瘤患者提供了精准、高效的肿瘤基因检测服务。

肿瘤基因检测 为何要跑在大数据上

基因检测作为医疗领域的新应用,不仅需要基于大数据平台,利用极为精密的测序系统将基因序列解读出来,还要通过大数据分析、比对,精确地了解每个基因片段发挥的作用。在这方面,求臻医学拥有专业、丰富的经验。

求臻医学成立于2017年,以新一代基因测序和先进信息挖掘技术为基础,依托《中国肿瘤基因图谱计划》和《肿瘤精准医学大数据平台》项目,深度融合基因检测和人工智能,致力于肿瘤液态活检领域诊断产品的开发及智能迭代升级,业务涵盖肿瘤早筛、伴随诊断、动态监测、预后评估等多场景应用领域,同时不断探索发现中国人肿瘤基线及特异的生物标志物,助力抗肿瘤药物的研发。

然而,随着业务高速发展,求臻医学服务的医院、患者越来越多,数据量也相应的急速增长,原有的数据存储系统常常因巨量访问而超过性能阈值,存储系统也存在容量空间严重不足的情况。在这种情况下,求臻医学计划对原有的数据存储平台进行升级,新建的数据存储平台将主要支持肿瘤精准诊疗的生物医学信息化平台。

此平台涵盖了知识数据库、临床信息采集系统、数据注释接口(API)等模块系统,可以基于大数据分析为基因检测客户生成个体化的检测报告。整个信息平台数据存储的基础设施有着较大的挑战和要求:

首先,是存储数据量的需求。一个完整的基因测序样本会产生千万量级的文件。据了解,目前一台先进的测序仪、分析仪等设备每天捕捉的测序数据平均水平已达到4TB,加之基因信息分析过程一般会产生原始数据量5倍左右的中间文件及结果,PB级别存储空间已经成为存储设备的基本要求。

其次,是数据可靠性的需求。肿瘤基因检测数据作为肿瘤精准诊疗核心数据,检测数据通常需要长期保存多年,通过合理的生命周期管理系统进行归档保留,数据的自动化迁移归档、数据的安全性、存储的易扩展性是数据归档存储考虑的重要因素。

最后,基因测序访问实时性要求高。基因测序过程是一个超高并发的文件转换过程,整个生产过程有非常密集的文件读取和写入。整个生物样本的导入过程对文件存储的性能有着极高的要求,满足科研任务对不同文件高带宽的存储需求,既要文件系统必须提供超大文件数量的支持,同时必须在有限的时间内完成海量小文件的导入。

分布式存储:为基因测序构建数据基座

针对求臻医学基因测序应用数据量增长快、性能和可靠性要求高的业务特点,浪潮信息携手合作伙伴北京英信为求臻医学提供了专业化的存储解决方案。方案采用AS13000高密分布式存储,节点间管理网络采用千兆交换机,通过100GB高速IB网络连接前端并行计算业务集群,为前端业务构建了一套大容量、高可靠、高性能、低延迟的数据存储平台。

在容量方面,AS13000分布式存储集群由5个节点组成,每节点采用35块8T大容量硬盘配置,可提供PB级存储容量,满足海量数据存储需求。值得一提的是,该解决方案可实现分钟级扩充,最大可扩展至5120节点,在扩容同时可保障业务性能无明显波动,性能与容量随着节点的扩展而线性增长,避免对现有计算任务读写访问性能造成影响,使得存储系统的容量、性能在未来可随时按需扩展。

在可靠性方面,浪潮信息分布式存储平台AS13000提供副本和纠删码两种数据保护方式,为用户提供多层级的数据保护及容灾功能,充分保证检测任务以及前端计算任务7x24小时的连续读写访问。结合信息平台检测数据需要长期保存的业务特点,浪潮信息采用三副本的数据冗余保护方式,同时,还可搭配InView智能统一存储管理平台,对基因测序数据中心的设备进行管理,提供容量、性能、故障的智能化预测性分析,帮助运维人员预防硬件潜在故障,降低了存储的复杂性,同时也有效地降低了运维成本。

在性能方面,浪潮信息分布式存储解决方案针对基因测序数据特点采用冷热数据分级存储搭配全局缓存技术,实现热数据快速响应,延迟降低40%。对于对象类型数据,采用对象聚合技术,来提升单次落盘的对象大小,降低落盘操作次数,单节点恒定聚合带宽达2GB/s以上,确保基因测序任务的读写性能。

目前,基因测序应用范围在大幅扩展,从科研服务的基因图谱、遗传多样性,到医疗服务的疾病早筛和治疗都能涵盖,这对未来提升医疗智慧水平意义重大。浪潮信息始终坚持通过数据的力量,为基因测序基础研究储能,驱动精准医疗应用加速发展。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4310

    浏览量

    85837
  • 分布式
    +关注

    关注

    1

    文章

    895

    浏览量

    74502
收藏 人收藏

    评论

    相关推荐

    WDS分布式存储系统软件助力电信工程海量数据存储项目

    WDS分布式存储系统软件助力电信工程海量数据存储项目
    的头像 发表于 11-11 09:59 192次阅读
    WDS<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统软件<b class='flag-5'>助力</b>电信工程海量数据<b class='flag-5'>存储</b>项目

    浪潮信息AI存储性能测试的领先之道

    AI技术的无限可能。近日,在MLCommons的子项目MLPerf Storage v1.0性能基准评测中,浪潮信息再度展现了在AI存储领域的卓越实力。
    的头像 发表于 10-29 16:30 245次阅读
    <b class='flag-5'>浪潮信息</b>AI<b class='flag-5'>存储</b>性能测试的领先之道

    浪潮信息:元脑企智EPAI助力金融大模型快速落地

    浪潮信息在AI算力底座建设、大模型开发领域积累的成熟、成功经验工具化,助力金融机构又快、又稳地部署生成AI应用,助力金融数智化跨越发展
    的头像 发表于 09-20 16:07 351次阅读
    <b class='flag-5'>浪潮信息</b>:元脑企智EPAI<b class='flag-5'>助力</b>金融大模型快速落地

    基于分布式存储WDS的金融创云承载数据库类关键应用

    基于分布式存储WDS的金融创云承载数据库类关键应用
    的头像 发表于 08-16 09:42 275次阅读
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>WDS的金融<b class='flag-5'>信</b>创云承载数据库类关键应用

    澎湃认证:浪潮信息集中式存储携手长擎安全操作系统24完成兼容性认证

    北京2024年7月19日 /美通社/ -- 近日,长擎安全操作系统24与浪潮信息集中式存储HF/AS系列产品完成并通过浪潮信息澎湃技术相互兼容性测试认证,长擎安全操作系统24与
    的头像 发表于 07-19 13:53 299次阅读
    澎湃认证:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存储</b><b class='flag-5'>携手</b>长擎安全操作系统24完成兼容性认证

    浪潮信息推出AIGC存储解决方案

    隆重推出了基于其新一代分布式存储平台AS13000G7的AIGC存储解决方案,这一创新成果无疑为当前大模型应用面临的存储挑战提供了强有力的支持。
    的头像 发表于 07-03 11:16 721次阅读

    浪潮信息推出基于新一代分布式存储平台AS13000G7的AIGC存储解决方案

    6月28日,浪潮信息“元脑中国行”全国巡展杭州站顺利举行。会上,浪潮信息重磅推出基于新一代分布式存储平台AS13000G7的AIGC存储解决
    的头像 发表于 07-01 19:00 1430次阅读
    <b class='flag-5'>浪潮信息</b>推出基于新一代<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>平台AS13000G7的AIGC<b class='flag-5'>存储</b>解决方案

    浪潮信息分布式存储AS13000完成英特尔至强6能效核处理器适配

    近日,浪潮信息分布式存储AS13000完成英特尔至强6能效核处理器适配,实现每瓦性能提升2.3倍,以更高的效率、更优的成本满足海量多态数据的存储需求,充分释放数据价值。
    的头像 发表于 06-19 10:05 861次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>分布式</b><b class='flag-5'>存储</b>AS13000完成英特尔至强6能效核处理器适配

    CCF-TCIST走进浪潮信息 共话AI时代存储创新

    CCF信息存储技术专委会走进浪潮信息 共话大模型时代的存储创新之道 北京2024年6月7日 /美通社/ -- 近日,中国计算机学会
    的头像 发表于 06-07 14:27 285次阅读
    CCF-TCIST走进<b class='flag-5'>浪潮信息</b> 共话AI时代<b class='flag-5'>存储</b>创新

    浪潮信息北京伙伴共筑AI新生态

    近日,2024浪潮信息区域ISP伙伴战略签约仪式在京圆满落幕。此次盛会,浪潮信息与航天星桥、中天瑞合、圣世博泰、浩然泰同、浩普诚华、众创佳业等20家北京元脑生态伙伴共襄盛举,签署了战略合作协议。
    的头像 发表于 05-31 11:33 746次阅读

    浪潮信息发布AS13000G7-N系列分布式全闪存储

    浪潮信息近日推出了专为大型AI模型优化的AS13000G7-N系列分布式全闪存储。该系列基于浪潮信息自研的分布式文件系统,结合新一代数据加速
    的头像 发表于 05-14 10:03 565次阅读

    为大模型专门优化 浪潮信息发布分布式全闪存储AS13000G7-N系列

    北京2024年5月10日 /美通社/ -- 近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息
    的头像 发表于 05-10 16:37 428次阅读
    为大模型专门优化 <b class='flag-5'>浪潮信息</b>发布<b class='flag-5'>分布式</b>全闪<b class='flag-5'>存储</b>AS13000G7-N系列

    浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

    近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎D
    的头像 发表于 05-08 09:38 560次阅读
    <b class='flag-5'>浪潮信息</b>发布为大模型专门优化的<b class='flag-5'>分布式</b>全闪<b class='flag-5'>存储</b>AS13000G7-N系列

    一图读懂浪潮信息新一代分布式全闪存储AS13000G7-N系列

    一图读懂浪潮信息新一代分布式全闪存储AS13000G7-N系列
    的头像 发表于 05-08 09:35 1275次阅读
    一图读懂<b class='flag-5'>浪潮信息</b>新一代<b class='flag-5'>分布式</b>全闪<b class='flag-5'>存储</b>AS13000G7-N系列

    XEDP与KeyarchOS完成浪潮信息澎湃技术认证

    北京2024年2月27日 /美通社/ -- 近日,北京星辰天合科技股份有限公司(简称"XSKY星辰天合")企业级分布式统一数据平台XEDP与浪潮信息云峦操作系统KeyarchOS V5
    的头像 发表于 02-27 17:56 470次阅读
    XEDP与KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证