0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布AI平台,大幅减少超算数据中心的停机时间

NVIDIA英伟达 来源:英伟达NVIDIA中国 2020-06-24 16:02 次阅读

NVIDIA Mellanox UFM Cyber-AI平台检测安全威胁、预测网络故障并指导预测性维护

NVIDIA于今日发布NVIDIA Mellanox UFM Cyber-AI平台,该平台运用AI分析技术检测安全威胁和运行问题并预测网络故障,能够大幅减少InfiniBand数据中心的停机时间。

UFM平台产品系列已管理InfiniBand系统近十年,此次扩展将使用AI通过实时和历史遥测及工作负载数据来学习数据中心的运行节奏和网络工作负载模式。它能根据这一基准追踪系统的运行状况和网络修改并检测性能下降、使用情况和配置文件更改。

该全新平台可发出警报,提示系统和应用异常行为、潜在系统故障以及威胁,并执行纠正措施。它还能在系统遭受黑客攻击,安装恶意应用(例如加密币挖币软件)时发出安全警报。这减少了数据中心的停机时间,而根据ITIC的研究,停机1小时所造成的成本通常在30万美元以上。

NVIDIA Mellanox网络事业部高级营销副总裁Gilad Shainer表示:“ UFM Cyber-AI平台能够确定数据中心的独特生命体征并通过它们识别性能下降、组件故障和异常使用方式。有了它,系统管理员可以快速检测和响应潜在的安全威胁并解决即将发生的故障,从而节省成本,确保客户业务的连续性。”

来自生态系统合作伙伴的支持

长期以来在其数据中心使用UFM平台的企业机构对此最新产品表示了浓厚的兴趣。

澳大利亚国家计算基础设施(NCI Australia)的服务和技术副总监Allan Williams说:“NCI在国家研究领域发挥着关键作用。我们的超级计算基础设施为5000名研究人员提供服务,他们将其用于关键性的国家和国际研究活动。UFM使我们能够有效地管理超级计算机并优化其性能。我们期待利用UFM Cyber-AI的新功能,进一步提高我们的超级计算利用率,提高我们的投资回报。”

俄亥俄州超级计算机中心(Ohio Supercomputer Center)协会理事长Douglas Johnson表示:“多年来,我们的InfiniBand数据中心一直使用UFM平台。UFM和Mellanox网络团队的专业知识已成为我们管理网络和实现稳定性的基础。UFM Cyber-AI平台具有很多出众的优点。”

扩展UFM平台

UFM Cyber-AI平台对UFM Enterprise平台进行了补充。UFM Enterprise平台提供网络监视、管理、性能优化、配置检查和安全电缆管理功能。

NVIDIA今日还发布了UFM系列的第三款产品 —— UFM Telemetry平台。这款工具能够捕获实时网络遥测数据,该数据将被传输到本地或云端数据库,用于监视网络性能和验证网络配置。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4981

    浏览量

    102997
  • 数据中心
    +关注

    关注

    16

    文章

    4764

    浏览量

    72100
  • AI
    AI
    +关注

    关注

    87

    文章

    30763

    浏览量

    268906

原文标题:ISC 2020 | NVIDIA发布AI平台,大幅减少超算数据中心的停机时间

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NIDA发布《智算数据中心网络建设技术要求》

    Alliance,以下简称 “NIDA”)携手中国信息通信研究院等9家组织成员共同发布了《智算数据中心网络建设技术要求》(以下简称 “技术要求”)。该技术要求明确了智算场景下数据中心网络建设的技术要求与执行标准,旨在加速企业智
    的头像 发表于 12-04 11:13 333次阅读

    华为致力于打造安全可靠的智算数据中心

    数据中心能源产品与解决方案亮相盛会,同时,华为数字能源数据中心能源及关键供电产品线副总裁阳必飞受邀参与此次盛会,并发表《智算数据中心建设之道》主题演讲。   站在AI时代、智算
    的头像 发表于 11-23 14:05 290次阅读

    Credo新品发布!AEC高速互连如何赋能数据中心

    的基础支撑,还对大规模计算集群、新型数据中心的技术要求和评估方法进行规范。 到2025年底,全国数据中心整体上架率将不低于60%,平均电能利用效率也将降至1.5以下。 在AI技术及制造业的升级下,全球云
    的头像 发表于 10-17 11:09 286次阅读

    NVIDIA 在 Hot Chips 大会展示提升数据中心性能和能效的创新技术

    NVIDIA Blackwell 平台提供动力的最新技术进展,以及新的数据中心液冷研究成果和用于芯片设计的 AI 代理。 他们
    的头像 发表于 08-28 16:38 373次阅读
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大会展示提升<b class='flag-5'>数据中心</b>性能和能效的创新技术

    AI时代,我们需要怎样的数据中心AI重新定义数据中心

    超过60%的中国企业计划在未来12至24个月内部署生成式人工智能。AI、模型的构建,将颠覆数据中心基础设施的建设、运维和运营。一个全新的数据中心智能化时代已经拉开序幕。
    发表于 07-16 11:33 702次阅读
    <b class='flag-5'>AI</b>时代,我们需要怎样的<b class='flag-5'>数据中心</b>?<b class='flag-5'>AI</b>重新定义<b class='flag-5'>数据中心</b>

    数据中心、智算中心中心,有何区别?

    数据中心、智算中心中心是当前计算机领域中比较重要的研究方向,三者虽然都属于数据中心的范畴,但在服务领域、技术体系上存在显著的区别。服
    的头像 发表于 06-22 08:27 5334次阅读
    云<b class='flag-5'>数据中心</b>、智算<b class='flag-5'>中心</b>、<b class='flag-5'>超</b>算<b class='flag-5'>中心</b>,有何区别?

    NVIDIA为新工业革命打造 AI 工厂和数据中心

    搭载 Grace CPU 以及 NVIDIA 网络和基础设施,助力于企业建立 AI 工厂和数据中心,推动新一轮生成式 AI 突破。 NVIDIA
    的头像 发表于 06-03 18:14 983次阅读

    八大科技巨头携手推进UALink,加速数据中心AI互联

    近日,英特尔、Google、微软、Meta等八家科技巨头宣布共同成立加速器链接(UALink)推广小组,致力于推动数据中心AI加速器芯片的连接组件发展。UALink旨在优化数据中心
    的头像 发表于 05-31 10:59 830次阅读

    HNS 2024:星河AI数据中心网络,赋AI时代新动能

    华为数据通信创新峰会2024在巴库隆重举办,在“星河AI数据中心网络,赋AI时代新动能”主题论坛中,华为面向中东中亚地区发布星河
    的头像 发表于 05-15 09:15 649次阅读
    HNS 2024:星河<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>网络,赋<b class='flag-5'>AI</b>时代新动能

    #mpo极性 #数据中心mpo

    数据中心MPO
    jf_51241005
    发布于 :2024年04月07日 10:05:13

    华为联合中国信通院发布《华为星河AI数据中心网络测试报告》

    2024 开放数据中心委员会(以下简称ODCC)春季全会在江西婺源顺利召开,全会由ODCC副主席李洁博士主持。全会期间,华为联合中国信通院云大所数据中心团队发布《华为星河AI
    的头像 发表于 04-02 09:25 1463次阅读

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA Quantum-X800 InfiniBand 网络,打造性能最强大的 AI 专用基础设施 NVIDIA Spectrum-X800 以太网络,数据中心必备的优化
    发表于 03-19 10:05 332次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>发布</b>全新交换机,全面优化万亿参数级 GPU 计算和 <b class='flag-5'>AI</b> 基础设施

    是德科技推出AI数据中心测试平台

    是德科技近期宣布,针对蓬勃发展的AI和ML基础设施生态系统,隆重推出了全新的AI数据中心测试平台。该平台专为加速
    的头像 发表于 03-08 10:17 720次阅读

    是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,针对人工智能(AI)和机器学习(ML)基础设施生态系统,推出了 AI数据中心测试平台,旨在加
    的头像 发表于 02-29 09:32 629次阅读
    是德科技推出<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>测试<b class='flag-5'>平台</b>旨在加速<b class='flag-5'>AI</b>/ML网络验证和优化的创新

    澜起科技津逮服务器平台数据中心带来卓越的安全与性能

    津逮®服务器平台,一款由澜起科技精心打造的云计算数据中心解决方案,旨在为关键领域提供卓越的数据运算安全性和稳定性。该平台集成了津逮®CPU和混合安全内存模组(HSDIMM®)两大核心组
    的头像 发表于 01-31 11:43 1276次阅读