0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为的网络AI领域10大公开数据集是哪些

汽车玩家 来源:C114通信网 作者:C114通信网 2020-03-21 10:53 次阅读

在华为开发者大会HDC.Cloud 3月20号直播间,华为网络人工智能数据湖专家周尧,向开发者们正式发布了网络AI领域10大公开数据集,解决了网络AI开发缺乏工业级数据的难题。

这10大数据集是华为从外场仿真数据和实验室模拟数据,经过解析治理、探索标注之后的,可以直接应用于网络领域AI应用开发的数据集。分为“异常检测类”、“控制优化类”、和“故障定界类”三大类:

异常检测类

1)性能指标异常检测数据集:时间序列数据集,包括正样本和负样本,可应用于时序序列预测等算法的训练和验证;样本量100W条,特征维度7维

2)性能指标变更监控测数据集:覆盖4种网络业务变更场景,包括变更成功场景和失败场景,失败场景数据有对应标签;样本量100W条,特征维度40维

3)硬盘故障检测数据集:覆盖日立,希捷共计16款硬盘型号,累积标注坏盘数量超2300块,应用于硬盘故障预测类问题分析与研究;样本量超230W条,特征维度超100维(覆盖厂商公开SMART指标)

控制优化类

4)数据中心群控数据集:包含冷塔、冷机、泵等设备的供回水温度、压力、IT机房、冷站设备能耗100+维特征,可应用于数据中心水冷冷冻水场景制冷系统优化模型训练;样本量2W条,特征维度100维

5)数据中心PUE优化数据集:覆盖3种制冷场景、4种末端空调、冷站群控、IT机房等设备能耗数据,基于冷却系统完成关联,应用于PUE优化、网络领域控制类模型开发与研究;样本量2W条,特征维度110维

故障定界类

6)无线接入故障数据集:覆盖20种无线接入故障类型,告警数据与工单数据相关关联,业务专家团队准确标注,可用于告警压缩和根因定位类模型开发,样本量65w条,特征维度7维

7)无线&IPRAN故障数据集:告警数据基于无线接入和IPRAN的设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖37种故障类型,可用于告警压缩和故障定位,样本量700w+条,特征维度24维

8)无线&PTN故障数据集:告警数据基于无线基站、动力环境、PTN等设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖48种故障类型,可用于告警压缩和故障定位,样本量100w+条,特征维度61维

9)无线&微波故障数据集:告警数据基于无线基站、动力环境、微波等设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖29种故障类型,可用于告警压缩和故障定位,样本量100w+条,特征维度46维

10)PON光路故障数据集:PON光路故障场景数据,包含光纤弯曲、连接器松动等故障场景,覆盖光模块的电压,电流,接收光功率,发送光功率等特征,样本量4w条,特征维度11维

数据和特征决定了机器学习的上限,华为发布网络领域10大数据集,不但可以帮助网络AI开发者减少90%的数据集准备时间,更重要的是将会极大提高AI模型精度。目前已验证数据中心数据集助力AI模型达准确率达到89.77%,无线&IPRAN故障数据集提高高级聚合率到95.4%,查准率到90%。

现在使用华为云账号登录华为云,选择NAIE服务(路径:EI企业智能—智能体—网络智能体 NAIE),再从AI服务目录选择数据集服务,即可进入数据集服务页面选择所需公开数据集。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    34435

    浏览量

    251719
  • AI
    AI
    +关注

    关注

    87

    文章

    30887

    浏览量

    269060
收藏 人收藏

    评论

    相关推荐

    华为星河AI网络共赢行业智能化

    近日,华为年度旗舰活动——HUAWEI CONNECT 2024·PARIS开幕。大会期间,星河AI网络论坛成功举办,200+名全球行业领袖、技术专家和合作伙伴参加,共同探讨智能时代下数据
    的头像 发表于 11-18 11:29 360次阅读

    华为公开量子计算新专利

    近日,华为公司公开了一项名为“一种量子计算方法、装置、存储介质以及芯片系统”的专利,其公开号为CN118780379A。 该专利深入探索了量子计算的前沿领域。量子计算,作为一种利用量子
    的头像 发表于 10-27 10:00 368次阅读

    AI大模型的训练数据来源分析

    AI大模型的训练数据来源广泛且多元化,这些数据源对于构建和优化AI模型至关重要。以下是对AI大模型训练
    的头像 发表于 10-23 15:32 608次阅读

    如何训练自己的AI大模型

    和训练AI大模型之前,需要明确自己的具体需求,比如是进行自然语言处理、图像识别、推荐系统还是其他任务。 二、数据收集与预处理 数据收集 根据任务需求,收集并准备好足够的数据
    的头像 发表于 10-23 15:07 1460次阅读

    华为入选AI Ethernet Fabric技术领域代表供应商

    近日,全球信息技术研究和顾问公司Gartner发布了2024年企业网络的技术成熟度曲线报告(《Hype Cycle for Enterprise Networking, 2024》)。华为入选AI Ethernet Fabric
    的头像 发表于 09-02 18:01 917次阅读

    成为集成电路设计高手的必经之路:科目攻略大公开

    随着科技的快速发展,集成电路已经成为现代电子信息技术的重要组成部分。集成电路设计与集成系统专业作为培养这方面人才的重要途径,涵盖了广泛的学科领域。本文将详细介绍学习集成电路设计与集成系统专业需要学习的科目,帮助读者更好地了解这一专业的学习内容和要求。
    的头像 发表于 08-14 11:07 1080次阅读
    成为集成电路设计高手的必经之路:科目攻略<b class='flag-5'>大公开</b>

    请问NanoEdge AI数据该如何构建?

    我想用NanoEdge来识别异常的声音,但我目前没有办法生成模型,我感觉可能是数据的问题,请问我该怎么构建数据?或者生成模型失败还会有哪些原因?
    发表于 05-28 07:27

    华为发布星河AI制造网络,构筑智能制造新基座

    近日,华为AI+制造行业峰会智能联接论坛在深圳举办,华为携手众多客户、伙伴共同探讨了在AI时代背景下制造网络的新趋势和前沿解决方案。
    的头像 发表于 05-19 11:08 567次阅读

    HNS 2024:星河AI数据中心网络,赋AI时代新动能

    华为数据通信创新峰会2024在巴库隆重举办,在“星河AI数据中心网络,赋AI时代新动能”主题论坛
    的头像 发表于 05-15 09:15 657次阅读
    HNS 2024:星河<b class='flag-5'>AI</b><b class='flag-5'>数据</b>中心<b class='flag-5'>网络</b>,赋<b class='flag-5'>AI</b>时代新动能

    家用路由器使用技巧大公开:让你告别网络卡顿!

    家用路由器使用技巧包括了解基础知识、正确设置、合理利用性能、解决常见问题及安全防护。通过合理设置、维护和升级固件,可以有效提升家庭网络体验并保护网络安全。
    的头像 发表于 04-24 11:28 639次阅读

    深度专访:半导体激光领军者,20余载技术沉淀与成长轨迹大公开

    经过五十多年的不懈努力和深入研究,半导体激光技术已站在全球科技前沿,成为激光产业的坚实基石。近年来,随着智能设备、消费电子、新能源等领域的蓬勃发展,半导体激光器的需求迅速增长,同时其在医疗仪器设备等
    的头像 发表于 04-03 16:38 2302次阅读
    深度专访:半导体激光领军者,20余载技术沉淀与成长轨迹<b class='flag-5'>大公开</b>

    华为联合中国信通院发布《华为星河AI数据中心网络测试报告》

    2024 开放数据中心委员会(以下简称ODCC)春季全会在江西婺源顺利召开,全会由ODCC副主席李洁博士主持。全会期间,华为联合中国信通院云大所数据中心团队发布《华为星河
    的头像 发表于 04-02 09:25 1474次阅读

    一图看懂星河AI数据中心网络,全面释放AI时代算力

    华为中国合作伙伴大会 | 一图看懂星河AI数据中心网络,以网强算,全面释放AI时代算力
    的头像 发表于 03-22 10:28 758次阅读
    一图看懂星河<b class='flag-5'>AI</b><b class='flag-5'>数据</b>中心<b class='flag-5'>网络</b>,全面释放<b class='flag-5'>AI</b>时代算力

    NanoEdge AI的技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI 的技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术包括边缘计算、神经网络压缩和低功耗硬
    发表于 03-12 08:09

    自动驾驶领域数据汇总

    发自动驾驶论文哪少的了数据,今天笔者将为大家推荐一篇最新的综述,总结了200多个自动驾驶领域数据,大家堆工作量的时候也可以找一些小众的
    的头像 发表于 01-19 10:48 1006次阅读
    自动驾驶<b class='flag-5'>领域</b>的<b class='flag-5'>数据</b><b class='flag-5'>集</b>汇总