0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里巴巴再度开放一份计算机集群的真实数据集(Alibaba Cluster Data V2018)

vsUE_AI_Career 来源:lq 2018-12-25 16:31 次阅读

阿里妹导读:打开一篇篇 IT 技术文章,你总能够看到“大规模”、“海量请求”这些字眼。这些功能强大的互联网应用,都运行在大规模数据中心上。数据中心每个机器的运行情况如何?运行着什么样的应用?应用有什么特点?除了少数资深从业者之外,普通学生和企业的研究者很难了解其中细节。

今天,阿里巴巴再度开放一份计算机集群的真实数据集(Alibaba Cluster Data V2018)。该数据集中记录了某个生产集群中服务器以及运行任务的详细情况。我们希望这波数据的发布可以拉近我们与学术研究、业界同行之间的距离,推动产业的进一步发展。

下面,阿里系统软件事业部的技术专家临石,为大家深入介绍这份独特的数据集。

2015 年,我们尝试在阿里巴巴的数据中心,将延迟不敏感的批量离线计算任务和延迟敏感的在线服务部署到同一批机器上运行,让在线服务用不完的资源充分被离线使用以提高机器的整体利用率。

经过 3 年多的试验论证、架构调整和资源隔离优化,目前这个方案已经走向大规模生产。我们通过混部技术将集群平均资源利用率从 10% 大幅度提高到 45%。另外,通过各种优化手段,可以让更多任务运行在数据中心,将“双11”平均每万笔交易成本下降了 17%。

那么,实施了一系列优化手段之后的计算机集群究竟是什么样子?混部的情况究竟如何?

为了让有兴趣的学生以及相关研究人员,可以从数据上更加深入地理解大规模数据中心,我们特别发布了这份数据集(Alibaba Cluster Data V2018)。数据集中记录了某个生产集群中服务器以及运行任务的详细情况。我们希望这波数据的发布可以拉近我们与学术研究、业界同行之间的距离。

在数据集中,你可以详细了解到我们是如何通过混部把资源利用率提高到 45%;我们每天到底运行了多少任务;以及业务的资源需求有什么特点。如何使用这份数据集,完全取决于你的需要。

这个数据可以做什么?

这份 Alibaba Cluster Data V2018 包含 6 个文件,压缩后大小近 50GB(压缩前270+GB),里面包含了 4000 台服务器、相应的在线应用容器和离线计算任务长达 8 天的运行情况。

通过这份数据,你可以:

了解当代先进数据中心的服务器以及任务运行特点;

试验你的调度、运筹等各种任务管理和集群优化方面的各种算法并撰写论文;

利用这份数据学习如何进行数据分析,揭示更多我们自己都未曾发现的规律。

上面这几点,没有接触过类似数据的朋友,可能对于这份数据的用处并没有直观的印象,下面我举几个简单的例子:

电商业务在白天和晚上面临的压力不同,我们如何在业务存在波峰波谷的情况下提高整体资源利用率?

你知道我们最长的 DAG 有多少依赖吗?

一个典型的容器存在时间是多久?

一个计算型任务的典型存在时间是多少?一个 Task 的多个 Instance 理论上彼此很相似,但是它们运行的时间都一样吗?

实际上,学者们甚至可以用这些数据作出更加精彩的分析。2017年,我们开放的第一波数据(Alibaba Cluster Data V2017),已经产生了多篇优秀的学术成果。

以下是学者们在论文中引用数据(Alibaba Cluster Data V2017)的例子,其中不乏被 OSDI 这样顶级学术会议收录的优秀文章。我们期待,未来你也能与我们共同分享你用这份数据产生的成果!

"LegoOS: A Disseminated, Distributed OS for Hardware Resource Disaggregation, Yizhou Shan, Yutong Huang, Yilun Chen, and Yiying Zhang, Purdue University. OSDI'18"(Best paper award!)

"Imbalance in the Cloud: an Analysis on Alibaba Cluster Trace, Chengzhi Lu et al. BIGDATA 2017"

"CharacterizingCo-located Datacenter Workloads: An Alibaba Case Study, Yue Cheng, Zheng Chai,Ali Anwar. APSys2018"

"The Elasticity and Plasticity in Semi-Containerized Co-locating Cloud Workload: aView from Alibaba Trace, Qixiao Liu and Zhibin Yu. SoCC2018"

Cluster Data V2018 更出色

新版本 V2018 与 V2017 存在两个最大的区别:

DAG 信息加入

我们加入了离线任务的 DAG 任务信息,据了解,这是目前来自实际生产环境最大的 DAG 数据。

究竟什么是 DAG?离线计算任务,例如 Map Reduce、Hadoop、Spark、Flink 中常用的任务,都是以有向无环图(Directed Acyclic Graph,DAG)的形式进行编排的,其中涉及到任务之间的并行、依赖等方面。下面是一个 DAG 的例子。

规模更大

上一版数据包含了约 1300 台机器在约 24 小时的内容数据,而新版 Cluster Data V2018 中包括了 4000 台机器 8 天的数据。

我们建立了一个关于Cluster Data V2018的交流钉钉群。使用钉钉搜索群号:23112775,即可加入。点击文末“阅读原文”,可填写调查问卷。

想看到更多数据?我们长期招收研究型实习生,与我们一起发现问题、解决问题,挑战世界级技术问题,欢迎投递简历:haiyang.dhy@alibaba-inc.com

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9025

    浏览量

    85189
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1610

    浏览量

    47114
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24648

原文标题:阿里重磅开源!4000台服务器真实数据集,揭秘世界级数据中心

文章出处:【微信号:AI_Career,微信公众号:人工智能见闻】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    阿里巴巴整合电商资源,成立全新电商事业群

    业群将由蒋凡担任CEO,直接向吴泳铭汇报。该事业群将全面覆盖并整合阿里巴巴旗下的淘宝天猫集团、国际数字商业集团,以及1688、闲鱼等核心电商业务。这整合举措旨在打造个覆盖国内外全产业链的综合性业务
    的头像 发表于 11-22 10:51 101次阅读

    阿里巴巴国际站首推全流程AI产品

    近日,阿里巴巴国际站正式推出了其首个全流程AI产品——AI生意助手2.0。这创新产品的问世,标志着阿里巴巴在助力中小企业外贸经营方面迈出了重要步。
    的头像 发表于 10-30 16:12 194次阅读

    阿里巴巴计算入股苏州语灵人工智能科技公司

    近日,国内云计算巨头阿里巴巴计算有限公司(简称“阿里云”)在人工智能领域的布局再下城,宣布入股苏州语灵人工智能科技有限公司(简称“苏州语
    的头像 发表于 08-30 18:03 1710次阅读

    阿里巴巴完成双重主要上市

    8月28日阿里巴巴在香港联交所主板主要上市,成为在港交所、纽交所双重主要上市的公司。如今,阿里巴巴完成双重主要上市。 此外,有投资机构认为阿里巴巴最快有望于9月就纳入港股通。 截至8
    的头像 发表于 08-29 16:06 350次阅读

    阿里巴巴季报出炉 阿里云二季度营收增长6%

    阿里巴巴季报出炉我们起来围观下,根据阿里巴巴集团发布的截至2024年6月30日的第二季度经营业绩数据显示,
    的头像 发表于 08-16 16:45 469次阅读

    阿里巴巴投资逐际动力,深化智能机器人布局

    近日,阿里巴巴集团对深圳逐际动力科技有限公司(简称:逐际动力)进行战略投资,此举再次体现了阿里巴巴在智能机器人领域的坚定布局。
    的头像 发表于 05-22 11:52 761次阅读

    阿里巴巴集团2024财年稳健增长

    阿里巴巴集团近日公布了其2024财年第四季度及全年业绩报告,数据亮眼。在经历年的主动变革后,阿里巴巴重回健康增长轨道。
    的头像 发表于 05-16 11:23 644次阅读

    阿里巴巴杭州全球总部正式启用

    近日,阿里巴巴在杭州的未来科技城正式揭开了其全球总部新园区的面纱。这座园区不仅是阿里巴巴目前规模最大的综合性办公空间,更是其绿色、科技、可持续发展理念的生动体现。
    的头像 发表于 05-13 11:15 522次阅读

    阿里巴巴减持小鹏汽车股份至9.24%

    据美东时间 3 月 20 日披露,小鹏汽车于美国证券交易委员会文件中透露,阿里巴巴旗下淘系平台淘宝中国控股有限公司(Taobao China Holding Limited)正计划出售 3300 万小鹏汽车 ADS,市值约为 3.14 亿美元(约合人民币 22.61 亿
    的头像 发表于 03-21 10:45 684次阅读

    阿里巴巴重返中国顶级电商轨道

    阿里巴巴集团董事会主席蔡崇信近日宣布,经过系列架构重组和管理层变动后,阿里巴巴已成功重返中国顶级电商轨道。蔡崇信在讲话中强调,公司正在逐步调整战略,重新定位其在电商领域的领导地位。
    的头像 发表于 02-27 14:29 879次阅读

    阿里巴巴涨超3% 财报或超预期

    阿里巴巴涨超3% 今日港股开盘后阿里巴巴涨超3%,恒生科技表现也很亮眼。快手、比亚迪电子、联想集团等多股上涨。 阿里巴巴将于2月7日发布2024财年第三季度财报,业界分析会超预期。
    的头像 发表于 02-06 16:05 1460次阅读

    软银子公司确认减持阿里 阿里巴巴最大股东易主

    ;也放弃了保留股份的选择权,因此Skybridge实际上算是已经完成了阿里巴巴股份的减持。但是在结算过程中相关各方没有在市场上买卖任何阿里巴巴新股。 目前最新的消息显示,根据披露的数据来看,马云与蔡崇信近期加大力度在增持
    的头像 发表于 01-26 20:45 1759次阅读

    软银已完成减持阿里巴巴股份

    近日,软银集团全资子公司Skybridge LLC宣布,已完成对阿里巴巴股份的减持。这决定是在经过深思熟虑后作出的,旨在优化公司的财务结构和未来的投资策略。
    的头像 发表于 01-26 15:58 823次阅读

    马云大幅增持阿里股票 马云取代软银成为阿里巴巴最大股东

    数量已超过软银的持股比例。 根据证券备案文件数据显示,马云在23年四季度购买了价值5000万美元的香港上市股票,而且蔡崇信也是大手笔加仓,在去年第四季度通过其Blue Pool Management家族投资工具购买了价值约1.51亿美元的阿里巴巴
    的头像 发表于 01-24 18:55 1046次阅读

    深夜,阿里巴巴“出售”小鹏?

    对此,阿里巴巴集团相关负责人表示,“我们根据自身的资本管理目标,出售了所持的部分小鹏股份。小鹏是中国电动汽车领域的领军者之,我们已与其建立了战略合作关系。我们相信小鹏的前景,期待与该公司的持续合作。”
    的头像 发表于 12-18 16:31 612次阅读