开源大数据生态下的 Flink 应用实践

过去十年，面向整个数字时代的关键技术接踵而至，从被人们接受，到开始步入应用。大数据与计算作为时代的关键词已被广泛认知，算力的重要性日渐凸显并发展成为企业新的增长点。Apache Flink（以下简称 Flink）以其快速、准确的算力备受关注，如何将 Flink 更好的与大数据生态技术相结合，充分挖掘数据的潜力，真正发挥数据的价值，是大多数企业面临的难题。

11 月 28-30 日，Flink Forward Asia 邀请来自阿里巴巴、戴尔科技集团、英特尔、Cloudera、趣头条、百度、Stream Native 等不同方向的技术专家围绕 Apache Flink 核心大数据生态探讨当下大数据的发展趋势与未来动向，并展现相关技术在一线生产场景的优秀实践。

点击可了解大会详情，购买参会门票

部分精彩议题概览

Apache Flink and the Apache Way

Fabian HueskeApache Flink PMC，Ververica Co-founder, Software Engineer

Apache Flink is a project of the Apache Software Foundation (ASF). The ASF is the world's largest open source foundation and the home of more than 350 individual projects and initiatives.

Every ASF project is independently governed and managed by its own community but follows the principles of the ASF, the so-called Apache Way. Knowing the Apache Way is important to fully understand how the community of an ASF project works.

In this talk, I'll briefly explain the Apache Way and how ASF projects organize themselves. I'll take a look back at how the Apache Flink community started and its journey to where it is today.

Finally, I'll give you some guidance and advice that will help you to start contributing to Apache Flink and maybe become a committer at some point in the future.

Optimize Apache Flink on Kubernetes with YuniKorn Scheduler

杨巍威，Cloudera资深软件工程师杨弢，阿里巴巴技术专家

将 Flink 运行在 K8s 很简单，但是当我们尝试在 K8s 集群上运行大规模 Flink 的任务，并对多租户环境和 SLA 有严苛要求时，各种问题开始显现出来。尤其是在调度层面，我们发现 Flink 的作业调度变慢，并且资源的分配变得混乱且毫无公平性，这样往往会导致作业饿死，或者资源浪费。于是我们开始寻求利用 YuniKorn 来解决在 K8s 上的调度问题。

YuniKorn 是一个开源的，轻量级，通用的资源调度器，可以很容易的适配到 K8s。相比原生的 K8s 调度器，YuniKorn 提供了更加丰富的调度特性，比如层级队列、资源公平性保证、强占以及更好的性能，更加适合大规模多租户、长运行以及批处理作业并存的场景下使用。YuniKorn 的调度会考量应用，用户以及队列等各个维度的资源使用情况，提供基于公平性原则的弹性容量配置。在这个议题中，我们将主要从如何通过 YuniKorn 来优化 Flink 在 K8s 上的运行，包括性能、多租户、资源公平性等方面的与大家进行探讨。

趣头条基于 Flink+ClickHouse 构建实时数据分析平台

王金海，趣头条数据平台负责人

趣头条一直致力于使用大数据分析指导业务发展。目前在实时化领域主要使用 Flink+ClickHouse 解决方案，覆盖场景包括实时数据报表、Adhoc 即时查询、事件分析、漏斗分析、留存分析等精细化运营策略，整体响应 80% 在 1 秒内完成，大大提升了用户实时取数体验，推动业务更快迭代发展。本次分享主要内容：

业务场景与现状分析
Flink to Hive 的小时级场景
Flink to ClickHouse 的秒级场景
未来规划

基于 Apache Flink 的边缘流式计算

袁尤军，百度云资深研发工程师黄家天，百度云物联网部实时计算高级研发工程师

随着 5G 和 IoT 技术的发展，计算将从现在的云端蔓延到更多其他的地方，其中一个典型的场景就是边缘计算。与云端强大的计算集群相比，这些场景设备的计算能力非常受限。Apache Flink 作为新一代流式计算引擎，已经广泛应用在诸多顶级互联网公司的云上。但如何在资源极度受限的边缘设备上运行流式计算引擎，尚无成功案例可循。

我们相信 Apache Flink 不应该仅仅运行在云端，而应该运行在任何需要设备上。本次演讲，我们将分享百度智能云在边缘设备上运行流式作业的一些探索，介绍如何将作业的内存消耗降低到 10M 以内，以及如何实现作业对运行环境的零依赖。会上将重点介绍百度基于 Flink 自研的边缘流式计算框架 Creek，重点内容包括：

介绍流式计算在边缘设备的意义和挑战
介绍 Creek 的技术方案
展示 Creek 的性能指标
现场演示 Creek 作业的构建和运行

Apache Flink 与 Apache Hive 的集成

李锐，Apache Hive PMC，Apache Flink Contributor，阿里巴巴技术专家王刚，阿里巴巴高级开发工程师

在大数据领域，Hive 已经成为数据仓库事实上的标准。为了丰富 Flink 的生态，从 1.9.0 版本开始，我们提供了 Flink 与 Hive 集成的能力，让用户可以通过 Flink 来读写 Hive 中的表。在 1.9.0 发布之后，我们进一步完善了 Flink-Hive 集成的功能，包括支持更全面的数据类型、更好地支持 DDL 以及 Function 等。

在新版本中，我们可以支持更多的应用场景，并提供更好的易用性。本次演讲将介绍 Flink-Hive 集成的设计架构、项目进展以及后续版本中的新功能。最后，我们还将演示如何使用 Flink 与 Hive 进行交互。

开源大数据生态专场完整议程

除上述议题外，开源大数据生态专场还有来自戴尔科技集团、英特尔、Stream Native 等重量级嘉宾以及 Apache Member、Apache Flink PMC、Apache Calcite Committer 等带来的更加精彩的分享。完整议程如下：

（11 月 28 日下午，专场议程）

（11 月 29 日上午，专场议程）

深度培训，实现技术与应用能力的积累提升

11 月 11-14 日，Flink Forward Asia 培训课程门票买一赠一，限时 3 天！点击阅读原文预约培训课程，然后加微信（ID：candy1764）提供共同参加培训的小伙伴名单，活动时间截止 11 月 14 日中午 12:00，数量有限，赠完即止，对培训心动的同学赶紧下手啦！

Apache Flink PMC 带队，超豪华阵容，阿里巴巴及 Flink 创始团队资深技术专家担任培训讲师，为开发者培训课程制定全面学习体系。

课程能够满足不同学习需求，无论是入门还是进阶，开发者可根据自身基础选择课程内容，实现技术与应用能力上的积累与提升。

课程主要大纲如下：

中阶一：Apache Flink 开发人员培训

Tips：本课程为纯英文授课，同时配有2位中文技术专家支持解答问题。

本课程是对想要学习构建流应用程序的 Java 和 Scala 开发人员进行的关于 Apache Flink 的实践介绍。培训将重点介绍分布式数据流、事件时间和状态等核心概念。练习将使您有机会了解以上概念在 API 中是如何被体现的，并了解如何将这些概念组合用以解决实际问题。

介绍流计算和 Apache Flink
DataStream API 的基础
为 Flink 开发做准备(包括练习)
有状态的流处理(包括练习)
时间、定时器和 ProcessFunction(包括练习)
连接多个流(包括练习)
测试(包括练习)

说明：不需要 Apache Flink 的相关知识。

中阶二：Apache Flink 运维培训

本课程是针对 Apache Flink 应用程序的部署和操作相关的实践性介绍。目标受众包括负责部署 Flink 应用程序和维护 Flink 集群的开发人员和运维人员。演示将重点介绍 Flink 运行中涉及的核心概念，以及用于部署、升级和监控 Flink 应用程序的主要工具。

介绍流计算和 Apache Flink
数据中心里的 Flink
分布式架构介绍
容器化部署(包括实际操作)
状态后端和容错(包括实际操作)
升级和状态迁移(包括实际操作)
指标(包括实践)
容量规划

说明：不需要对 Apache Flink 有先验知识。

中阶三：SQL 开发人员培训

Apache Flink 支持 SQL 作为流处理和批处理的统一 API。SQL 可以用于各种各样的场景，并且相比使用 Flink 的底层 API，SQL 将更容易构建和维护。在本次培训中，您将学习到如何充分发挥使用 SQL 来编写 Apache Flink 作业的潜力。我们将研究流式 SQL 的不同案例，包括连接流数据、维表关联、窗口聚合、维护物化视图，以及使用 MATCH RECOGNIZE 子句进行模式匹配（这是 SQL 2016 新提出的标准）。

介绍 SQL on Flink
使用 SQL 查询动态表
连接动态表
模式匹配与 match_recognition
生态系统&写外部表

说明：不需要 Apache Flink 的先验知识，但是需要基本的 SQL 知识。

高阶：Apache Flink 调优和问题排查

在过去的几年中，我们与许多 Flink 用户合作沟通期间了解到许多将流计算作业从早期 PoC 阶段慢慢过渡到生产过程中最常见的挑战。在此次培训中，我们将集中精力介绍这些挑战，并且帮助大家一起消除它。我们将提供一个有用的故障诊断工具集，并介绍例如监控、水印、序列化、状态后端等领域的最佳实践和技巧。在实践课程的间隙中,参与者将有机会使用新学习到的知识来解决一些异常 Flink 作业表现出来的问题。同时，我们也将归纳那些使作业没有进展或吞吐量没有达到预期，或作业延迟的常见原因。

时间和水印
状态处理和状态后端
Flink 的容错机制
检查点和保存点
DataStream API 和 ProcessFunction。

培训系列课程为精品小班教学，数量有限，预约满额将关闭入口，有相关培训需求的同学可尽早预约。详细说明：

参加培训请选择购买 VIP 套票。中阶培训购买 VIP 套票 1，高阶培训购买 VIP 套票 2。
VIP 套票 1 可参与中阶所有课程，VIP 套票 2 可参与包括高阶、中阶培训在内的所有课程。

如果你也好奇 Flink 未来的主要探索方向，如何利用 Flink 将大数据、算力推到极致，Flink 有哪些新场景、新规划以及最佳实践等话题，来现场吧！相信这群来自一线的技术专家们，一定会刷新你对 Apache Flink 的认知。

原文链接

本文为云栖社区原创内容，未经允许不得转载。

阅读全文

首个鸿蒙生态创新中心在深揭幕，开启鸿蒙产业新篇章共绘鸿蒙原生应用开发新篇章

热烈祝贺，并寄语创新中心不断创新、发展，成为广东省智能终端产业的重要引擎和创新高地，为广东省数字经济发展做出更大的贡献。广东省政务服务和数据管理局党组成员、副局长熊雄鸿蒙生态创新中心（下称创新

2024-03-20 09:55:27

深圳力挺开源鸿蒙原生应用，深开鸿全力加速开源鸿蒙生态

近日，深圳市工业和信息化局、深圳市政务服务和数据管理局联合印发《深圳市支持开源鸿蒙原生应用发展2024年行动计划》（以下简称《行动计划》）。据悉，这是全国首个针对鸿蒙原生应用发展的政府行动计划

2024-03-06 14:33:02

162

CYBT-343026传输大数据时会丢数据的原因？

我正在使用 CYBT-343026 (CYW-20706 Silicon) 模块。我根据 SPP 样本制作了一个操作 SPP 的应用程序。但是，传输大数据时有时会丢失数据。它从

2024-03-01 15:04:56

大数据技术是干嘛的大数据核心技术有哪些

大数据技术是指用来处理和存储海量、多类型、高速的数据的一系列技术和工具。现如今，大数据已经渗透到各个行业和领域，对企业决策和业务发展起到了重要作用。本文将详细介绍大数据技术的概念、发展背景，以及大数据

2024-01-31 11:07:26

529

开放原子校源行（北理工站）成功举办，多举措赋能开源人才建设，助力开源生态繁荣发展

“开放原子校源行”公益项目由开放原子开源基金会与腾讯公司共同出资设立发起。双方携手通过建立高校开源社团、普及开源文化、研发开源课程体系等方式探索产教融合新路径。为高校开发者提供更大的实践舞台，培养

2024-01-09 19:35:01

419

米哈游大数据云原生实践

近年来，容器、微服务、Kubernetes 等各项云原生技术的日渐成熟，越来越多的公司开始选择拥抱云原生，并开始将 AI、大数据等类型的企业应用部署运行在云原生之上。以 Spark 为例，在云上运行

2024-01-09 10:41:14

217

赋能行业，共赢未来：2023开源产业生态大会OpenHarmony生态论坛成功举办

信息技术协会统筹主办的2023开源产业生态大会在上海开幕。华为携手OpenAtom OpenHarmony（以下简称“OpenHarmony”）项目群生态委员会举办OpenHarmony生态论坛，邀请

2023-12-21 21:15:01

314

诚邀报名｜黄向东邀您共话开源工业物联网大数据

了坚实的技术基础。在推进新型工业化建设的征程中，应对各种复杂的工业场景，亟需在底层操作系统、物联网数据采集、数据管理以及数据分析应用等全生命周期取得软件技术突破。 “开源工业物联网大数据分论坛”旨在汇聚相关领域的知名开源项目和企业，分享他们在这一领域的创新成果与实践经验。作为

2023-12-20 16:54:11

167

软通动力子公司鸿湖万联亮相2023年开源产业生态大会

12月19日，由上海市经济和信息化委员会、上海市科学技术协会指导的开源产业年度盛会——2023年开源产业生态大会在上海盛大开幕。本次大会以“策码开源，万象惟新”为主题，汇聚政产学研用等多领域行业领袖

2023-12-20 09:45:02

186

开源工业物联网大数据分论坛圆满举办

日，“开源工业物联网大数据”分论坛在无锡成功召开。论坛以工业物联网大数据全生命周期管理为线索，邀请国内相关知名开源项目企业分享其典型成果，并邀请相关企业分享其实践案例。蘑菇云客空间共同创始人，DFRobot高级工程师夏青夏青

2023-12-20 09:40:03

289

开鸿智谷亮相2023开源产业生态大会

12月19日，2023开源产业生态大会在上海隆重召开。大会是由上海市经济和信息化委员会、上海市科学技术协会和"科创中国"开源创新联合体共同指导，作为富有前瞻性的开源产业创新盛会

2023-12-20 08:30:30

187

产学研三界顶级大咖分享：RISC-V场景Show暨开源生态高级别论坛定档12/19

12月19日，RISC-V场景Show暨开源生态高级别论坛即将开幕。本次论坛将邀请来自中科院计算技术研究所副所长包云岗、嘉楠科技AI软件总监张晓晶、阿里巴巴达摩院生态总监陈炜、清华大学长聘副教授陈渝

2023-12-15 18:36:40

生态发展人才先行 | 深开鸿亮相首届OpenHarmony人才生态大会

2023年12月12日，由开放原子开源基金会指导，OpenAtom OpenHarmony（以下简称“OpenHarmony"）项目群工作委员会主办的首届OpenHarmony人才生态大会在上海举行

2023-12-13 16:05:04

145

诚邀报名｜聚焦项目管理和社区协作，解读开源治理前沿见解和最佳实践

了多方的智慧，推动了社会的共同进步。伴随着近年来开源技术的迅猛发展，众多企业、组织和开发者纷纷加入开源生态。作为这一生态系统支柱的开源社区，其运营模式和治理策略日益受到广泛关注。开源治理与开发者运营论坛将深度探讨全球开源治理所遭遇的挑战，聚焦开源项目管理和社区协作的关键

2023-12-09 18:45:02

410

诚邀报名｜黄向东邀您共话开源工业物联网大数据

2023开放原子开发者大会 . OPEN ATOM DEVELOPERS CONFERENCE 开源工业物联网大数据分论坛 2023.12.17 物联网与大数据技术的飞速进步，为工业数字化转型

2023-12-05 19:35:01

342

Get职场新知识：做分析，用大数据分析工具

综合分析。但现在有了大数据分析工具，一切问题都可迎刃而解。 大数据分析工具，顾名思义就是专门为分析海量数据而开发的一类工具。这类工具具有极强的大数据分析、指标计算、数据可视化能力，能在极短的时间内统一数据

2023-12-05 09:36:05

【限量门票】繁荣生态，人才先行︱首届OpenHarmony人才生态大会即将在上海召开

单位代表等，介绍OpenHarmony社区生态及人才进展、展示OpenHarmony操作系统的技术革新、分享阶段性技术成果，围绕OpenHarmony人才生态发展中面临的各种问题、挑战与实践，一同探索

2023-12-04 16:30:36

【报名开启】繁荣生态，人才先行︱首届OpenHarmony人才生态大会即将在上海召开

共建单位代表等，介绍OpenHarmony社区生态及人才进展、展示OpenHarmony操作系统的技术革新、分享阶段性技术成果，围绕OpenHarmony人才生态发展中面临的各种问题、挑战与实践，一同

2023-12-04 16:23:07

OpenHarmony亮相MTSC 2023 | 质量&效率共进，赋能应用生态发展

的保障策略等内容。 OpenHarmony 兼容性工作组成员任熠分享了《OpenHarmony ArkUI-X 跨平台应用自动化测试能力实践》，ArkUI-X 跨平台在 2023 年 8 月已开源发布

2023-11-28 15:41:14

校源行 | 浙江大学软件学院：开源教育是从开源实践中走出来的

更大的实践舞台，培养更多的开源综合型人才，拓展开源贡献新领域，推动开源科研成果高效转化。一所高校该如何开展好开源教育？如何通过开源软件、开源社区以及开源理念做好人才培养？目前还没有形成一个具有普遍性的发展

2023-11-24 20:45:01

741

上海站报名启动！ 2023年开源产业生态大会OpenHarmony生态分论坛

作为年内开源领域不容错过的科技盛宴，2023年开源产业生态大会将于12月19日在上海盛大开幕。本次活动由上海市经济和信息化委员会、上海市科学技术协会和\"科创中国\"开源创新

2023-11-24 14:55:24

OpenHarmony技术大会丨诚迈科技共筑开源鸿蒙生态，引领智联未来

11月4日，以“技术筑生态，智联赢未来”为主题的第二届开放原子开源基金会OpenHarmony技术大会在北京国家会议中心盛大举行。诚迈科技作为OpenHarmony生态共建单位，通过共创签约、成果

2023-11-08 10:11:08

246

首届OpenHarmony竞赛训练营结营颁奖，75所高校学子助力建设开源生态

和开源合作的精神促进OpenHarmony生态系统的健康发展。动手实践成果初现，开源英才未来可期以终为始，着眼实际。训练营旨在鼓励高校人才以OpenHarmony为技术底座去解决更加具体的问题，此次

2023-11-07 17:10:05

校源行 | 人物专访——慕冬亮：开源是一场默默耕耘与培育生态的修行

更大的实践舞台，培养更多的开源综合型人才，拓展开源贡献新领域，推动开源科研成果高效转化。萌起于学生时代积极向开源项目提交贡献，缘至入职华中科技大学网络空间安全学院后兴趣使然，在业余时间为自己喜爱的开源项目

2023-11-06 19:10:02

593

陈海波：OpenHarmony技术领先，产学研深度协同，生态蓬勃发展

。根深叶茂，OpenHarmony四大技术架构竞争力领先，生态蓬勃发展 OpenHarmony以“面向万物智联世界，构建分布式全场景协同的开源操作系统基座与生态系统”为技术愿景，秉持“生态统一

2023-11-06 14:35:46

OpenHarmony技术大会：深开鸿引领技术革新，智创开源生态未来

11月4日，第二届开放原子开源基金会 OpenHarmony技术大会在北京国家会议中心盛大开幕。本届大会以“技术筑生态，智联赢未来”为主题，全球开源操作系统技术领袖，行业前沿领域的实践专家、高校

2023-11-05 18:05:02

391

OpenHarmony技术大会：深开鸿引领技术革新，智创开源生态未来

11月4日，第二届开放原子开源基金会OpenHarmony技术大会在北京国家会议中心盛大开幕。本届大会以“技术筑生态，智联赢未来”为主题，全球开源操作系统技术领袖，行业前沿领域的实践专家、高校技术

2023-11-05 08:33:57

191

技术筑生态智联赢未来，第二届OpenHarmony技术大会圆满举行

东在开场致辞中表示，OpenHarmony开源三年来，在开放原子开源基金会的组织和带领下，在产业界和学术界的大力支持下，已经成为智能终端领域飞速发展的开源操作系统。OpenHarmony不仅是千行百业

2023-11-04 14:59:45

技术筑生态，智联赢未来第二届OpenHarmony技术大会即将在京启幕

OpenHarmony操作系统的技术革新、分享阶段性技术成果，还将特邀全球开源操作系统技术领袖，行业前沿领域的实践专家、高校技术导师、众多开发者与贡献者，共话操作系统未来技术方向，共享开放生态布局进展，共绘

2023-10-31 11:27:39

2023年开放原子校源行（成都站）召开在即，邀您探索开源技术，共享开源实践

2023-10-30 19:45:05

403

限量门票！第二届开放原子开源基金会OpenHarmony技术峰会报名开启~

北京举办。峰会以“技术筑生态，智联赢未来”为主题，特邀全球开源操作系统技术领袖、前沿实践专家及高校技术导师，面向全球展示OpenHarmony操作系统的技术革新和阶段性成果，分享当前开放生态布局进展

2023-10-20 14:18:19

报名开启！第二届开放原子开源基金会OpenHarmony技术峰会来啦~

第二届开放原子开源基金会OpenHarmony技术峰会将于2023年11月4日在北京举办。峰会以“技术筑生态，智联赢未来”为主题，特邀全球开源操作系统技术领袖、前沿实践专家及高校技术导师，面向全球

2023-10-20 12:06:24

STM8L在低功耗模式下进行大数据运算会增加功耗吗？

STM8L在低功耗模式下进行大数据运算会增加功耗吗

2023-10-13 07:23:45

曙光生态环境大数据解决方案助力我国生态环境“大数据”建设

相通、数据不规范等难题。通过构建智慧高效的生态环境大数据体系成为推动我国生态环境保护的重要支撑。为全面提升生态环境系统化、科学化、精细化管理水平，曙光推出生态环境大数据解决方案。综合利用物联网、云计算、大数据、人

2023-10-11 15:51:58

313

Flink学习精要

Flink是Apache基金会旗下的一个开源大数据处理框架。目前，Flink已经成为各大公司大数据实时处理的发力重点，特别是国内以阿里为代表的一众互联网大厂都在全力投入，为Flink社区贡献了大量

2023-09-25 11:51:22

开源图形驱动在OpenHarmony上的使用和落地

，Arm Mali、Qualcomm Adreno和Nvidia等开源图形驱动也并没有特别“Open”。随着开源运动的兴起和成功，AMD和英特尔等公司的图形驱动开源建立了良好的生态，也取得了不错

2023-08-31 18:07:05

开鸿智谷正式升为开放原子开源基金会黄金捐赠人！

近日，开鸿智谷作为OpenHarmony生态委员会委员、OpenHarmony生态实践示范单位、OpenHarmony生态领航贡献单位、OpenHarmony代码核心贡献者，通过开放原子开源基金会

2023-08-29 08:32:15

571

微前端在大数据产品中的应用背景和应用原理

导读：本文由梯度科技前端研发部高级开发工程师贺信撰写，主要介绍如何基于前沿开源的前端技术方案实现微前端在大数据平台中的应用落地，并对所取得的应用效果进行剖析。主要包括以下几个方面：案例背景

2023-08-14 15:18:41

932

大数据是人工智能吗

大数据是人工智能吗随着互联网技术和数据采集技术的发展，数据量不断增大，大数据应运而生。大数据技术的出现，使得数据分析的速度和效率大幅提高，同时也为人工智能的发展提供了基础支撑。那么，大数据

2023-08-12 17:12:45

844

开源鸿蒙生态专题分享会圆满举办，推动南向硬件生态发展

2023年8月11日，“融创未来，芯动开源”开源鸿蒙生态专题分享会在深圳圆满举办，聚集了操作系统、芯片、半导体、开发板以及终端设备的专家、厂商代表，共同探讨开源鸿蒙操作系统南向开发技术创新和硬件

2023-08-11 18:55:03

615

中科驭数亮相DPU峰会，分享HADOS软件生态实践和大数据计算方案，再获评“匠芯技术奖”

的共创效应，汇聚行业先锋力量，共同探讨DPU关键技术实践、软件生态建设，典型应用场景和标准进展。作为国内DPU算力基础设施领军企业，中科驭数应邀发表主题演讲，并携最新DPU芯片及相关产品和解决方案亮相展区，成为本次峰会的一大亮点。会

2023-08-04 17:35:02

523

Flink社区风波：比Flink快十倍的技术真存在吗？

今天，RisingWave 指出，两份报告的结果差异是由环境差异造成：在 Flink 团队成员的测试环境中，“Flink 使用了三倍于我们测试环境的 CPU，六倍于我们测试环境的内存。同时我们的测试

2023-08-02 15:56:46

290

标量场数据可视化（下）(2)#大数据

大数据

未来加油dz发布于 2023-07-18 13:27:27

标量场数据可视化（下）(1)#大数据

大数据

未来加油dz发布于 2023-07-18 13:26:33

大数据华而不实么？大数据的本质是什么？

随着科技的发展和信息技术的迅猛进步，大数据概念逐渐走入人们的视野，成为各行各业的热门话题。然而，一些人对大数据持怀疑态度，认为其只是一种虚幻的概念，华而不实。那么，大数据的本质究竟是什么呢？

2023-07-12 15:58:14

309

Hadoop生态系统(2)#大数据分析

大数据分析

学习硬声知识发布于 2023-07-11 14:39:24

Hadoop生态系统(1)#大数据分析

大数据分析

学习硬声知识发布于 2023-07-11 14:38:59

实践--介绍(2)#大数据处理

大数据

未来加油dz发布于 2023-07-05 11:25:40

实践--介绍(1)#大数据处理

大数据

未来加油dz发布于 2023-07-05 11:25:13

培育开源人才，助力开源生态发展｜2023开放原子全球开源峰会校源行分论坛圆满落幕

实践、开源教育、开源经历进行干货分享，精彩不断。刘京娟分享了开放原子校源行工作进展及规划。她表示，“开放原子校源行”是开放原子开源基金会发起的长期性公益项目，拟通过资助设立开源社团、推广开源课程、设置开源助学金等方式培

2023-06-19 11:14:50

395

培育开源人才，助力开源生态发展｜2023开放原子全球开源峰会校源行分论坛圆满落幕

6月13日，2023开放原子全球开源峰会校源行分论坛在北京成功召开。本次分论坛以“聚缘于校、开源共行”为主题，知名高校、优秀开源社团代表，开源大使和社区专家，头部科技企业等群贤毕至，围绕开源实践

2023-06-16 21:15:02

719

汇聚各界力量推动智能出行领域深度发展｜2023开放原子全球开源峰会CARSMOS开源智能出行生态年会圆满举行

CARSMOS 开源智能出行生态年会圆满举行。本场论坛汇聚多位供应链、产学研界专家学者和企业高层建言献策，分享智能出行领域开源技术的最新理论、技术和实践应用成果，共同探讨如何在高校推广智能出行中的开源技术，以开源平台模式凝聚产学研各界力量，加速自动驾驶和智能出行技术的发展和商业化产品落地。

2023-06-16 14:37:07

386

汇聚各界力量推动智能出行领域深度发展｜2023开放原子全球开源峰会CARSMOS开源智能出行生态年会圆满举行

全球开源峰会CARSMOS开源智能出行生态年会圆满举行。本场论坛汇聚多位供应链、产学研界专家学者和企业高层建言献策，分享智能出行领域开源技术的最新理论、技术和实践应用成果，共同探讨如何在高校推广智能出行中的开源技术，以开源平台模式凝聚产学研各界力量，加速自动驾驶和智能出行技术的发展

2023-06-16 12:00:03

342

探索开源创新理论｜2023开放原子全球开源峰会开源创新理论与实践分论坛成功召开

6月13日，以“开源产业与数字经济的未来”为主题的2023开放原子全球开源峰会开源创新理论与实践分论坛在北京成功召开。论坛邀请了众多开源专家学者，围绕当前开源理论创新与实践的整体环境，探讨开源产业

2023-06-16 12:00:02

710

探索开源创新理论｜2023 开放原子全球开源峰会开源创新理论与实践分论坛成功召开

6 月 13 日，以“开源产业与数字经济的未来”为主题的 2023 开放原子全球开源峰会开源创新理论与实践分论坛在北京成功召开。论坛邀请了众多开源专家学者，围绕当前开源理论创新与实践的整体环境，探讨开源

2023-06-16 11:47:01

452

开源教育决定未来｜2023开放原子全球开源峰会开源教育与人才分论坛成功召开

2023 开放原子全球开源峰会开源教育与人才分论坛成功召开。本论坛以“开源教育与人才为主题”，聚集产学研用多位专家、教师、开源产业实践，重点探讨了前沿思想和一线实践。

2023-06-16 09:52:19

363

专访深开鸿CEO王成录：做成鸿蒙生态需要一家万亿市值的公司

。”在2023开放原子全球开源峰会高峰论坛上，此前曾主导华为鸿蒙系统开发的负责人、现深开鸿CEO王成录发表演讲称，统一开放的安全数字底座，是实现数据资源高效使用、开放共享的技术核心

2023-06-15 14:46:36

开源数据库迎来拐点｜2023开放原子全球开源峰会数据库分论坛成功召开

6 月 12 日，2023 开放原子全球开源峰会数据库分论坛在北京成功召开。论坛以 “以开源开放生态推动数据库技术创新” 为主题，围绕开源数据库技术中的云原生、Serverless、 HTAP

2023-06-15 14:26:21

421

开源数据库迎来拐点｜2023开放原子全球开源峰会数据库分论坛成功召开

6 月12 日，2023 开放原子全球开源峰会数据库分论坛在北京成功召开。论坛以 “以开源开放生态推动数据库技术创新” 为主题，围绕开源数据库技术中的云原生、Serverless、 HTAP

2023-06-14 20:55:02

388

弥合风险缺口筑牢共享安全｜2023开放原子全球开源峰会开源安全技术与实践分论坛成功举办

6 月 12 日，2023 开放原子全球开源峰会开源安全技术与实践分论坛成功举办。

2023-06-14 14:21:03

520

弥合风险缺口筑牢共享安全｜2023开放原子全球开源峰会开源安全技术与实践分论坛成功举办

6月12日，2023开放原子全球开源峰会开源安全技术与实践分论坛成功举办。本场论坛围绕开源软件供应链、开源漏洞信息共享机制、开源安全测试工具、人工智能新技术对开源安全领域的影响等方向分享了技术和最佳

2023-06-13 22:45:03

1146

赋能生态合作共话数字创新 | 2023开放原子全球开源峰会软硬协同开源分论坛即将启幕

随着信息技术的迅猛发展，当下智能应用场景日益复杂、数据量爆发式增长、数据形式也多种多样，作为跨越无数创新领域的驱动者，理应打造更高质量的生态系统和开源生态，提供丰富的软件产品和服务，打造软件和硬件

2023-06-08 17:25:02

230

赋能生态合作共话数字创新 | 2023开放原子全球开源峰会软硬协同开源分论坛即将启幕

2023-06-08 12:26:22

225

以技术实践赋能开源安全｜2023开放原子全球开源峰会开源安全技术与实践分论坛即将启幕

作为数字化转型时代的重要技术和协作模式，开源软件在各行各业得到广泛应用，由此也引发了诸多与安全相关的问题。 6月12日，2023开放原子全球开源峰会“开源安全技术与实践”分论坛将在北京经开区北人

2023-06-05 10:35:02

301

智能出行驱动未来｜2023开放原子全球开源峰会CARSMOS开源智能出行生态年会即将启幕

峰会 “CARSMOS开源智能出行生态年会”将于6月12日在北京经开区北人亦创国际会展中心隆重举行。重量级嘉宾坐镇，传递行业生态最前沿本次生态年会将汇聚产学研界的重量级专家学者和企业高层，共同分享智能出行领域开源技术的最新理论、技术和实践应用成果，关注智能出行产业中的开源技术应

2023-06-04 06:35:01

497

以技术实践赋能开源安全｜2023开放原子全球开源峰会开源安全技术与实践分论坛即将启幕

2023-06-03 14:45:35

850

智能出行驱动未来｜2023 开放原子全球开源峰会 CARSMOS 开源智能出行生态年会即将启幕

全球开源峰会“CARSMOS 开源智能出行生态年会”将于 6 月 12 日在北京经开区北人亦创国际会展中心隆重举行。重量级嘉宾坐镇，传递行业生态最前沿本次生态年会将汇聚产学研界的重量级专家学者和企业高层，共同分享智能出行领域开源技术的最新理论、技术和实践应用成果，关注智能出行产业中的开源

2023-06-02 10:55:31

301

展望开源产业与数字经济未来｜2023 开放原子全球开源峰会开源创新理论与实践分论坛即将启幕

开源创新社会实践催生伟大的理论，也需要伟大理论的指导。在这个数字化和信息化高速发展的时代，开源技术已经成为推动科技进步和创新的关键力量，仍在不断创新迭代的开源理论及其实践更是深刻影响着与开源行业深度

2023-06-01 16:48:23

297

展望开源产业与数字经济未来｜2023开放原子全球开源峰会开源创新理论与实践分论坛即将启幕

2023-05-31 08:00:02

298

开放原子开源基金会OpenHarmony开发者大会2023演讲资料汇总

到行业大咖分享操作系统和开源的最新前沿研究成果，诚邀您参与本次大会，结识同行、了解其在各行业领域的最新实践，与社区技术专家互动交流，抢先获得OpenHarmony系统、技术和工具的最新动态。有关

2023-05-29 16:34:07

开源赋能普惠未来｜浪潮集团寄语2023开放原子全球开源峰会

浪潮集团是中国领先的高性能计算、云计算、大数据服务商，主要业务涉及高性能计算设备、云计算、工业互联网、应用软件、大数据及新一代通信等领域，始终践行“技术拥抱开源”的发展理念，积极构建以开源技术

2023-05-17 21:10:57

567

大数据有何特点？

随着科技的不断发展，大数据已经成为当今信息化时代的主要驱动力之一。大数据的特点是什么？

2023-05-12 10:27:25

1685

大数据的特征及技术关键

大数据的定义多而杂，不同企业、行业等都从自身角度来定义大数据，意思都差不多，就一句话，大数据由巨型数据集组成，这些数据集规模超出了常用软件在可接受时间下的收集、管理、处理和使用能力。虽然大数据

2023-05-10 15:32:51

1147

天数智芯与云创大数据签署战略合作协议共建AI新生态

产品应用落地标杆，共建国内AI产业新生态。此次战略合作是继天数智芯自主通用GPU在大模型适配取得阶段性成果之后，在大模型关键性应用场景和重要产业落地上取得新的重大突破。云创大数据总裁刘鹏、天数智芯董事长兼CEO盖鲁江出席签约仪式

2023-05-09 16:26:13

1540

易华录参加“共建数据要素产业生态高峰论坛”

日前，为促进数据要素产业高质量发展，由福建省数字福建建设领导小组办公室指导，福建省大数据集团有限公司主办，福建大数据交易有限公司、福建大数据一级开发有限公司共同承办的“共建数据要素产业生态高峰论坛

2023-05-03 20:45:25

863

大数据是什么大数据存储的概念大数据应用场景有哪些

大数据的成功管理取决于几个方面，例如数据的收集、存储、处理、分析和可视化。在大数据的处理过程中，各种技术和算法也被不断地应用于解决各种问题。大数据技术将继续发展和应用于各种领域，成为管理和处理信息的有效手段。

2023-05-03 09:23:00

2650

OpenHarmony生态贡献获肯定，华秋践行加速硬件创业初心

****OpenHarmony开源两年多以来,在开放原子开源基金会以及多方力量的共同努力下,生态持续繁荣发展。OpenHarmony项目群工作委员会主席候培新表示OpenHarmony社区生态的发展离不开每一位参与其中并

2023-04-21 17:18:52

华秋践行加速硬件创业初心，OpenHarmony生态贡献获肯定

2023-04-21 17:12:48

OHDC2023回顾02 | Intel 开源战略与 OpenHarmony 实践分享

Intel 开源战略与 OpenHarmony实践分享PPT资料分享，有需要的可自行下载~

2023-04-21 16:52:05

OpenHarmony开发者大会2023：九联科技构筑繁荣开源生态

Release版本的发布，解读了新版本技术特性，分享了伙伴基于OpenHarmony的开发实践、社区生态进展以及行业发行版和解决方案等方面的落地成果。

2023-04-21 10:23:11

578

开放原子开源基金会OpenHarmony开发者大会2023圆满举办

的基于OpenHarmony的开发实践、社区生态进展以及行业发行版和解决方案等方面的落地成果。开放原子开源基金会理事长孙文龙在开场致辞中表示：OpenHarmony开源两年多以来，开放原子开源基金会组织

2023-04-21 10:12:44

RISC-V开源带来的思考

由于RISC-V对外是开源的，各个厂家定制个性化内核，各厂家研发的产品能否兼容，做到一个生态中呢？

2023-04-21 10:06:08

该如何理解大数据？

大数据是当今数字时代的一个重要概念。它指的是如此庞大和复杂的数据集，以至于传统数据处理方法无法处理它们。大数据的概念自20世纪90年代以来不断发展，如今已成为各个行业的核心，从金融和制造业到医疗保健和社交媒体。理解大数据的意义和潜力对于个人和企业来说都至关重要。

2023-04-19 10:46:16

1104

大数据平台有哪些大数据技术应用有哪些

是其中一些类型的大数据平台：　　1. 分布式计算平台：Apache Hadoop、Apache Spark、Apache Flink等，提供分布式存储和计算能力，支持海量数据处理和分析

2023-04-16 16:14:00

9825

大数据的4v特征有哪些大数据技术包括哪些技术

大数据的4V特征是指数据的特点，主要包括以下四个方面：　　1. Volume（数据量）：所谓大数据，就是指数据量达到了一定的规模大小，通常需要使用分布式系统和算法进行处理和分析。数据

2023-04-16 16:08:38

13292

大数据技术有哪些大数据前景

大数据从字面意思来理解，就是海量数据的结合，从数据分析全流程的角度，大数据技术主要包括数据采集与预处理、数据存储和管理、数据处理与分析、数据安全和隐私保护等几个层面的内容：

2023-04-14 17:45:11

3639

大数据技术主要学什么大数据技术就业方向

大数据技术专业主要包括以下方面的学习内容：　　数据库技术：数据库是存储和管理数据的关键技术。大数据技术专业需要学习SQL和NoSQL等不同类型的数据库技术，以及如何优化数据库性能和处理海量

2023-04-14 17:21:35

5309

大数据是什么意思大数据应用

大数据指的是规模、类型和速度都非常庞大的数据集合，这些数据通常是由传感器、社交媒体、金融交易、科学实验等大规模应用程序收集和生成的。大数据的特点是数据量极大、数据处理速度快、数据来源多样、数据

2023-04-14 17:14:10

3484

开放原子开源基金会接受开源大师兄项目捐赠

2023年4月7日，在“源聚一堂”开源技术沙龙（南京站）上，开放原子开源基金会（以下简称“基金会”）和开源大师兄项目组在百余开源生态企业、组织等政产学研用代表的见证下就开源大师兄项目正式举行捐赠仪式

2023-04-13 10:57:01

422

“源聚一堂”开源技术沙龙（南京站）圆满举行，润和软件致力繁荣开源生态

的交流合作平台、推动开源技术创新和生态繁荣发展。本次活动由开放原子开源基金会、江苏省工业和信息化厅指导，南京市工业和信息化局、中国（南京）软件谷主办，江苏润和软件股

2023-04-13 10:56:21

458

大数据技术主要学什么

大数据技术主要学什么 大数据技术专业主要学统计学、数学、计算机、医学、环境科学、经济学、社会学、管理学、数据采集、计算机编程语言等。就业方向有大数据开发工程师、Hadoop开发工程师、信息架构

2023-04-12 13:53:34

6143

大数据工程师

大数据工程师 大数据工程师可以从事对大量数据的采集、清洗、分析、治理、挖掘，并对这些数据加以利用、管理、维护和服务的相关技术工作。 2020年05月15日，国家邮电通信人才交流中心印发了《关于开展

2023-04-12 13:52:51

393

OpenHarmony开发者大会2023生态示范单位及OpenHarmony生态委员会成员单位致谢授牌：方案评定办法公示

”、“OpenHarmony生态实践示范单位”的评选规则如下：一、OpenHarmony生态创新示范单位 1.评选规则： 1)已开发出基于商用设备/开发板的OpenHarmony APP/元服务/开源三方库及组件，或在应用

2023-04-07 02:35:02

1401

大数据技术及应用介绍1

大数据技术体系发展至今，不断充实完善，与互联网、物联网、人工智能等其他信息通信技术融合交汇，现已较为成熟。围绕数据资源的全生命周期过程** ，大数据基础技术包含大数据采集技术、大数据预处理技术、大数据存储及计算技术、大数据分析技术等。

2023-03-29 14:14:48

1117

什么是大数据？大数据技术有哪些？

对于一个从事大数据行业人来说，一切数据都是有意义的。因为通过数据采集、数据存储、数据管理、数据分析与挖掘、数据展现等，我们可以发现很多有用的或有意思的规律和结论。

2023-03-29 10:56:03

12874

浅析大数据技术之Flink

随着大数据时代的发展，海量数据和多种业务的实时处理需求激增，比如：实时监控报警系统、实时风控系统、实时推荐系统等，传统的批处理方式和早期的流式处理框架因其自身的局限性，难以在延迟性、吞吐量、容错能力以及使用便捷性等方面满足业务日益苛刻的要求。

2023-03-29 10:46:05

680

优博终端加速开源生态技术创新，实现OpenHarmony标准系统秒级开机！

共建共治，助力开源生态建设进入数字经济时代，开源模式的重要价值日渐凸显。优博终端定位于OpenHarmony解决方案提供商，以“开放共享、共建共治”的愿景，携手开放原子开源基金会共筑开源生态。在推动

2023-03-29 09:49:33

417

【OpenHarmony技术峰会】生态与互联分论坛 | 梁开祝：OpenHarmony驱动开发实践

在2月25日刚刚圆满闭幕的首届开放原子开源基金会OpenHarmony技术峰会（2023）生态与互联分论坛上，润和软件旗下子公司江苏润开鸿数字科技有限公司（简称：润开鸿）资深软件开发工程师梁开祝发表

2023-03-28 16:54:19

376

【OpenHarmony技术峰会】生态与互联分论坛 | 梁开祝：OpenHarmony驱动开发实践

2023-03-27 22:50:02

708

已全部加载完成

搜索历史

开源大数据生态下的 Flink 应用实践

部分精彩议题概览

Apache Flink and the Apache Way

Optimize Apache Flink on Kubernetes with YuniKorn Scheduler

趣头条基于 Flink+ClickHouse 构建实时数据分析平台

基于 Apache Flink 的边缘流式计算

Apache Flink 与 Apache Hive 的集成

开源大数据生态专场完整议程

深度培训，实现技术与应用能力的积累提升

评论