0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Apache Doris正式成为 Apache 顶级项目

科技观点 2022-06-17 14:08 次阅读

全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于美国时间 2022 年6 月 16 日宣布,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP)。

Apache Doris 官方网站:http://doris.apache.org

Apache Doris GitHub:https://github.com/apache/incubator-doris

Apache Doris 是一个基于 MPP 的现代化、高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 在多维报表、用户画像、即席查询、实时大屏等诸多业务领域都能得到很好应用。

Apache Doris 最早是诞生于百度内部广告报表业务的 Palo 项目,2017 年正式对外开源,2018 年 7 月由百度捐赠给 Apache 基金会进行孵化,之后在 Apache 导师的指导下由孵化器项目管理委员会成员进行孵化和运营。

“我们很自豪 Doris 能够顺利从Apache孵化器毕业,这是一个重要的里程碑。在整个孵化阶段,依靠 Apache 理念的指导和孵化器导师的帮助,我们学会了如何以Apache的方式去发展我们的项目与社区,也在这一进程中获得了巨大的成长。” Apache Doris VP 陈明雨说道。

目前 Apache Doris 社区已经聚集了来自不同行业近百家企业的 300 余位贡献者,并且每月活跃贡献者人数也接近 100 位。在孵化期间,Apache Doris 一共发布了 8 个重要版本,完成了包括存储引擎升级、向量化执行引擎等诸多重大功能,并正式发布了 1.0 版本。正是依靠这些来自开源贡献者的力量,才使得 Apache Doris 取得了今天的成绩。

与此同时,Apache Doris 如今在中国乃至全球范围内都拥有着广泛的用户群体,截止目前,Apache Doris 已经在全球超过 500 家企业的生产环境中得到应用,在中国市值或估值排行前50的互联网公司中,有超过 80% 的公司长期使用 Apache Doris,包括百度、美团、小米、京东、字节跳动、腾讯、快手、网易、微博、新浪、360 等知名公司。同时在一些传统行业如金融、能源、制造、电信等领域也有着丰富的应用。

“你可以基于 Apache Doris 快速构建一个简单易用并且性能强大的数据分析平台,非常易于上手,所需要付出的学习成本非常低。并且 Apache Doris 的分布式架构非常简洁,可以极大降低系统运维的工作量,这也是越来越多用户选择 Apache Doris 的关键因素。”

作为一款成熟的分析型数据库项目,Apache Doris 有以下优势:

- 性能优异:自带高效的列式存储引擎,减少数据扫描量的同时还实现了超高的数据压缩比。同时 Doris 还提供了丰富的索引结构来加速数据读取与过滤,利用分区分桶裁剪功能,Doris 可以支持在线服务业务的超高并发,单节点最高可支持上千 QPS。更进一步,Apache Doris 结合了向量化执行引擎来充分发挥现代化 CPU 并行计算能力,辅以智能物化视图技术实现预聚合加速,并可以通过查询优化器同时进行基于规划和基于代价的查询优化。通过上述多种方式,实现了极致的查询性能。

- 简单易用:支持标准 ANSI SQL 语法,包括单表聚合、排序、过滤和多***查询等,还支持窗口函数、Grouping Set 等复杂 SQL 语法,同时用户可以通过 UDF 和 UDAF 等自定义函数来拓展系统功能。除此以外,Apache Doris 还实现了 MySQL 协议兼容,用户可以通过各类客户端工具来访问 Doris,并支持与 BI 工具的无缝对接。

- 架构精简:系统只有两个 Frontend(FE)和 Backend(BE)两个模块,其中 FE 节点负责用户请求的接入、查询计划的解析、元数据存储及集群管理等工作,BE 节点负责数据存储和查询计划的执行,自身就是一个完备的分布式数据库管理系统,用户无需安装任何第三方管控组件即可运行起 Apache Doris 集群,并且部署和升级过程都非常简易。同时,任一模块都可以支持横向拓展,集群最高可以拓展到数百个节点,支持存储超过 10PB 的超大规模数据。

- 稳定可靠:支持数据多副本存储,集群具备自愈功能,自身的分布式管理框架可以自动管理数据副本的分布、修复和均衡,副本损坏时系统可以自动感知并进行修复。节点扩容时,仅需一条 SQL 命令即可完成,数据分片会自动在节点间均衡,无需人工干预或操作。无论是扩容、缩容、单节点故障还是在升级过程中,系统都无需停止运行,可正常提供稳定可靠的在线服务。

- 生态丰富:提供丰富的数据同步方式,支持快速加载来自本地、Hadoop、Flink、Spark、Kafka、SeaTunnel 等系统中的数据,也可以直接访问 MySQL、PostgreSQL、Oracle、S3、Hive、Iceberg、Elasticsearch 等系统中的数据而无需数据复制。同时存储在 Doris 中的数据也可以被 Spark、Flink 读取,并且可以输出给上游数据应用进行展示分析。

“‍毕业不是最终目标,它是新征程的起点。”陈明雨说到。“在过去,我们发起 Doris 的目标是为更多人提供体验更佳的数据分析工具、解决他们数据分析的难题。成为 Apache 顶级项目一方面是对 Apache Doris 社区过去所有贡献者一直以来辛勤工作的肯定,另一方面也意味着我们在 Apache Way 的指引下建立了一个强大的、繁荣的、可持续发展的开源社区。未来我们将会继续以 Apache 方式运作社区,相信会吸引到更多优秀的开源贡献者参与社区中来,社区也会在所有贡献者的帮助下得到进一步成长。”

“Apache Doris 后续将开展更多富有挑战且有意义的工作,包括新的查询优化器、对湖仓一体化的支持,以及面向云上基础设施的架构演进等等。欢迎更多的开源技术爱好者加入Apache Doris 的社区,携手共成长。”

“我们再次由衷地感谢所有参与建设 Apache Doris 社区的贡献者们,以及所有使用 Apache Doris 并不断提出改进建议的用户们。同时也感谢一路走来,不断鼓励、支持和帮助过我们的孵化器导师、IPMC成员以及各个开源项目社区的朋友们。”

关于 SelectDB

SelectDB 是一家开源技术公司,致力于为 Apache Doris 社区提供一个由全职工程师产品经理和支持工程师组成的团队,繁荣开源社区生态,打造实时分析型数据库领域的国际工业界标准。基于 Apache Doris研发的新一代云原生实时数仓 SelectDB,运行于多家云上,为用户和客户提供开箱即用的能力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源软件
    +关注

    关注

    0

    文章

    209

    浏览量

    15886
  • Apache
    +关注

    关注

    0

    文章

    64

    浏览量

    12448
收藏 人收藏

    评论

    相关推荐

    springboot的项目如何既要用jar包启动,同时还可以为不同的机房设置不同的配置文件

    作者:京东科技 李意文 1、首先先把配置文件从jar中抽离 示例代码:   org.apache.maven.plugins maven-jar-plugin 3.2.0
    的头像 发表于 10-19 16:48 394次阅读
    springboot的<b class='flag-5'>项目</b>如何既要用jar包启动,同时还可以为不同的机房设置不同的配置文件

    启明信息完成国产化Doris数据库升级替代任务

    近日,随着集团公司监控平台(Elasticsearch集群)的下线,标志着启明信息正式完成国产化Doris数据库升级替代任务。该项目既标志着启明信息信创升级替代迈入新台阶,同时也标志着在Doris应用领域取得自主研发新进展。
    的头像 发表于 09-20 09:33 719次阅读

    上线 Airflow 官方!DolphinDB 带来数据管理新体验

    DolphinDB 正式登陆 Apache Airflow 官方,成为 Airflow 官方认可的第三方插件及工具供应商。Apache Airflow 是一个可编程、调度和监控的工作流管理平台,以其模块化的架构和动态定义数据管道
    的头像 发表于 08-23 17:00 245次阅读
    上线 Airflow 官方!DolphinDB 带来数据管理新体验

    Arm加入RT-Thread全球技术大会,成为顶级共创合作伙伴!

    2024 RT-Thread全球技术大会非常荣幸迎来了Arm, 成为顶级共创合作伙伴。Arm 将在2024年全球技术大会带来丰富的专业知识和解决方案,助力全球开发者的创新之路。
    的头像 发表于 05-29 09:52 550次阅读

    英飞凌加入2024 RT-Thread全球技术大会,成为顶级共创合作伙伴!

    2024 RT-Thread全球技术大会即将盛大开启,我们很高兴地宣布,英飞凌科技将加入本次盛会,成为顶级共创合作伙伴。
    的头像 发表于 05-23 10:19 502次阅读
    英飞凌加入2024 RT-Thread全球技术大会,<b class='flag-5'>成为</b><b class='flag-5'>顶级</b>共创合作伙伴!

    瑞萨电子加入2024RT-Thread全球技术大会,成为顶级共创合作伙伴!

    2024 RT-Thread全球技术大会非常荣幸的迎来瑞萨电子,成为顶级共创合作伙伴。
    的头像 发表于 05-17 14:11 527次阅读
    瑞萨电子加入2024RT-Thread全球技术大会,<b class='flag-5'>成为</b><b class='flag-5'>顶级</b>共创合作伙伴!

    云服务器apache如何配置解析php文件?

    在云服务器上配置Apache以解析PHP文件通常需要以下步骤: 1、安装PHP:首先确保在服务器上安装了PHP。你可以使用包管理工具(如apt、yum等)来安装PHP。例如,在Ubuntu上,你可以
    的头像 发表于 04-22 17:27 937次阅读

    RDMA技术在Apache Spark中的应用

    背景介绍 在当今数据驱动的时代,Apache Spark已经成为了处理大规模数据集的首选框架。作为一个开源的分布式计算系统,Spark因其高效的大数据处理能力而在各行各业中广受欢迎。无论是金融服务
    的头像 发表于 03-25 18:13 1468次阅读
    RDMA技术在<b class='flag-5'>Apache</b> Spark中的应用

    核心开发者因安全策略分歧离队,Nginx分叉出freenginx项目

    值得注意的是,Nginx是一款由俄罗斯人伊戈尔•赛索耶夫(Igor Sysoev)创作,并于2004年起向公众公开的异步网页服务器平台,广泛用于反向代理、负载均衡和HTTP缓存等功能。据官方公布的2021年6月数据,Nginx已经超越Apache成为全球最受欢迎的网页服务
    的头像 发表于 02-19 15:51 390次阅读

    Apache服务器和Nginx服务器

    Apache和Nginx都是常见的开源Web服务器软件,它们用于处理HTTP请求并提供网站和应用程序的服务。下面是对Apache和Nginx的一些基本特点的比较: 一、Apache HTTP
    的头像 发表于 01-22 16:48 518次阅读

    如何构建APISIX基于DeepFlow的统一可观测性能力呢?

    随着应用组件的可观测性逐渐受到重视,Apache APISIX 引入插件机制丰富了可观测数据源。
    的头像 发表于 01-18 10:11 913次阅读
    如何构建APISIX基于DeepFlow的统一可观测性能力呢?

    Apache Doris聚合函数源码解析

    笔者最近由于工作需要开始调研 Apache Doris,通过阅读聚合函数代码切入 Apache Doris 内核,同时也秉承着开源的精神,开发了 array_agg 函数并贡献给社区。
    的头像 发表于 01-16 09:52 950次阅读
    <b class='flag-5'>Apache</b> <b class='flag-5'>Doris</b>聚合函数源码解析

    源译识 | 译文分享:ASF第三方开源组件许可证政策

    【编者按】 本译文系开放原子开源基金会源译识项目组与ALC Beijing联合发布,由郭雪雯、薛杨洁翻译,经姜宁、王荷舒审校。本译文基于CC-BY 4.0许可,为选用Apache许可证进行分发的开源
    的头像 发表于 01-05 19:50 794次阅读
    源译识 | 译文分享:ASF第三方开源组件许可证政策

    什么是Apache日志?Apache日志分析工具介绍

    Apache Web 服务器在企业中广泛用于托管其网站和 Web 应用程序,Apache 服务器生成的原始日志提供有关 Apache 服务器托管的网站如何处理用户请求以及访问您的网站时经常遇到的错误的重要信息。
    的头像 发表于 01-04 10:09 792次阅读

    javadb有新地址吗

    一、背景介绍: Javadb是由Apache软件基金会开源的一个全功能的关系型数据库管理系统。它最初基于IBM的Derby项目开发,后来由Apache接手并进行了改进和优化。Javadb使用纯
    的头像 发表于 12-03 11:07 9854次阅读