Doris架构中包含哪些技术?

Doris主要整合了Google Mesa(数据模型),Apache Impala(MPP Query Engine)和Apache ORCFile (存储格式,编码和压缩)的技术。

为什么要将这三种技术整合?

Mesa可以满足我们许多存储需求的需求,但是Mesa本身不提供SQL查询引擎。

Impala是一个非常好的MPP SQL查询引擎,但是缺少完美的分布式存储引擎。

自研列式存储:存储层对存储数据的管理通过storage_root_path路径进行配置,路径可以是多个。存储目录下一层按照分桶进行组织,分桶目录下存放具体的tablet,按照tablet_id命名子目录。因此选择了这三种技术的组合。

Doris架构中包含哪些技术?

Doris的系统架构如下,Doris主要分为FE和BE两个组件。

整体架构

Doris的架构很简洁,使用MySQL协议,用户可以使用任何MySQL ODBC/JDBC和MySQL客户端直接访问Doris,只设FE(Frontend)、BE(Backend)两种角色、两个进程,不依赖于外部组件,方便部署和运维。

FE:Frontend,即Doris的前端节点。主要负责接收和返回客户端请求、元数据以及集群管理、查询计划生成等工作。

BE:Backend,即Doris的后端节点。主要负责数据存储与管理、查询计划执行等工作。

FE,BE都可线性扩展FE主要有两个角色,一个是follower,另一个是observer。多个follower组成选举组,会选出一个master,master是follower的一个特例,Master跟follower,主要是用来达到元数据的高可用,保证单节点宕机的情况下,元数据能够实时地在线恢复,而不影响整个服务。

Observer节点仅从leader节点进行元数据同步,不参与选举。可以横向扩展以提供元数据的读服务的扩展性。

数据的可靠性由BE保证,BE会对整个数据存储多副本或者是三副本。副本数可根据需求动态调整。

Doris架构中包含哪些技术?

元数据结构

Doris采用==Paxos协议以及Memory+ Checkpoint + Journal的机制==来确保元数据的高性能及高可靠。元数据的每次更新,都会遵照以下几步:

(1)写入到磁盘的日志文件中

(2)再写到内存中

(3)定期checkpoint到本地磁盘上

相当于是一个纯内存的一个结构,也就是说所有的元数据都会缓存在内存之中,从而保证FE在宕机后能够快速恢复元数据,而且不丢失元数据。

Leader、follower和observer它们三个构成一个可靠的服务,如果发生节点宕机的情况,一般是部署一个leader两个follower,目前来说基本上也是这么部署的。就是说三个节点去达到一个高可用服务。单机的节点故障的时候其实基本上三个就够了,因为FE节点毕竟它只存了一份元数据,它的压力不大,所以如果FE太多的时候它会去消耗机器资源,所以多数情况下三个就足够了,可以达到一个很高可用的元数据服务。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/367101.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
黑马程序员黑马程序员订阅用户
上一篇 2023年8月30日 07:30
下一篇 2023年8月30日 07:30

相关推荐

  • 聊聊GT820和GT755哪一种显卡好。

    在比较GT820和GT755显卡的性能时,我们需要考虑多个技术规格和性能指标,虽然这两款显卡都不是目前市场上的最新型号,但它们在某些应用场景下仍然具有一定的使用价值,以下是对这两款显卡的详细技术介绍和比较。 技…

    2024年6月11日
    00
  • 关于b75主板可以用e3吗。

    当我们讨论计算机硬件兼容性时,特别是主板和中央处理单元(CPU)之间的兼容性,我们必须考虑多个因素,对于B75主板能否使用E3系列CPU的问题,我们需要了解B75主板的规格以及E3 CPU的特性。 B75主板概述 B75主板是…

    2024年6月13日
    01
  • 我来分享网站架构SEO优化方案技巧。

    搜索引擎优化工作分为站内,站外,我们都知道站内也好,站外也好如果做不好,seo的工作将无法进行下去。我们知道搜索引擎是软件程序,既有长处也有短处。做为SEO,运营整个网站必须要调整整个网站的精简架构,让搜…

    2023年6月22日
    00
  • 我来分享云计算服务器承载能力高吗。

    云计算服务器承载能力高吗? 云计算是一种基于互联网的计算方式,通过将计算资源集中管理和分配,为用户提供按需使用的服务,云计算服务器作为云计算的核心组成部分,承担着存储、处理和传输数据的任务,云计算服务…

    2024年7月23日
    00
  • 单体架构有哪些局限和问题?

    随着互联网技术的发展,传统的应用架构已满足不了实际需求,微服务架构就随之产生。那么传统应用架构到底出了什么问题呢?又如何解决?接下来我们将从传统单体架构的问题开始,对为什么需要微服务架构进行详细讲解。 …

    2023年5月6日
    00
  • 云桌面是甚么怎样连接服务器云桌面的主流架构包括甚么。

    云桌面的主流架构包括 VDI (Virtual Desktop Infrastructure)、VDC (Virtual Desktop Cloud) 和 DaaS (Desktop as a Service)。 云桌面是一种基于云计算技术的远程桌面服务,它可以让用户通过互联网访问远程计算机…

    2024年7月9日
    00
  • 如何在PHP中使用RESTful架构。

    随着互联网技术的发展,RESTful架构已经成为了一种主流的Web API设计风格。与传统的Web服务相比,RESTful架构更加灵活、可扩展、易于维护,因此越来越多的Web开发人员开始使用它来设计和开发前后端交互的API。 本文…

    2023年5月22日
    03
  • 说说Serverless的架构及使用场景是什么。

    Serverless架构是一种云计算执行模型,在这种模型中,云提供商动态管理机器的分配,开发者只需要关注自己的业务逻辑,无需关心基础设施的问题,这种架构的主要优点是降低了开发和运维的成本,提高了系统的可扩展性…

    2024年6月14日
    00

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息