面试题 – YARN

一、概念 YARN 是一个资源管理、任务调度的框架,主要包含三大模块: ResourceManager(RM) NodeManager(NM) ApplicationMaster(AM)。 其中, R…

面试题 – Spark

一、概念 Spark 提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。 二、核心架构 Spark Core 包含…

面试题 – Hadoop

一、概念 就是一个大数据解决方案。它提供了一套分布式系统基础架构。 核心内容包含 hdfs 和mapreduce。hadoop2.0 以后引入 yarn。 hdfs 是提供数据存储的,mapreduc…

面试题 – 分布式缓存

一、缓存雪崩 缓存雪崩我们可以简单的理解为:由于原有缓存失效,新缓存未到期间所有原本应该访问缓存的请求都去查询数据库了,而对数据库 CPU 和内存造成巨大压力,严重的会造成数据库宕机。从而形成一系列连…

面试题 – 数据结构

一、栈(stack) 栈(stack)是限制插入和删除只能在一个位置上进行的表,该位置是表的末端,叫做栈顶(top)。 它是后进先出(LIFO)的。对栈的基本操作只有 push(进栈)和 pop(出栈…

面试题 – Java算法

一、二分查找 又叫折半查找,要求待查找的序列有序。 每次取中间位置的值与待查关键字比较,如果中间位置的值比待查关键字大,则在前半部分循环这个查找的过程,如果中间位置的值比待查关键字小,则在后半部分循环…

面试题 – 一致性算法

一、Paxos Paxos 算法解决的问题是一个分布式系统如何就某个值(决议)达成一致。一个典型的场景是,在一个分布式数据库系统中,如果各节点的初始状态一致,每个节点执行相同的操作序列,那么他们最后能…

面试题 – 数据库

一、存储引擎 1.1 概念 数据库存储引擎是数据库底层软件组织,数据库管理系统(DBMS)使用数据引擎进行创建、查询、更新和删除数据。不同的存储引擎提供不同的存储机制、索引技巧、锁定水平等功能,使用不…

close
arrow_upward