来了来了,2023年某中大厂真实面经!

2023-11-08

8fccf71fa3ebd37485a3cf1ebf0cc0de.png300万字!全网最全大数据学习面试社区等你来!

本篇文章的面经是我辅导的一个同学的真实面试经历!

2023年校招的宝子们拿走快看!

第一个面经来自某头部大厂:

1. 做过的项目细节和遇到的问题(30分钟)
所以说大家要对简历中的项目细节了如指掌!
2. 实习工作介绍(5min)
3. 数据倾斜有哪几种解决方法
4. Hdfs小文件危害,元数据压垮namenode,怎么处理?
5. 为什么开启map—join后会减小数据倾斜?
6. 数仓建模的层数:ods,dwd,dim,dws,ads(如果去掉几层或者多几层可以吗?)
7. 缓慢变化维度怎么处理?拉链表有重叠怎么解决?拉链表如果出现断链怎么办?
8. Hdfs怎么保证高可用?
9. Reduce和map的个数由扫描决定的?
10. 怎么优化分区的键值?

某直播平台:

1. 实习的工作是什么?
2. SQL调优有哪些?
3. 介绍一下项目,主要做什么工作?
4. Kafka的基本架构?
5. Kafka的partition副本写数据是怎么写的?
6. Kafka副本的leader是怎么选出来的?
7. 有没有了解Kafka的架构设计?
8. 讲一个最熟悉的集合?(答了HashMap)
9. ArrayList是怎么实现的?LinkedList是怎么实现的?ArrayList与LinkedList有什么区别?
10. 怎么声明字符串(String)?字符串new出来保存到哪里?如果是字符串常量保存在哪?
11. StringBuffer和StringBuilder有什么区别?
12. Java里除了Synconized,还有什么加锁方式?
13. 介绍一下垃圾回收机制
14. 具体的垃圾回收器有哪些?
15. MySQL的存储引擎有哪些?Innodb的索引是怎么实现的?为什么用B+树?
16. 索引的作用
17. 内连接是什么?
18. 有了解MVCC吗?介绍一下
19. Hdfs的架构是怎样的?NN和2NN有什么区别?
20. HDFS的HA怎么实现?
21. HDFS的写数据流程?其中一台DataNode掉线了,写数据会怎样呢?
22. HBase是列式存储吗?行式存储和列式存储有什么区别?
23. HBase的HA
24. 用的Hadoop是什么版本?
25. 项目里Hive用的是内部表还是外部表?为什么用外部表?
26. Hive数据倾斜
27. 有没写过Hive的UDF函数?
28. 有没了解过开窗函数?介绍一下

第三家公司:

1. 线程和进程有哪些区别?
2. 怎么看一个正在执行的JAVA程序的线程状态?
3. 新生代和老年代主要是干什么的?比例是多少?
4. HDFS的服务组成有哪些?它们分别的作用是什么?
5. 除了Hive之外,还用过其他数仓吗?
6. Flink的窗口主要是干什么的?
7. Flink的dataStream和dataset有什么区别?
8. Flink的部署模式有哪些?分别说明一下
9. Flink中三个不同的时间概念?
10. Spark中的分组算子有哪些?(reduceByKey,groupByKey)
11. Hive什么情况下会出现数据倾斜?怎么处理?
12. Hive的内部表和外部表有什么区别?
13. Hive的数据存储格式有哪些?
14. Gzip和Bzip压缩格式有什么区别?
15. Kafka的架构和特点是什么?
16. HBase适用哪些场景?
17. HBase的rowKey有什么要求?

如果这个文章对你有帮助,不要忘记 「在看」 「点赞」 「收藏」 三连啊喂!

dad77d2682302283d4a16f35e1af95ef.png

787817102c89d513d106a554d800a031.jpeg

2022年全网首发|大数据专家级技能模型与学习指南(胜天半子篇)

互联网最坏的时代可能真的来了

我在B站读大学,大数据专业

我们在学习Flink的时候,到底在学习什么?

193篇文章暴揍Flink,这个合集你需要关注一下

Flink生产环境TOP难题与优化,阿里巴巴藏经阁YYDS

Flink CDC我吃定了耶稣也留不住他!| Flink CDC线上问题小盘点

我们在学习Spark的时候,到底在学习什么?

在所有Spark模块中,我愿称SparkSQL为最强!

硬刚Hive | 4万字基础调优面试小总结

数据治理方法论和实践小百科全书

标签体系下的用户画像建设小指南

4万字长文 | ClickHouse基础&实践&调优全视角解析

【面试&个人成长】2021年过半,社招和校招的经验之谈

大数据方向另一个十年开启 |《硬刚系列》第一版完结

我写过的关于成长/面试/职场进阶的文章

当我们在学习Hive的时候在学习什么?「硬刚Hive续集」

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

来了来了,2023年某中大厂真实面经! 的相关文章

  • conda 导出环境/导入环境/导出base环境

    conda的虚拟环境真的非常实用 尤其是对于大的深度学习项目 给每个项目单独配一个环境 轻巧又容易管理 还能直接用别人配好的虚拟环境 非常方便 这里记录几个常用的导入导出命令免得每次找 查看可用环境 conda info envs 输出样式
  • 用群晖筑建音乐之「家」

    创意从业者的灵感总是随时迸发 一段简短的旋律就有可能谱成一首经典歌曲 而这个过程 不仅需要才华 学习 刻苦 还需要 方便保存所有这些灵感的 工具 群晖NAS为音乐爱好者或是音乐从业者打造私有音乐素材库 大量的音乐素材及作品都可以通过群晖NA
  • docker映射mysql修改字符编码_怎么在docker容器的mysql的编码格式变为utf8

    第一个方法 1 编辑MySql的配置文件 MySql的配置文件Windows下一般在系统目录下或者在MySql的安装目录下名字叫my ini 可以搜索 Linux下一般是 etc my cnf 在 mysqld 标签下加上以下内容 defa
  • 深拷贝浅拷贝的理解

    深拷贝 1 是指拷贝一个对象时 不仅仅把对象的引用进行复制 还把该对象引用的值也一起拷贝 2 源对象与拷贝对象互相独立 其中任何一个对象的改动都不会对另外一个对象造成影响 浅拷贝 1 指的是拷贝一个对象时 仅仅拷贝对象的引用进行拷贝 但是拷
  • “由于内部错误,服务器无法处理该请求。有关该错误的详细信息,请打开服务器上的 IncludeExceptionDetailInFaults (从 ServiceBehaviorAttribute 或从...

    WCF程序中一般出现这样的错误 我们需要在服务端的web config中增加
  • 操作系统与shell

    操作系统与shell 操作系统与shell 一 什么是操作系统 1 什么是kernel 2 什么是shell 二 System Call 补充 用户态与内核态 操作系统与shell 一 什么是操作系统 操作系统 即Operating Sys
  • 一文读懂类加载机制

    类记载过程 多个java文件经过编译打包生成可运行的jar包 最终由java命令运行某个主类的main函数启动程序 这里首先需要通过类加载器把主类加载到jvm 主类在运行过程中如果使用到其他类 会逐步加载这些类 注意 jar包里的类不是一次
  • aws ec2 变更pem_用aws和jira建立一个连续的变更日志

    aws ec2 变更pem So you ve decided to go CI CD You read all about the org changes understand the ins and outs of the develo
  • Qt 如何实现文件类型关联

    何为文件打开关联 比如 一个扩展名为txt的文本 双击之后会调用 notepad exe 进行打开 doc的扩展名会调用word打开等等 咱们今天讲的是如何在Qt所编写的程序实现这个动作 这个关联动作都是记录在注册表中的 1 文件格式注册
  • Matlab函数之ismember,find

    一 ismember函数 1 ismember a b 返回前者是否存在于后者的logical数组 举例 a 1 2 3 4 5 6 b 3 5 6 ismember a b 返回的数组为 0 0 1 0 1 1 ismember b a
  • openldap2.4版本管理员文档中文翻译版

    OpenLDAP2 4管理员指南 文章目录 1 OpenLDAP介绍 2 快速开始指南 1 获得软件 2 解压压缩包 3 阅读文档 4 运行configure 5 编译软件 6 测试编译结果 7 安装软件 8 编辑配置文件 9 导入数据库配
  • 计算机网络 第4章 网络层

    第4章 网络层 网络层 network layer 负责为分组交换网上的不同主机提供通信 在发送数据时 将运输层产生的报文段或用户数据报封装成分组或包进行传送 在TCP IP体系中 分组也叫做IP数据包 或简称为数据报 4 1 网络层的几个
  • 透视投影矩阵的推导

    视锥体 如图 近截面与远截面之间构成的这个四棱台就是视锥体 而透视投影矩阵的任务就是把位于视锥体内的物体的顶点X Y Z坐标映射到 1 1 范围 这就相当于把这个四棱台扭曲变形成一个立方体 这个立方体叫做规则观察体 Canonical Vi
  • 如何在visio中画虚线框以及如何解决将visio图形复制到word文档中虚线变为实线的问题

    这两个问题都不是什么复杂的事情 但是如果对visio用的不多或者只是临时用起来碰到了这种问题还真是麻烦事儿 问题1 如何在visio中画虚线框 在上方的按钮中找到矩形工具那个按钮 对 点一下就可以在作图区画出来一个矩形了 可是这个矩形默认的
  • Ubuntu20.04部署GitLab

    安装 更新本地包 安装相关依赖 sudo apt update sudo apt install ca certificates curl openssh server postfix 安装postfix 邮件服务器 时可能出现激活gitl
  • 【开发工具】配置环境变量

    配置环境变量目录 一 环境变量的作用 二 环境变量的配置 一 环境变量的作用 当系统运行一个程序时 除了在当前目录下面寻找此程序外 还会到环境变量中的指定路径寻找 所以将程序的路径设置到环境变量 可以让程序在计算机的任意位置都可以运行 二
  • set-ExecutionPolicy‘ 不是内部或外部命令,也不是可运行的程序 或批处理文

    set ExecutionPolicy 不是内部或外部命令 也不是可运行的程序 或批处理文 1 打开Windows PowerShell ISE 在搜索框内搜索windows powershell ise 然后右击以管理员身份运行 2 输入
  • 315-Leetcode 希尔排序

    希尔排序也叫缩小增量 算法描述 希尔排序是间隔式的分组 5 3 1 利用直接插入排序进行排序 通过缩小分组 排序 再分组 再排序 直到缩为1组 完全有序为止 一趟希尔排序 gap为组数 间隔 分为5组 间隔数就是5 分为3组 间隔数就是3
  • sqlServer 常用查询语句

    查询语句 select 字段 from 表名 where 条件 select 字段 from 表名 where 字段 like 值 select distinct 字段 from 表名 排序查询 select 字段 from 表名 wher
  • 金山卫士开源软件之旅(九) KUI高级界面(列表控件、树控件例子、超文本、网页控件)

    转载自 http blog csdn net b2b160 article details 6275839 reply 注意 作者的例子及代码是基与上一版本的金山库 XML的语法及有些API名字不一样 本篇开始介绍比较复杂的界面应用了 界面

随机推荐

  • MySQL -- 获取某一字段数据的后几位! (SUBSTRING)

    select SUBSTRING id 3 from user 取id字段后三位字符 select SUBSTRING id 3 from user 从左开始第3位取 包括第三位
  • 文本标注平台 doccano 安装教程

    doccano简介 doccano 是一个开源的文本注释工具 它为文本分类 序列标记和序列到序列任务提供注释功能 因此 可以为情感分析 命名实体识别 文本摘要等创建标记数据 只需创建一个项目 上传数据并开始注释 安装 本文是基于window
  • HMM的学习

    20201012 0 引言 在学习 异常点检测 这本书的时候 在第十章的内容 离散数据的异常检测 记录中 涉及到隐马尔可夫模型 HMM 的学习 本篇文章具体记录HMM的学习过程 因为 异常点检测 书中关于这部分内容过于简短 本文主要学习文章
  • 有序单链表转换成二叉平衡搜索树

    题目 Given a singly linked list where elements are sorted in ascending order convert it to a height balanced BST 关键词 有序单链表
  • hibernate 注解 ,视图无主键,怎么配置联合主键

    我之前用myeclipse 反向生成了2个pojo 但是hql查询有问题 生成的类 Service类 我传入一个值查询的时候 这好像是我底层的 sessionFactory getCurrentSession createQuery hql
  • decimals数据格式化

    文章目录 decimals数据格式化 1 保留小数 1 1 iOS 2 去除小数点后多余的 0 2 1 iOS 2 2 C decimals数据格式化 格式化数据 以便移动端UI显示 1 保留小数 无小数部分 则保留整数 有小数部分保留两位
  • soul 网关源码解析

    一 soul网关引入的依赖分析 从上图可以看到我红线划分五个依赖区域 1 soul common包 这里不是很重要 我们大概看一下他的作用就好了 从上图中可以看出 这个包里主要定义了一个常量 枚举类 配置类 自定义的DTO对象 2 soul
  • CSS背景靠右对齐,并且背景图片右边刘10px

    margin right 10px float right 或者 Background Image url 图像路径 X坐标 Y坐标 no repeat 或者 padding right 10px float right
  • Qt -- 14Lambda表达式和信号功能

    视频学习链接 https www bilibili com video BV1g4411H78N p 14 在Qt中 使用Lambda表达式配合信号使用 非常方便 Lambda表达式是C 11中最重要的新特性之一 在QT5 4 包括 以前的
  • 从零开始学前端(三)

    上一篇我们已经写了一个带图片的网页 我们接着练一下其他的常用标签 声明为 HTML5 文档 元素是 HTML 页面的根元素 元素包含了文档的元 meta 数据 如 定义网页编码格式为 utf 8
  • 2023面试真题之浏览器篇

    人生当中 总有一个环节 要收拾你一下 让你尝一尝生活的铁拳 大家好 我是柒八九 今天 我们继续2023前端面试真题系列 我们来谈谈关于浏览器的相关知识点 如果 想了解该系列的文章 可以参考我们已经发布的文章 如下是往期文章 文章list 2
  • Conflux Studio 安装教学

    在 Conflux Studio 详解 中 烤仔从安装 教程 功能预览三个方面向大家介绍了 Conflux Studio 本次 由黑曜石实验室的 CEO Phil 向大家展示如何使用 Conflux Studio 进行一个完整的 Confl
  • 使用jenkins进行项目部署

    前言 由于近期接手了前端的项目 在项目打包部署的时候 手动操作构建打包部署等等步骤非常繁琐 所以自己尝试使用jenkins帮助自己解决这一烦恼 之前有用过 但只是使用而已 这次借机自己搭建配置一下 本以为很简单但是在自己使用的过程也多多少少
  • DCMM GBT 36073-2018 数据管理能力成熟度评估模型(Word版)

    ICS 35 240 70 L 67 中华人民共和国国家标准 GB T 36073 2018 数据管理能力成熟度评估模型 Data management capability maturity assessment model 2018 0
  • QT::槽函数关联的三种方式

    1 第一种方法 首先在头文件中定义 private slots void show l 在 cpp中进行connect QtGuiApplication3 QtGuiApplication3 QWidget parent QMainWind
  • C与C++的不同--------extern

    extern可以置于变量或者函数前 以表示变量或者函数的定义在别的文件中 提示编译器遇到此变量和函数时在其他模块中寻找其定义 另外 extern也可用来进行链接指定 C 语言的创建初衷是 a better C 但是这并不意味着C 中类似C语
  • 分布式MySQL数据库TDSQL架构分析

    分布式MySQL数据库TDSQL架构分析 发表于 11小时前 次阅读 来源 程序员电子刊 0 条评论 作者 雷海林 MySQL TDSQL 腾讯 架构 width 22 height 16 src http hits sinajs cn A
  • 区块链平台开发

    太晚了 明天写
  • MVCC 脑图 数据库事务并发版本控制

    学习MySQL MVCC时做的脑图 记个笔记
  • 来了来了,2023年某中大厂真实面经!

    300万字 全网最全大数据学习面试社区等你来 本篇文章的面经是我辅导的一个同学的真实面试经历 2023年校招的宝子们拿走快看 第一个面经来自某头部大厂 1 做过的项目细节和遇到的问题 30分钟 所以说大家要对简历中的项目细节了如指掌 2 实