蓦_然 - 个人主页动态

发布(82) 评论刷题

2022-10-19 19:04

广东工业大学大数据开发工程师

#哪些瞬间让你真切感受到了工作的乐趣#下班那一刻，还可以直接走

哪些瞬间让你真切感受到了工作的乐趣

0 点赞评论收藏

2022-10-19 19:03

广东工业大学大数据开发工程师

#找工作中的意难平#

找工作中的意难平

0 点赞评论收藏

2022-10-19 19:03

广东工业大学大数据开发工程师

#找工作中的意难平#明明都回答出来了，明明都a了，明明。。。。。

找工作中的意难平

0 点赞评论收藏

2022-10-18 14:04

已编辑

广东工业大学大数据开发工程师

阿里云大数据开发二面面经，已过，面试题已配答案

一面：https://www.nowcoder.com/discuss/1079324 1、数据库三范式 第一范式：（字段不能重复且不能分解） 我们也叫1NF。这个范式主要还是让我们去看看表中不要存在可以被分割的列，同时表的列不能重复。当然，在实际操作过程中，我们如果录入相同的列，系统也是会报错的。 第二范式：（增加主键） 我们也叫2NF。这个范式的前提是必须要先满足第一范式的要求。当然，2NF的主要特点还是主键（从候选码挑选出来的字段，候选码是能决定唯一一行记录的属性组），所谓主键也是是能够决定一行数据的候选码。也就是...

投递阿里云等公司10个岗位 >

0 点赞评论收藏

2022-10-17 23:00

广东工业大学大数据开发工程师

阿里云大数据开发一面面经，已过，面试题已配答案

这份面试题时群里一位小伙伴分享的，我给这份面试题找了一些参考答案 参考答案来源：https://www.nowcoder.com/discuss/929016 1、实习经历 这一点就不多说了，每个人都不一样，根据自己的介绍就行。 2、简单介绍wordcount 先来看一张图 具体各个阶段做了什么 spliting ：Documents会根据切割规则被切成若干块， map阶段：然后进行Map过程，Map会并行读取文本，对读取的单词进行单词分割，并且每个词以键值对<key,value>形式生成。 ...

投递阿里云等公司10个岗位 >

0 点赞评论收藏

2022-10-16 13:06

广东工业大学大数据开发工程师

实习/秋招该怎么准备？

当我们准备找实习或者秋招找正式工作时，都会去回顾自己学过的东西，做过的项目，实习内容。自己会什么，熟悉什么，了解什么，这里面什么是重点，学过的东西什么是自己已经比较熟悉的了，什么是需要再次重点复习的，项目该怎么去概述等等。 1、梳理“简历”->简历初稿 在投递简历前，我们最重要的就是准备一份符合需要投递相关岗位的简历，这份简历大体上后续都不会有大的改变，也许会需要修改，但也是优化小改。 首先，我们要梳理自己会的编程语言，会什么框架，什么数据库等。先把自己学过的内容都写下来，然后一点点去整理分析。 比如编程语言：Java、Python、Sca...

0 点赞评论收藏

2022-08-27 23:57

广东工业大学大数据开发工程师

数据仓库面试题——数据仓库分层

问过的一些公司：字节 x 2，字节(2021.07)-(2021.08)-(2021.10)，阿里 x 2，爱奇艺，百度 x 2，百度(2021.08)，网易 x 3，网易(2021.09)x2，美团 x 4，美团(2021.09)x2，京东，京东(2021.09)，贝壳，keep，马蜂窝 x 2，转转，滴滴，小米，米哈游，有赞 x 2，猿辅导，58 x 2，作业帮社招，字节社招，腾讯社招 x 2，端点数据(2021.07)，百度(2021.09)，蔚来(2021.09)，恒生(2021.09)，快手(2021.09)，唯品会(2021.10) 参考答案： 首先，我要知道数据仓库分...

牛客375783451号：

0 点赞评论收藏

2022-08-27 23:55

广东工业大学大数据开发工程师

数据仓库面试题——介绍下数据仓库

可回答：对数据仓库的理解 问过的一些公司：京东，美团，网易，阿里(2021.09)，网易有道(2021.10) 参考答案： 数据仓库的发展大致经历了这样的三个过程： 简单报表阶段：这个阶段，系统的主要目标是解决一些日常的工作中业务人员需要的报表，以及生成一些简单的能够帮助领导进行决策所 需要的汇总数据。大部分表现形式为数据库和前端报表工具。 数据集市阶段：这个阶段，主要是根据某个业务部门的需要，进行一定的数据的采集，整理，按照业务人员的需要，进行多维报表的展现，能够提供对特定业务指导的数据，并且能够提供特定的领导决策数据。 数据仓库阶段：这个阶段，主要是...

0 点赞评论收藏

2022-08-27 23:53

广东工业大学大数据开发工程师

Spark面试题——说下对RDD的理解？RDD特点、算子？

问过的一些公司：字节x2，小米×2，平安，阿里x 2，海康，美团x2，一点咨询，趋势科技，快手x2，阿里云社招，祖龙娱乐，360，字节社招，端点数据(2021.07)，大华(2021.07)，触宝(2021.07)x2，携程(2021.09) 参考答案： RDD（Resilient Distributed Dataset）叫做弹性分布式数据集，是 Spark 中最基本的数据处理模型。代码中是一个抽象类，它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。 RDD特点 RDD表示只读的分区的数据集，对RDD进行改动，只能通过RDD的转换操作，由一个RDD得到一个...

0 点赞评论收藏

2022-08-27 23:51

广东工业大学大数据开发工程师

Spark面试题——Spark小文件问题

问过的一些公司：vivo，陌陌(2021.07) 参考答案： 1、相关问题描述 当我们使用spark sql执行etl时候出现了，可能最终结果大小只有几百k，但是小文件一个分区有上千的情况。 这样就会导致以下的一些危害： hdfs有最大文件数限制； 浪费磁盘资源（可能存在空文件）； hive中进行统计,计算的时候,会产生很多个map,影响计算的速度。 2、解决方案 1） 方法一：通过spark的coalesce()方法和repartition()方法  val rdd2 =...

0 点赞评论收藏

2022-08-27 23:49

广东工业大学大数据开发工程师

Spark面试题——Spark的内存管理机制

可回答：executor内存分配 问过的一些公司：流利说，陌陌，商汤科技，阿里 参考答案： 在执行Spark 的应用程序时，Spark 集群会启动 Driver 和 Executor 两种 JVM 进程，前者为主控进程，负责创建 Spark 上下文，提交 Spark 作业（Job），并将作业转化为计算任务（Task），在各个 Executor 进程间协调任务的调度，后者负责在工作节点上执行具体的计算任务，并将结果返回给 Driver，同时为需要持久化的 RDD 提供存储功能。下方内容中的 Spark 内存均特指 Executor 的内存。 1、堆内和堆外内存规划 ...

0 点赞评论收藏

2022-08-27 23:45

广东工业大学大数据开发工程师

Spark面试题——Spark容错机制

问过的一些公司：头条， 字节，阿里 x 3，腾讯，竞技世界 参考答案： 1、容错方式 容错指的是一个系统在部分模块出现故障时还能否持续的对外提供服务，一个高可用的系统应该具有很高的容错性；对于一个大的集群系统来说，机器故障、网络异常等都是很常见的，Spark这样的大型分布式计算集群提供了很多的容错机制来提高整个系统的可用性。 一般来说，分布式数据集的容错性有两种方式：数据检查点和记录数据的更新。 面向大规模数据分析，数据检查点操作成本很高，需要通过数据中心的网络连接在机器之间复制庞大的数据集，而网络带宽往往比内存带宽低得多，同时还需要消耗更多的存储...

0 点赞评论收藏

2022-08-27 23:40

广东工业大学大数据开发工程师

计算机网络面试题

1. TCP建⽴连接的过程。 三次握⼿： 1. 第⼀次握⼿(客户端发送syn包到服务器端)：客户端发送syn包到服务器端，进⼊syn_send状态，等待服务器端的确认； 2. 第⼆次握⼿(服务器返回syn+ack包给客户端)：服务器端收到客户端的syn包，发送syn+ack包给客户端，进⼊syn_recv状态； 3. 第三次握⼿(客服端返回ack包给服务端)：客户端收到服务器端的syn+ack包，发送个ack包到服务器端，⾄此，客户端与服务器端进⼊established状态； 4. 握⼿过程中传送的包不包含任何数据，连接建⽴后才会开始传送数据，理想状态下，TCP连...

0 点赞评论收藏

2022-08-26 21:57

广东工业大学大数据开发工程师

MySQL面试题（四）

38、  Myql 中的事务回滚机制概述 事务是用户定义的一个数据库操作序列， 这些操作 要么全做要么全不做， 是一个不可分割的工作单位， 事务回滚是指将该事务已经完成的对数据库的更新 操作撤销。 要同时修改数据库中两个不同表时， 如果 它们不是一个事务的话，  当第一个表修 改完， 可能第二个表修改过程中出现了异常而没能修改， 此时就只有第二个表依 旧是未修改之前的状态， 而第一个表已经被修改完毕。 而当你把它们设定为一个事务的时候，  当第一个表修改完， 第二表修改出现异常而没能修改， 第一个表和 第二个表都要回到未修改的状态， 这就是所谓的事务回滚 ...

0 点赞评论收藏

2022-08-26 21:49

广东工业大学大数据开发工程师

MySQL面试题（三）

27、索引的底层实现原理和优化 B+树， 经过优化的B+树主 要是在所有的叶子结点中增加了指向下一个叶子节点的指针，  因此InnoDB 建 议 为大部分表使用默认自增的主键作为主索引。 28、什么情况下设置了索引但无法使用 1、  以 “ % ” 开 头 的 LIKE 语 句 ，  模 糊 匹 配 2 、  OR 语 句 前 后 没 有 同 时 使 用 索 引 3 、数 据 类 型 出 现 隐式转化(如 varchar 不 加 单 引 号 的 话 可 能 会 自 动 转 换 为 int 型 ) 29、实践中如何优化 My...

0 点赞评论收藏

关注他的用户也关注了：