首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
coldsheep
2016-06-08 11:34
已编辑
Java
关注
已关注
取消关注
有没有数据挖掘的面经啊。。
表示找数据挖掘的经验好少,准备的东西完全不够,求大神 介绍点经验
提示
全部评论
推荐
最新
楼层
华南码农培养基地
华南理工大学 算法工程师
面的腾讯的基础研究,我是搞机器学习的,主要是问项目,会根据你项目中用到的算法进行提问,看你对它的了解程度,最好熟悉用到的算法的原理,优缺点,看过源码是极好的
点赞
回复
分享
发布于 2016-04-13 15:02
coldsheep
楼主
Java
这里说的算法:你是指SVM或者决策树,ME等等算法吗?源码就是这些算法的实现吗?
点赞
回复
分享
发布于 2016-04-13 15:05
coldsheep
楼主
Java
你是在广州或者台湾吗?这么快腾讯就开始面啦?
点赞
回复
分享
发布于 2016-04-13 15:06
还没有回复哦~
相关推荐
02-20 19:42
门头沟学院 数据分析师
大厂Spark八股文面经及参考答案(阿里京东唯品会多家面经汇总)
Spark on standalone 模型、YARN 架构模型是怎样的?YARN - cluster 涉及哪些参数?Spark 支持多种集群管理模式,Standalone 和 YARN 是两种常用部署方式,其架构和交互逻辑差异显著。Standalone 模型Standalone 是 Spark 自带的集群管理器,采用 主从架构:Master 节点:负责资源调度和集群管理,跟踪所有 Worker 节点的状态。Worker 节点:运行 Executor 进程,执行具体的 Task。Driver 进程:可以运行在集群内部(Cluster 模式)或外部(Client 模式)。工作流程:用户提交应用后...
大数据从入门到精通-最全...
点赞
评论
收藏
分享
02-15 12:13
南方科技大学 数据仓库
美团数据挖掘
岗位名是数据开发,实则是做数据挖掘的组。问了很多算法😅1.介绍spark2.hash shuffle和sort shuffle区别3.文件少了什么会快?4.hash连接和join连接区别5.spark streaming和flink区别6.对NLP处理技术的了解7.讲一下什么是降维8.一个简历怎么变为一个向量9.编码器的输出是啥10.编码器和解码器为什么不同?11.编码器为什么不能生成12.GBDT讲一下13.它的目标函数咋设计的14.GBDT每个决策树拟合的目标是啥,为什么不能用一颗决策树。
查看13道真题和解析
点赞
评论
收藏
分享
01-31 20:10
复旦大学 数据分析师
数据分析秋招回顾-Day6: 统计学(Part 1)
Day6:统计学知识点总结(Part1) 核心知识点:3、假设检验、显著性水平、置信区间假设检验(hypothesis testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。其先对总体要得到的结论提出假设,然后利用样本信息去检验这个假设是否成立。显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。假设检验的基本思想:利用“小概率事件”原理,即小概率事件在一次试验中基本上不会发生。为了检验一个假设H0是...
点赞
评论
收藏
分享
01-29 08:16
已编辑
门头沟学院 大数据开发工程师
面经|快手-数据开发实习
2024.12.23(一面)一面 (1h 5mins)- 实习拷打 - 快手-评论模版留存率(10 mins) - 严格漏斗和非严格漏斗的区别 - 字节-链路改造优化 - 延伸:数据的时效性怎么保证(从整体和单点分别叙述) - 延伸:优化任务的思路 - 延伸:并行度相关的改法(三种) - repartition()能改变第一个stage的shuffle write的并行度吗? - 第一个stage的shuffle write的并行度由什么决定? - 字节怎么分的数据域 - 字节分了哪些主题域 - 数据域和主题域的区别(主题域:自上向下,从分析的角度划分) - 分层的意义(复用性和一致性) - 怎么考虑分层,该分多少层(直接说了没必要在意这个,要理解分层的本质,面试官表明说的也有道理,也抛了另一个观点:肯定要分层,需要有不同粒度的数据,每个人在意数据都不同,比如说老板在意汇总层的数据,数分可能更在意明细层的数据,另外,在做归因分析的时候也需要血缘追踪)- SQL题二面 (26 mins)全程实习拷打- 自我介绍- 字节实习 - 多机房代码一致性怎么保证的(治理存量,增量通过oceanus) - 多机房涉及到的网络问题(通过全球化数据迁移解决)- 快手实习 - 评论模版留存率 - 严格漏斗和非严格漏斗的区别(准确性和计算量之间的取舍) - 为什么这样设计 - 最终的目的是什么 - 有没有想过通过抽样解决数据量大的问题- 反问
查看18道真题和解析
点赞
评论
收藏
分享
02-16 06:34
已编辑
门头沟学院 数据分析师
大厂Hadoop(hdfs)面试题汇总及参考答案
Hadoop 有哪些组件?请简要介绍Hadoop 是一个由多个核心组件构成的分布式计算框架,每个组件负责不同的功能模块,共同支持大规模数据处理。以下是主要组件及其核心作用:HDFS(Hadoop Distributed File System)HDFS 是 Hadoop 的分布式文件系统,专为存储超大规模数据而设计。其核心特性包括:分块存储:文件被分割为固定大小的块(默认 128MB 或 256MB),分散存储在不同节点上。高容错性:通过多副本机制(默认 3 副本)确保数据可靠性。主从架构:包含 NameNode(管理元数据)和 DataNode(存储实际数据块)。YARN(Yet Anoth...
大数据从入门到精通-最全...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
脱下孔乙己长衫,浅聊一下就业下沉!
1.7W
2
...
腾讯PCG QQ后台开发一面
1.3W
3
...
【未来准备7】就业下沉时代,如何摆脱困境
1.0W
4
...
HR面全百科——缺点/不足/有什么要改进的
9667
5
...
任何人都可以复刻的AI修改简历思路
9567
6
...
实习生记住:你是去工作的,不是去受气的!
7545
7
...
快手产品运营一面😏凉了也赚了
7138
8
...
【职场生存术6】寻求帮助是一项高级技能,得慢慢学
6823
9
...
阿里云暑期实习java后端面经
5962
10
...
从双非院校一路 “杀” 进大厂,我是怎么做到的
5873
创作者周榜
更多
正在热议
更多
#
面试被问第一学历差时该怎么回答
#
98038次浏览
615人参与
#
你见过最离谱的招聘要求是什么?
#
152182次浏览
954人参与
#
水滴春招
#
38097次浏览
598人参与
#
你的房租占工资的比例是多少?
#
18112次浏览
223人参与
#
你想留在一线还是回老家?
#
17707次浏览
284人参与
#
听劝,这个简历怎么改
#
25432次浏览
326人参与
#
顺丰求职进展汇总
#
41905次浏览
252人参与
#
互联网行业现在还值得去吗
#
2711次浏览
23人参与
#
嵌入式岗知多少
#
24320次浏览
289人参与
#
2025,我想......
#
28518次浏览
310人参与
#
机械人的offer怎么选
#
119740次浏览
629人参与
#
大学最后一个寒假,我想……
#
18662次浏览
205人参与
#
面试被问“你的缺点是什么?”怎么答
#
15827次浏览
286人参与
#
第一份工作应该选高薪还是热爱?
#
11975次浏览
122人参与
#
机械人,你在招聘流程中的企业有哪些?
#
21807次浏览
205人参与
#
入职第四天,心情怎么样
#
13685次浏览
110人参与
#
招银网络科技工作体验
#
16058次浏览
81人参与
#
牛友投递互助,不漏校招机会
#
233176次浏览
3245人参与
#
0offer是寒冬太冷还是我太菜
#
1044819次浏览
8695人参与
#
租房找室友
#
8890次浏览
57人参与
#
大城市找工作会更容易吗
#
5820次浏览
31人参与
牛客网
牛客企业服务