乌鸡国国王_ level
获赞
90
粉丝
46
关注
16
看过 TA
795
Columbia University
2024
数据分析师
IP属地:美国
I am my own asylum
私信
关注
无自我介绍、业务介绍,直接开始。首先问了项目里的文字处理和图片处理,有没有用到NLP的知识,图片处理有没有用RNN,我说:“都没有!”然后他就开始问共享单车有没有用LSTM这种深度学习算法,我说:“当时考虑过,但是没有用!”然后面试官说考考深度学习、机器学习基础原理这块吧(都忘了!哈哈!)1、GLM是什么?我就说是generalized linear model广义线性模型,然后卡住。。2、SVM的原理?怎么找到最优的线性分类器?支持向量是什么?· 本质是:最优化问题· 离这个超平面最近的点就是”支持向量”3、介绍一下CNN?4、CNN中的卷积到底指什么?举个例子?具体细节忘了,只说了个大概。。5、介绍决策树、信息熵?6、随机森林“随机”二字体现在什么地方?随机森林的随机性体现在每颗树的训练样本是随机的,树中每个节点的分裂属性集合也是随机选择确定的。7、介绍一下XGBoost,与GBDT相比有什么不同?(被问成SB)答:损失函数不同,追问哪里不同,我说正则化项和泰勒展开(传统的GBDT在优化的时候只用到一阶导数信息,XGBoost则对代价函数进行了二阶泰勒展开,得到一阶和二阶导数; XGBoost在代价函数中加入了正则项,用于控制模型的复杂度),追问泰勒展开哪里不同,我说一个一阶一个二阶,追问为什么二阶更好,我开始瞎说“因为二阶更接近真实值包含更多信息”,追问那三阶呢?我又瞎说“因为三阶可能使模型太复杂了”,又追问“那为什么二阶不复杂呢”,我说不知道。。。8、一道coding:Given an int array wood representing the length of n pieces of wood and an int k. It is required to cut these pieces of wood such that more or equal to k pieces of the same length len are cut. What is the longest len you can get?     e.g. [5,9,7]  K=3算法真的太难了,对基本模型的理解要求特别高,在基本功这块还得下功夫,然后做做深度学习NLP这些项目试试。#京东物流##算法工程师#
投递京东物流等公司10个岗位
0 点赞 评论 收藏
分享
一共面了35分钟左右,面试官人挺好的。一上来就给我介绍了部门的业务(focus在抖音支付),即通过数据分析以及机器学习建模的方法提供增长策略、增长产品。Base在北京。1、自我介绍2、问我数据分析过程中遇到的最难处理的数据是什么?感觉有点答偏了sos,说了TCL实习中数据不能及时反馈机器崩溃信息的情况。面试官又接着我的回答问了几个following question(怎么确保数据的准确性)3、深挖了首尔共享单车的项目(其实就是我罗里吧嗦说了半天他也没有问太多问题哈哈哈)4、产品题:有一天微信支付的DAU下降了10%,分析原因。(妈呀下午正好准备了这个问题!)①确认数据的真实性首先要判断数据是否准确,数据可能是不准确的。②维度拆分· 拆用户: 新用户、老用户· 拆登录平台: ios、安卓...· 拆版本: 新版本、老版本· 拆登录渠道: app,小程序,PC端...· 拆区域: 国家、省份等· 拆时间: 淡旺季日夜产品周期性然后,对每个维度下的各个指标进行比例值变化的计算,并计算影响系数。影响系数=(今日量-昨日量)/(今日总量-昨日总量)影响系数越大,说明此处就是主要的下降点。③作出假设了解数据异常时间点附近做了什么产品、运营、技术侧调整,方便我们将假设范围缩小,节约时间。④细分假设,确立原因⑤提出解决方案5、SQL写得多吗?left join和right join和full join的区别6、反问除了数据分析的工作之外,做机器学习模型的可能性?答:可以先从小模型开始做!球球让我过吧!#字节跳动##数据分析##抖音支付#
投递字节跳动等公司10个岗位
0 点赞 评论 收藏
分享
妈呀有点太菜了,但是还是Mark一下勇敢踏出算法工程师第一步base在北京 面试官好像是一名工作时长10来年的程序员 人特别好谢谢你~了解到该岗的主要业务是:网约车供需预测+因果推断两大块供需预测其实通常使用深度学习结合时序,预测的量有:某时某地的订单量+成交率/成交金额...供需调度的最基本思想就是“缺什么补什么”,比如早高峰的时候,用车不足,那么其实滴滴平台会给司机奖励机制(发钱),鼓励他们上路接单(每年支出占比大),但具体怎么制定这个奖励机制(以希望ROI尽可能大)则是一个非常复杂的过程。过简历的原因大概率是因为大三那会,一门机器学习的课做的project就是首尔共享单车需求量预测的,和该部门业务非常类似。但是由于当时学的比较初级,用到的也就是一些简单的decision tree,random forest和gradient boosting的算法,甚至没有考虑时间序列。面试官直言时序预测在业务中是绝对不可忽视的一环(颗粒度大3个月,小至1小时),观测到y值的相关性是非常重要的。之后又考察了对随机森林的理解,优缺点(在决策树的基础上进行了哪些改进?)问得比较深入,包括调的包里的多个参数。印象比较深的是如何保证随机森林(多棵树)一定比决策树(单棵树)好?妈呀,我这都忘了。其实就是随机森林代码中可以选择参数(如训练集与测试集的比例,以及每次训练一棵单独的tree可以用不同的factor进行拟合,这样就能保证2我们forest中的每棵树都是不一样的,相关性没有那么强,这样子最后取平均才有意义~)面试官给的建议是,想转行可以多做一些算法相关的比赛、项目,比如kaggle网站里的,最重要的是要多研究那些排名高的项目所使用的方法是怎样的,与自己写的进行查漏补缺的对比。然后可以读读相关的业界的论文。算法岗的要求会比DA、DS高不少,所以蛮不容易的,加油吧哈哈。。#滴滴##算法工程师#
投递滴滴等公司10个岗位
0 点赞 评论 收藏
分享
咕咕咕12:过来人,建议快手电商数分就是坑!!!组内氛围极其压抑,加班严重,领导各个精神pua,已跑
投递快手等公司10个岗位
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务