京东数据分析岗面试题:
一面:
一面技术面,主要考察了挺多机器学习的知识(随机森林跟lr比较多)。
1. 自我介绍+实习and项目介绍
2.随机森林相关的问题:基本原理,为啥随机森林是随机,随机森林跟普通bagging的区别是什么,随机森林得到的变量重要性排序的原理是什么
3.lr相关的问题:怎么评价一个logistic回归,roc曲线的原理,为什么auc可以评价一个模型的好坏,lr中阈值的设置对模型的影响,lr怎么实现的多分类
4.交叉验证的作用与原理,交叉验证的一种特殊形式是啥
5.一个智力题,相遇问题,求路程啥的
6.业务题:京东商城销量增长了20%,怎么进行分析
7.可能是开放式问题:设计一个未来汽车,你会设计一些什么功能
8.然后就瞎聊,啥兴趣爱好特长,学习成绩布拉布拉布拉布拉的
二面:
据二面面试官说,由于一面可以考察了专业知识了,她就不考察这一个方面了。所以主要是聊简历and问题问得有点像hr面
1. 自我介绍
2.实习项目介绍
3.每一份实习里面学到的东西,最喜欢哪一份实习
4.优点是啥,说一个事例来证
5.缺点是啥
6.在大学印象最深刻的事情
7.最近一次难过是因为什么
8.有没有写过数据分析报告,你平时写数据分析报告的格式流程是怎么样的
9.然后在提问环节我问了她们那边的业务场景是啥,感觉给自己挖了一个坑。然后面试官问了,你觉得针对这一些业务场景,可以从哪一些角度做数据分析
hr面就是继续自我介绍。实习项目介绍,然后闲聊。
拼多多数据分析岗面试题:
拼多多现在还只面了一面,估计凉了。提前批加秋招以来气氛最紧张的一场面试emmmm。
1.自我介绍,实习项目介绍
2.然后两个人围绕kmeans争论了可能有20分钟
3.怎么评断kmeans的效果
4.kmeans的k怎么选择,emmm我说可以根据可视化and调参,设定k的一些取值看哪一个效果最好。面试官似乎不满意,说你这样得出来的是你参数范围里的最优。好吧,我也不知道怎么回答这个问题。
5.kmeans聚类初始点的选择会不会影响聚类效果。然后就围绕这个问题讨论了很久,面试官认为是不会影响的,我觉得会影响,emmm,然后大家诉说自己的理由...emmm
6.kmeans的基本过程是怎样的
7.kmeans为什么最后聚类中心点可以收敛(这个我真不会证明orz)
8.kmeans的距离可以选择哪几种,适用场景分别是哪样的
9.问了两个sql题,一个是分数排名,一个是分数依次累加
看完上面的分享,不知道你有什么问题吗?可以留言给小优