牛客网数据开发题库_京东2020届数据分析面试题合集(上) - Go语言中文社区

牛客网数据开发题库_京东2020届数据分析面试题合集(上)


点击上方“数据管道”,选择“置顶星标”公众号

干货福利,第一时间送达

61749b88b1d36a7dfb770de8226e1dd3.png

来源:胖里的日常

整理:胖里

01篇

作者:猛汉翠西   来源:牛客网

1、实习内容,主要就是挖简历里的实习内容

2、介绍一个实习的项目

3、实习工作中遇到的最大的挑战

4、实习项目里有个异常归因,问了下。京东注册人数突然增加20%,分析原因

5、sql题,数用户最大连续购买天数

6、用python吗,主要干嘛用的。问了continue和break,append

7、会a/b吗,因为实习业务方不是产品,没怎么接触过

整体面试不难,但是sql我答得不太好,有点凉。

02篇

作者:求求来一个offer吧   来源:牛客网

一面

1. 简历项目

2. 神经网络 如何防止过拟合?dropout测试集怎么处理?神经网络层数深有哪些问题?梯度消失梯度爆炸等等解决方法?

3.python垃圾回收机制

4.手撕算法

二面

1.简历项目

2.情景题 预测广告曝光率排名之类的

3.爬虫和普通用户如何识别 问得很细很细

4.手撕算法

5.输入url网址按下回车后发生了什么(计网的经典题啊可惜本科学的都忘了 太菜了我

6.c语言和python有什么区别?

二面结束很快就凉了。。。真的被虐哭了,感觉京东的数分偏算法,没想到会考这么多计算机基础,当然还是我太菜了本科学的操作系统 网络什么的很多概念都模糊了,还得继续努力啊!发个面经为之后攒人品???

03篇

作者:只为求一offer   来源:牛客网

下午两点的面试,对面是个小哥哥,问了需不需要开视频,他说不用,他先自我介绍说是广告部的,面了快一个小时,真是快把我问崩溃了,想哭了都,可能是我太菜了,应该要凉!

1.自我介绍;

2.深挖项目,而且还提出了质疑,质疑到我都快说不出话来了;

3.共享屏幕,手撕代码,选取中位数;

4.最后发了个类似于笔试的那种编程题,说下思路,还好没让编程实现,要不然给跪了。

04篇

作者:花颜许夏   来源:牛客网

笔试4.19,4.21收到面试通知

一面:4.22 11.am面试时长30min

1、首先是自我介绍

2、然后问了实习经历,主要做过的分析,详细过程讲一下

3、你觉得数据分析师的职责是什么,应该具备哪些资质

4、从事数据分析,你的优势和劣势是什么

5、数据分析的工具会哪些,SQL会的吧?

6、数据分析的整个流程讲一下,数据分析报告是怎么写的

7、你未来的职业规划是怎样的

8、提问环节

后续看官网通知,我估计没后续了?  

提问很常规,是京东金融下面支付业务的商业分析部门,感觉是强业务导向,技术方面没问问题

05篇

作者:渭城朝雨邑轻尘客舍青青柳色新    来源:牛客网

已拿offer

一面:

1.简历项目

2.简历项目相关分析迁移到京东生鲜如何分析

3.对岗位的认识

4.如何看待京东

二面:

1.简历项目 2.为什么不留在实习公司 3.觉得实习的公司,京东,和京东相关的公司如何排序,为什么 4.为什么要来京东 5.喜欢偏业务的数分还是偏技术类的数分 6.水龙头为什么叫水龙头 7.大部分生鲜奶制品包装瓶为什么都是方的 8.自己的缺点和劣势 9.为什么想在北京 三面hr: 1.怎么看待最近京东的负面新闻   2.为什么要来京东 3.自己的缺点优点,劣势 4.对京东的理解 5.父母对于择业的看法 6.择业观

06篇

作者:666顺利毕业   来源:牛客网

京东(数据分析工程师)(9.2)(现场)

1.Rfm模型

2.Python如何连数据库

3.system.pas(这个我可能没听清,下来查了查也不知道是啥)

4.grep是啥

5.hive的并行化操作,管道操作

6.map join

7.Python如何传参

8.漏斗模型

9.静态分区和动态分区的区别

10.问京东分为不同会员,如何从各个方面提高下单率(漏斗模型)

11.hive的字符串操作函数,窗口函数

12.一道sql问题,求出全部成绩>80的学生,可以用min(score)over(partition by sname)>80,就可以满足所有成绩>80,也可以用row_number()但是没有上面的简洁.

13.用的图表,取哪些指标,数分需要哪些核心技能,python的基础知识?

总结:小姐姐貌似不太会机器学习那些,全程问的hive的一些很基础的知识,也没问项目,这是第一个现场面,所以有点紧张,而且感觉这个很偏ETL,所以被问的很惨,基本没有答上来,数分真的太南了,要掌握这么多知识...

07篇

作者:Offer+++2019WWW  来源:牛客网

一面:时长:约40min 形式:一v一现场

1.先是聊了聊学校和专业

2.你学的这个专业,你认为对你影响最大,最大的成长或收获是什么呢?为什么?举个最近实际的例子?

3.详细问是例子中是怎么想、怎么做、怎么实现的。

4.运用数据分析,分析一下酒店的漏水情况。和面试官一来一往提出假设,具化问题, 分析讨论。

5.你有什么问题?

6.你SQL怎么样?

二面 时长:30min左右 形式:1v1现场

1.自我介绍

2.你实习的公司里,说一下xx和xx的不同,你认为谁带给你的收获更大? 

3.你认为数据分析工程师应该具备怎样的素养?为什么?

4.在你提到的这几个部分,你觉的自己哪方面最好? 

5.你对忠诚度怎么看?团队忠诚度。

6.你对自己最欣赏的一个点是什么?说一下你的规划?

7.如果你三年后会申请离职,你觉得最有可能的原因是什么?

8.如果你的数据分析结果业务人员不满意,你会怎么解决?

9.假设现在我们要做一个促销活动,请你从数据分析的角度给业务人员一些品类建议,你会怎么做?

10.你有什么需要改进的地方吗?   

11.你觉得你昨天面试面的怎么样?如果一面面试官提了一些待改进点给你,你觉得会是什么呢?   

12.说一下昨天面试聊的题目吧。

13.你有什么要问我的吗?

14.你知道拼多多吗?

15.你认为京东有必要做一个像拼多多的模块吗?为什么?

面的应该是社交电商部门,京东昨天推出了“京喜”小程序+app,对标拼多多,就是这个部门的工作和产品。感谢面试官!(*^▽^*)

HR面 时长:8min 形式:电话面试

比约定的时间晚了20多分钟,hr今天应该非常忙,感谢在午饭前打过来了。

1.自我介绍

2.看你实习过的公司,你有关注xx的秋招吗?你关注秋招时想做的工作、看重的公司是什么呢?

3.说一段你最有成就感的实习经历。

4.平时你和你的导师怎么评价你呢?

5.你的导师没有给你一些建议吗?是什么呢?

6.你觉的自己性格上有什么缺点?

7.关于此次招聘,你还有什么问题要问我吗?

问了下一步进展,说9月底前发出是否有offer的邮件通知。(☆▽☆)

08篇

作者:-offer会有的!来源:牛客网

一面:40min  

首先是30分钟的笔试,六道大题。

1. Linux基础

2-4. HiveSql

5. MapReduce的步骤和作用

6. 请从以下角度介绍一个你的项目,不用写,口述即可。

面试环节10分钟左右,主要是问简历细节,每一次实习的主要工作,Python和MySQL的使用占比。

最后介绍了一下他们的部门和业务,主要工作是大数据相关的BI。

二面:40min  

总体来说就是:我玄学地通过了jd的玄学二面。

1. 自我介绍。

2. 最近的一次实习,你用到了ABtest,你是怎么用的。

2.1 为什么按城市划分,有考虑到不同城市的不同情况吗  

2.2 回收的结果确定能验证你的结论吗  

3. 最近的一次实习,你用到了因子分析和主成分,但是做的是综合评价,这两种方***导致的指标信息损失你怎么处理?

3.1 你的结果得到了评价对象的认同吗,怎么跟他们解释你用到的方法? 

3.2 如果想要一个不损失信息的办法,你怎么改进  

3.2 想过用复杂模型训练,去得到更好的结果吗  

4. 上一次实习,你提到了数据提取和清洗,讲一下如何提取和如何清洗的。

4.1 提取之后的数据如何储存? 

4.2 对非结构化数据处理有接触吗  

4.3 对自然语言和文本处理有接触吗  

4.4 数据校正的过程中,你用到了几种校验结果的逻辑? 

4.5 如果你用到了多种逻辑,就比如说是两种吧,请问你是串行还是并行? 

4.6 如果两种逻辑,一个验证通过,说数据没问题,一个说有问题,你怎么判断? 

4.7 如果业务人员现在告诉你,两种逻辑对他们来说权重一样,没差别,你怎么判断? 

5. 讲一个你最熟悉的项目吧。(讲了最近实习的数据挖掘,关于广告主的)

5.1 你提到你选择了三个方面的指标,第一,你考虑客户自身的属性,请问会考虑到他自身的经营情况吗?(并没有…)  

5.1.1 给你一点建议,关于客户自身经营情况的数据怎么获取。 

5.2 第二个方面的指标,客户行为,只考虑他在你们这个平台的行为吗?客户在整个市场的行为是不是也会有影响? 

5.2.1 继续深入客户的其他行为,会如何影响,怎样获取这些行为数据  

5.3 第三个方面的指标,详述一下你怎么构建的特征。 

5.3.1 如果现在让你在这方面构建更多的特征,你会想到哪些(我提到了投资回报率)  

5.3.2 你提到的指标,比如ROI,属于结果指标,一般增量市场会更多地考虑结果指标,那现在客户面临一个存量市场,更应该关注过程指标,你怎么考虑他的广告效果,可以从你这个投放平台的角度来说,也可以从客户自身的角度来(这里我说了转化漏斗那些,并且最终还是提到了ROI,23333)  

5.3.3 解释他为什么关注过程指标,以及他们当前的业务情况。 

6. 提问环节

问了我跟这个岗位招聘需求的差距,面试官提了三个方面的建议,有一个是关于过程指标的,另一个是提到应该关注数据本身的价值。 

三面:hr面,15min左右  

1. 租房,有没有关系好的朋友在北京,会不会一起租房,租在公司附近比较偏能接受吗

2. 在流程中的公司,怎么选择

3. 为什么选择京东

4. 你在选择就业平台的时候,觉得平台能给你提供的哪些东西是重要的,请排序说明

5. 讲一个你性格中的缺点

09篇

作者:什么时候才能有offer啊        来源:牛客网

面的部门是人工智能的什么算法模型研究部,部门需要的是为算法工程师提供数据的数据分析工程师,通过和算法工程师沟通如何建立特征工程,用数据库语言或者python在京东底层数据库中抽取数据,进行整合、清洗巴拉巴拉的那些数据清洗工作,然后构造特征工程,最后把数据给算法工程师。说是他们部门十几个算法工程师,就一个数据工程师,现在岗位很空缺,听上去个人感觉就像人形ETL,算法工程师的提数机.........

一面内容:

1. 笔试的一些问题和自我介绍

2. 和数据分析相关的的项目有哪些

3. 简单介绍一下相关的几个项目怎么做的,数据量有多大,期间穿插问了项目中提到的技术知识(xgboost和RF的区别,追问二者并行的实现有什么区别;kmeans调参怎么确定参数),我噼里啪啦说了一大堆,没有问太多项目相关的问题了,可能项目比较菜没什么好问的?

4. 有什么要问我的

二面内容:

1. 万年不变自我介绍

2. 为什么选择数据分析不选算法

3. 介绍一下各种join和应用场景

4. 写sql:筛选出不同品牌电脑2017年销售总额、2018年销售总额以及2018年销售额增长率。

5. 单独一个数据列如何去重

6. 写python语句:

6.1 如何将一列dataframe里的字符串类型属性转化成整型      

6.2 如何截取这列数据字符串的前两个字母      

6.3 如何筛选出这列数据里字符串长度大于10的数据    

7. 写算法题:链表、快排、递归、动态规划选一个,选了链表,如何判断两个链表是交叉链表,写出代码。

凉的透透的,9.4上午面完二面面试官让我回去等看看HR怎么通知我,我还心存侥幸,结果回来等了一天,今天中午刷新状态是复试未通过,不配做东哥的兄弟,告辞了。

10篇

作者:嘻嘻啧啧     来源:牛客网

一面:武汉 9月2日下午2:30

1.讲一个核心闪光项目,balabla讲了20min

1.1 数据预处理怎么做的

1.2 模型怎么验证好坏

1.3 有在实践中应用吗

2.两个SQL,磕磕绊绊5分钟

2.1 求各科成绩都在80分以上的学生名单,我复杂化了脑子短路了,忘了使用min函数

2.2 根据两个表和结果表还原SQL语句,这个也答得不完美,那个默认函数没用过我只说了去百度查这个功能的函数肯定有,不然就写IF THEN

3.用过哪些可视化工具

matlab R matplotlib seaborn我就对比了下这几个的异同,缺点优势

4.用过linux哪些命令,我说chmod、grep、ls、cd,又问awk,我说我没用过,她说没事,学起来上手很快

5.她说她做数据处理这块的,我就说那应该用Python、Hadoop比较多,就说了hadoop的特性和原理

6.怎样在电商运行中的各个环节增加用户留存率和交易量   从漏斗模型的各个环节说对策,线上线下,说各种营销手段

7.说说Hive

8. 问了个问题:工作中最感到挑战性的事情

一面的面试官对我挺好的的,运气太好,感恩

二面:武汉 9月3日 上午11:00

自我介绍后,这应该是一个完全业务化的面试官

1.科研项目中模型怎么验证好坏,推了几个公式,好像他不怎么懂

2.K-means用过没,我说用在POI聚类里了,刚准备画图讲算法他说别讲了,然后我就说了POI聚类的事情

3.RFM模型(面试官鸽我的一个小时刚好学习到)

4.应用问题:同一品类商品只有2个字段的性能,另一个有6个字段,怎样证明后者优于前者

5.应用问题:对于某一品类的商品的数量的健康度衡量,确定一个合适的数量。

6.你觉得这个岗位你还要在未来一年准备些啥?

二面其实答得都还可以,我太难了,所有面试进程都挂在二面!

著作权归所有作者所有,整理来自公众号【职研视界】,商业转载请联系作者获得授权,非商业转载请注明出处。本文为转载整理,如有侵权请联系后台删除。

a63993edd616e106d768461e6c698d89.png

版权声明:本文来源CSDN,感谢博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/weixin_29668721/article/details/112352296
站方申明:本站部分内容来自社区用户分享,若涉及侵权,请联系站方删除。
  • 发表于 2021-06-26 22:15:58
  • 阅读 ( 639 )
  • 分类:面试题

0 条评论

请先 登录 后评论

官方社群

GO教程

猜你喜欢