加入收藏 | 设为首页 | 会员中心 | 我要投稿 天瑞地安资讯网_黄海网 (https://www.huanghaiwang.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据开发面试常见问题

发布时间:2022-10-19 11:02:57 所属栏目:大数据 来源:
导读:  不同岗位、不同公司、不同面试官问的内容是不一样的。

  大数据开发包括Hadoop(ETL,Mapreduce),Spark(SparkSql和SparkStreaming),Python等,看你偏向的技术了。另外大数据开发看是否偏向数仓开发和数据
  不同岗位、不同公司、不同面试官问的内容是不一样的。
 
  大数据开发包括Hadoop(ETL,Mapreduce),Spark(SparkSql和SparkStreaming),Python等,看你偏向的技术了。另外大数据开发看是否偏向数仓开发和数据分析,又会不一样。不同的面试官和公司用到的技术栈也不一样,问的问题也会有很大差别的。
 
  我说说我面试大数据开发岗面试官常问的问题吧。因为我简历项目项目经验注重实时流处理这方面,在面试时,面试会在这些方面问的比较深,我前后梳理一遍吧。一般上来就是自我介绍,谈下工作经历和项目经验,面试官会根据你的项目经验对你进行技术面试。
 
  1,Java是必问的,不过问的不深大数据开发,把Javase部分吃透,足以应付Java部分的面试。
 
  2,Hadoop生态,Yarn、Zookeeper、HDFS这些底层原理要懂,面试经常被问。
 
  3,Mapreduce的shuffle过程这个也是面试被常问的。
 
  4,Hbase和HIve,搞大数据这些不懂真的说不过去。
 
  5,Mysql、Oracle和Postgres数据库操作要回,Sql要会写。
 
  6,linux操作系统,这个简单得命令必须要懂,会写shell脚本更好了。
 
  7,Kettle或Sqoop这种数据处理工具至少要会一个。
 
  8,数据仓库建模、数据模型的问题。
 
  上面这些更偏向数仓方面,这些能回答明白足以找一份大数据开发工作了,当然想谋求更好发展,还要了解下面的。
 
  1,SparkSql和SparkStreaming,底层原理、内核、提交任务的过程等等,尽量深入内幕,这个经常会跟MapReduce作比较的。当然也要了解Storm和Flink,Flink这个建议要学会,以后用处会越来越广。
 
  2,Redis、Kafka、ElasticSearch这些都得懂原理,深入了解,会使用,会操作,会调优。
 
  3,impala和kylin这些尽量也要了解会用
 
  4,Python这个要是有能力,有精力,建议也要往深处学习,我目前正在自学中。
 
  5,集群的问题,包括一些简单的运维知识。
 
  6,大数据数据倾斜的问题,包括Spark JVM内存调优问题等等。
 
  我以前找工作面试很多家公司,这些都会问到,当然不同的公司问的技术是不一样的,大体上都是围绕着上面来问的。
 

(编辑:天瑞地安资讯网_黄海网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!