职责:
1. 负责公司核心集群的运维工作,保证其高可用和稳定性。
2. 负责集群容量规划、扩容及集群性能优化。
3. 深入研究大数据业务相关运维技术,持续优化集群服务架构,探索新的Hadoop运维技术及发展方向。
4. 设计实现分布式集群的运维、监控和管理平台。
职位要求:
1.2年以上中等规模集群环境下的Hadoop/Impala/Hive/Spark集群相关运维经验。
2.对各种HDFS/Yarn/Hive/Impala/Spark/Hbase等相关参数调优, 性能优化等有实际经验。
3.有实际踩坑经历, 对于相关组件的版本跟进, 补丁跟踪, bug追踪等有相关经验。
4.实际处理过各种集群在线版本升级, 数据迁移, 集群扩容, 稳定性监控等工作。
4.熟悉Kerberos安全认证系统,实施过集群权限管理, 资源隔离方面的方案规划或二次开发工作。
5.有Cloudera的CM使用经验尤佳。