
正在查看应届生Hadoop规范简历模板文字版
陈小湾
求职意向
工作经历
XX智能定位[制造业数字化转型]解决方案商,[工业大数据中心](20-40人)含[ETL开发组/数据建模组/BI分析组],自主研发[智能仓储优化算法/设备预测性维护模型],服务[宁德时代/格力电器/北汽新能源]等[8-12家]上市企业,部署[50+/100+]Kerberos认证集群,构建[2000+/5000+]节点HBase数据库,数据任务执行效率提升[40-60%],获评[省级工业互联网示范平台]。
工作内容:
1.数据基础处理:协助完成每日TB级数据的ETL流程,使用Hive编写SQL脚本进行数据清洗,配合团队完成HDFS分布式存储管理。
2.模型基础实施:根据数据工程师提供的ER图,在HBase中搭建基础数据表结构并创建二级索引。
3.可视化支持:使用PowerBI制作基础业务报表模板,定期更新销售数据仪表盘。
4.安全运维辅助:参与Kerberos认证环境的日常维护,监控集群访问日志。
工作业绩:
1.优化Hive查询语句,将每日定时任务执行时间缩短40%。
2.通过合理设置HBase预分区策略,减少热点数据问题发生率70%。
3.开发自动化报表生成脚本,节省业务部门每周5人时的重复工作量。
4.协助完成季度安全审计,100%通过权限配置合规性检查。
离职原因:寻找更具挑战性的工作机会。
项目经历
针对【2000万+日活用户】的实时推荐需求,原批处理架构导致【推荐结果更新延迟达6小时】,关键【用户点击行为特征计算】环节存在数据倾斜问题。基于Hadoop生态重构为Lambda架构,整合【HBase+Kafka】实现实时+离线混合计算,解决【特征数据时效性不足】【计算资源浪费35%】等痛点。
项目职责:
1.主导【用户行为特征计算管道】设计,采用MapReduce优化Join操作,任务执行时间从45分钟压缩至18分钟。
2.开发【Hive数据仓库分层模型】,构建ODS-DWD-DWS三层数据体系,复杂查询性能提升50%。
3.解决【地域维度数据倾斜】问题,设计动态分区方案,Reduce阶段负载均衡度提升80%。
4.搭建【YARN资源调度监控体系】,通过队列优先级配置,资源争抢问题减少70%。
项目业绩:
1.推荐特征数据产出时效从6小时提升至15分钟,点击率预估准确率提高22%。
2.计算集群资源消耗降低40%,日均处理数据量从800GB增长至2TB。
3.数据仓库模型支撑5个业务线并发查询,查询平均响应时间<3秒。
4.推动推荐系统GMV提升18%,获事业部年度技术突破项目银奖。
教育背景
GPA XX/4.0(专业前XX%),主修数据库原理与数据挖掘,参与基于Hadoop和Spark的大数据平台开发,掌握Hive数据仓库构建和Pig脚本优化,完成校级项目并获得数据处理竞赛奖项。
自我评价
培训经历
深入实践HDFS高可用与YARN资源调度机制,构建多租户大数据平台,通过数据压缩与分区优化将存储成本降低XX%,并保障集群日均稳定运行XX小时。
应届生Hadoop规范简历模板
319人使用适用人群: #Hadoop #应届生[<1年]
猜你想用
[基本信息]
姓名:陈小湾
性别:男
年龄:26
学历:本科
婚姻:未婚
年限:4年
面貌:党员
邮箱:xiaowan@gangwan.com
电话:18600001654
[求职意向]
工作性质:全职
应聘职位:Hadoop
期望城市:北京
期望薪资:8000-10000
求职状态:离职-随时到岗
[工作经历]
XX科技有限公司 | Hadoop
2023-01 - 2025-02
XX智能定位[制造业数字化转型]解决方案商,[工业大数据中心](20-40人)含[ETL开发组/数据建模组/BI分析组],自主研发[智能仓储优化算法/设备预测性维护模型],服务[宁德时代/格力电器/北汽新能源]等[8-12家]上市企业,部署[50+/100+]Kerberos认证集群,构建[2000+/5000+]节点HBase数据库,数据任务执行效率提升[40-60%],获评[省级工业互联网示范平台]。
工作内容:
1.数据基础处理:协助完成每日TB级数据的ETL流程,使用Hive编写SQL脚本进行数据清洗,配合团队完成HDFS分布式存储管理。
2.模型基础实施:根据数据工程师提供的ER图,在HBase中搭建基础数据表结构并创建二级索引。
3.可视化支持:使用PowerBI制作基础业务报表模板,定期更新销售数据仪表盘。
4.安全运维辅助:参与Kerberos认证环境的日常维护,监控集群访问日志。
工作业绩:
1.优化Hive查询语句,将每日定时任务执行时间缩短40%。
2.通过合理设置HBase预分区策略,减少热点数据问题发生率70%。
3.开发自动化报表生成脚本,节省业务部门每周5人时的重复工作量。
4.协助完成季度安全审计,100%通过权限配置合规性检查。
[项目经历]
项目名称:实时商品推荐数据计算引擎
担任角色:项目负责人
针对【2000万+日活用户】的实时推荐需求,原批处理架构导致【推荐结果更新延迟达6小时】,关键【用户点击行为特征计算】环节存在数据倾斜问题。基于Hadoop生态重构为Lambda架构,整合【HBase+Kafka】实现实时+离线混合计算,解决【特征数据时效性不足】【计算资源浪费35%】等痛点。
项目业绩:
1.推荐特征数据产出时效从6小时提升至15分钟,点击率预估准确率提高22%。
2.计算集群资源消耗降低40%,日均处理数据量从800GB增长至2TB。
3.数据仓库模型支撑5个业务线并发查询,查询平均响应时间<3秒。
4.推动推荐系统GMV提升18%,获事业部年度技术突破项目银奖。
[教育背景]
北京大学
软件工程 | 本科
GPA XX/4.0(专业前XX%),主修数据库原理与数据挖掘,参与基于Hadoop和Spark的大数据平台开发,掌握Hive数据仓库构建和Pig脚本优化,完成校级项目并获得数据处理竞赛奖项。
