100分简历
中级ETL工程师科技感简历模板 - 包含工作经历、项目经验的ETL工程师简历模板预览图

正在查看中级ETL工程师科技感简历模板文字版

陈小湾

性别: 男 年龄: 26 学历: 本科 婚姻状态: 未婚 工作年限: 4年 政治面貌: 党员 邮箱: xiaowan@gangwan.com 电话号码: 18600001654

求职意向

工作性质: 全职 应聘职位: ETL工程师 期望工作地址: 北京 期望薪资: 8000-10000 求职状态: 离职-随时到岗

工作经历

2024-09 - 2025-12
北京XX科技有限公司
北京

XXX医疗是一家专注于互联网慢病管理的科技公司,团队规模约XXX人,核心业务是为医院和连锁药房提供数字化患者管理及药品供应链解决方案,产品服务于超过XXX家医疗机构,与多家区域三甲医院建立数据合作。

ETL工程师 汇报对象:部门总监

工作概述:

1.数据需求分析:对接业务部门和数据分析师,梳理药品库存分析、患者随访等场景的数据需求;与产品经理共同确认数据指标口径和更新频率,将抽象需求转化为包含数据源、清洗规则、输出表的ETL设计文档,建立需求池并排定优先级,使需求沟通确认周期平均缩短XXX%。

2.数据模型设计:依据业务域划分设计数据仓库分层模型,包括ODS、DWD、DWS和ADS层;针对患者就诊行为主题设计宽表,整合预约、问诊、用药多源头数据,明确各层表的粒度和关联关系,产出数据字典和血缘文档,支撑下游XXX个数据应用的稳定取数。

3.ETL流程开发:使用Kettle和Python开发日常数据抽取、清洗、转换和加载任务;编写SQL处理来自MySQL业务库和第三方API接口的增量数据,解决因药品编码不统一导致的数据匹配问题,每日定时处理数据量约XXX GB,保障核心报表在上午9点前产出。

4.任务调度监控:在Airflow上配置DAG任务流,设置任务依赖关系和失败重试机制;配置任务运行监控和预警,通过邮件和钉钉机器人通知任务失败或延迟情况;定期检查任务日志,优化长耗时SQL,将关键数据任务的SLA达标率提升至XXX%。

5.数据质量监控:建立患者信息、药品库存等核心数据表的稽核规则,包括非空检查、唯一性检查和值域范围检查;开发数据质量日报,跟踪数据波动和异常值,与业务方协同定位并修复数据源问题,将数据问题引发的业务咨询量减少XXX%。

6.数据仓库优化:分析慢查询任务,通过增加索引、优化SQL写法、对大表进行历史数据归档等方式提升处理效率;参与数据仓库从CDH到云原生平台的迁移评估,配合调整部分任务脚本,迁移后整体计算资源成本下降约XXX%。


工作业绩:

1.独立完成XXX个数据主题模型的设计与开发,支撑市场、运营、供应链等XXX个业务部门的数据分析需求。

2.维护和优化XXX个日常ETL任务,核心任务准时完成率从XXX%提升至XXX%,数据产出时间平均提前X小时。

3.主导数据质量监控体系搭建,累计配置XXX条稽核规则,关键数据质量评分达到XXX分。

4.通过SQL优化与任务调优,将月度任务失败次数降低XXX%,计算资源使用效率提升XXX%。

5.输出《ETL开发规范》、《数据仓库模型说明》等XXX份团队文档,提升新成员上手效率。

主动离职,希望有更多的工作挑战和涨薪机会。

项目经历

2024-09 - 2025-12
企业级数据仓库与患者360视图项目
项目负责人

公司为提升精细化运营能力启动的核心数据基建项目,原有分散的报表体系存在数据口径不一、患者信息割裂的问题,无法支撑精准用药推荐和服务效果评估。来自HIS、CRM、线上问诊等XXX个系统的数据需要通过实时与离线两种方式整合,面临数据延迟高、患者主数据合并匹配准确率仅XXX%等技术挑战,目标是构建统一的数据仓库并产出完整的患者全景视图。

项目职责:

1.数据集成开发:负责核心的患者就诊记录与药品订单数据的离线集成流程开发,使用Kettle调度增量数据同步,编写复杂SQL处理病历文本中的关键信息提取与标准化,保障每日XXX万条记录的处理稳定性。

2.实时数据通道建设:参与基于Flink的实时数据管道搭建,负责将患者登录、点击行为等流式数据实时写入Kafka并同步至DWD层,配合下游实时大屏展示,将关键行为数据的延时从分钟级降至秒级。

3.患者主数据治理:主导患者唯一身份识别(ONE ID)的匹配逻辑设计与实现,通过融合规则(手机号、身份证、就诊卡号)解决同一患者多系统信息重复问题,开发数据修正任务处理模糊匹配情况。

4.数据服务封装:将患者360视图、药品消耗趋势等核心数据模型封装成Restful API和数据接口,供前端患者管理平台调用,优化查询性能,确保接口平均响应时间在XXX毫秒以内。

项目业绩:

1.成功构建包含XXX张主题表的企业级数据仓库,统一了公司内部XXX个关键业务指标的口径,消除数据歧义。

2.患者主数据合并准确率从XXX%提升至XXX%,形成的患者360视图覆盖就诊、用药、反馈等XXX个维度。

3.数据服务接口支撑了上游XXX个应用场景,包括精准营销和服务效果评估,助力患者复购率提升XXX%。

4.项目交付后,业务部门制作分析报表的数据获取时间平均缩短XXX%,获评公司年度优秀数据项目。

教育背景

2020-09 - 2024-07
江苏大学
计算机科学与技术 本科

GPA X.XX/4.0(专业前XX%),主修数据库原理、数据结构与算法、数据挖掘等核心课程,参与校园消费行为分析课程项目,负责使用Python进行数据清洗和特征工程,构建分类模型预测消费类别,熟悉Linux环境操作及MySQL调优,掌握ETL基础工具Kettle的使用。

自我评价

专业能力:拥有X年数据仓库领域开发经验,专注于医疗行业ETL流程构建与数据治理,熟练掌握从需求分析、模型设计到开发部署、运维监控的全流程,独立负责过日均处理XXX GB级数据量的任务调度与优化。核心项目:主导完成企业级数据仓库从0到1的搭建,设计并落地患者ONE ID方案,解决多系统数据融合难题,主数据匹配准确率提升至XXX%,有力支撑了公司核心的精准运营业务。技术实践:具备扎实的SQL和Python开发能力,精通Kettle、Airflow等数据集成与调度工具,有Flink实时数据处理经验,通过索引优化、查询重构等手段将关键任务执行效率提升XXX%。个人特质:逻辑清晰,责任心强,注重数据质量与流程规范,能高效协同业务、产品与分析师团队,推动数据驱动决策的文化落地,适应快速迭代的业务环境。

培训经历

2024-09 - 2025-12
岗湾培训中心
数据仓库专家认证 北京

2022年获得该认证,系统学习了数据仓库架构方法论与性能调优技术。将分层建模思想应用于公司数据仓库重构,主导设计DWD明细层模型,降低了XXX%的重复开发。应用SQL优化技巧解决了患者行为宽表的关联查询性能瓶颈,将关键报表查询耗时从XX秒缩短至X秒以内。输出的数据模型设计规范已成为团队开发标准。

查看中级ETL工程师科技感简历模板文字版
《中级ETL工程师科技感简历模板》简历文字详情

姓名:陈小湾

性别:

年龄:26

学历:本科

婚姻:未婚

年限:4年

面貌:党员

邮箱:xiaowan@gangwan.com

电话:18600001654

工作性质:全职

应聘职位:ETL工程师

期望城市:北京

期望薪资:8000-10000

求职状态:离职-随时到岗

北京XX科技有限公司 | ETL工程师

2024-09 - 2025-12

公司背景:

XXX医疗是一家专注于互联网慢病管理的科技公司,团队规模约XXX人,核心业务是为医院和连锁药房提供数字化患者管理及药品供应链解决方案,产品服务于超过XXX家医疗机构,与多家区域三甲医院建立数据合作。

工作内容:

工作概述:

1.数据需求分析:对接业务部门和数据分析师,梳理药品库存分析、患者随访等场景的数据需求;与产品经理共同确认数据指标口径和更新频率,将抽象需求转化为包含数据源、清洗规则、输出表的ETL设计文档,建立需求池并排定优先级,使需求沟通确认周期平均缩短XXX%。

2.数据模型设计:依据业务域划分设计数据仓库分层模型,包括ODS、DWD、DWS和ADS层;针对患者就诊行为主题设计宽表,整合预约、问诊、用药多源头数据,明确各层表的粒度和关联关系,产出数据字典和血缘文档,支撑下游XXX个数据应用的稳定取数。

3.ETL流程开发:使用Kettle和Python开发日常数据抽取、清洗、转换和加载任务;编写SQL处理来自MySQL业务库和第三方API接口的增量数据,解决因药品编码不统一导致的数据匹配问题,每日定时处理数据量约XXX GB,保障核心报表在上午9点前产出。

4.任务调度监控:在Airflow上配置DAG任务流,设置任务依赖关系和失败重试机制;配置任务运行监控和预警,通过邮件和钉钉机器人通知任务失败或延迟情况;定期检查任务日志,优化长耗时SQL,将关键数据任务的SLA达标率提升至XXX%。

5.数据质量监控:建立患者信息、药品库存等核心数据表的稽核规则,包括非空检查、唯一性检查和值域范围检查;开发数据质量日报,跟踪数据波动和异常值,与业务方协同定位并修复数据源问题,将数据问题引发的业务咨询量减少XXX%。

6.数据仓库优化:分析慢查询任务,通过增加索引、优化SQL写法、对大表进行历史数据归档等方式提升处理效率;参与数据仓库从CDH到云原生平台的迁移评估,配合调整部分任务脚本,迁移后整体计算资源成本下降约XXX%。


工作业绩:

1.独立完成XXX个数据主题模型的设计与开发,支撑市场、运营、供应链等XXX个业务部门的数据分析需求。

2.维护和优化XXX个日常ETL任务,核心任务准时完成率从XXX%提升至XXX%,数据产出时间平均提前X小时。

3.主导数据质量监控体系搭建,累计配置XXX条稽核规则,关键数据质量评分达到XXX分。

4.通过SQL优化与任务调优,将月度任务失败次数降低XXX%,计算资源使用效率提升XXX%。

5.输出《ETL开发规范》、《数据仓库模型说明》等XXX份团队文档,提升新成员上手效率。

项目名称:企业级数据仓库与患者360视图项目

担任角色:项目负责人

项目背景:
项目内容:

公司为提升精细化运营能力启动的核心数据基建项目,原有分散的报表体系存在数据口径不一、患者信息割裂的问题,无法支撑精准用药推荐和服务效果评估。来自HIS、CRM、线上问诊等XXX个系统的数据需要通过实时与离线两种方式整合,面临数据延迟高、患者主数据合并匹配准确率仅XXX%等技术挑战,目标是构建统一的数据仓库并产出完整的患者全景视图。

项目业绩:

项目业绩:

1.成功构建包含XXX张主题表的企业级数据仓库,统一了公司内部XXX个关键业务指标的口径,消除数据歧义。

2.患者主数据合并准确率从XXX%提升至XXX%,形成的患者360视图覆盖就诊、用药、反馈等XXX个维度。

3.数据服务接口支撑了上游XXX个应用场景,包括精准营销和服务效果评估,助力患者复购率提升XXX%。

4.项目交付后,业务部门制作分析报表的数据获取时间平均缩短XXX%,获评公司年度优秀数据项目。

江苏大学

计算机科学与技术 | 本科

主修课程:

GPA X.XX/4.0(专业前XX%),主修数据库原理、数据结构与算法、数据挖掘等核心课程,参与校园消费行为分析课程项目,负责使用Python进行数据清洗和特征工程,构建分类模型预测消费类别,熟悉Linux环境操作及MySQL调优,掌握ETL基础工具Kettle的使用。

专业能力:拥有X年数据仓库领域开发经验,专注于医疗行业ETL流程构建与数据治理,熟练掌握从需求分析、模型设计到开发部署、运维监控的全流程,独立负责过日均处理XXX GB级数据量的任务调度与优化。核心项目:主导完成企业级数据仓库从0到1的搭建,设计并落地患者ONE ID方案,解决多系统数据融合难题,主数据匹配准确率提升至XXX%,有力支撑了公司核心的精准运营业务。技术实践:具备扎实的SQL和Python开发能力,精通Kettle、Airflow等数据集成与调度工具,有Flink实时数据处理经验,通过索引优化、查询重构等手段将关键任务执行效率提升XXX%。个人特质:逻辑清晰,责任心强,注重数据质量与流程规范,能高效协同业务、产品与分析师团队,推动数据驱动决策的文化落地,适应快速迭代的业务环境。