100分简历
高级大模型算法现代简历模板 - 包含工作经历、项目经验的大模型算法简历模板预览图

正在查看高级大模型算法现代简历模板文字版

陈小湾

性别: 男 年龄: 26 学历: 本科 婚姻状态: 未婚 工作年限: 4年 政治面貌: 党员 邮箱: xiaowan@gangwan.com 电话号码: 18600001654

求职意向

工作性质: 全职 应聘职位: 大模型算法 期望工作地址: 北京 期望薪资: 8000-10000 求职状态: 离职-随时到岗

工作经历

2024-09 - 2025-12
北京XX科技有限公司
北京

XXX智能是专注大模型行业应用的AI科技公司,团队规模约XXX人,核心业务是为金融、内容创作领域提供私有化大模型解决方案,自研技术包括多模态理解、模型压缩与加速框架,产品已服务超过XXX家行业客户,与多家头部金融机构建立深度合作。

大模型算法 汇报对象:部门总监

工作概述:

1.模型预训练:依据业务场景需求制定千亿参数模型的预训练数据配方,设计并清洗涵盖金融研报、代码、多轮对话的混合数据集;搭建分布式训练框架,优化数据加载与梯度同步流程,通过混合精度训练与梯度检查点技术,将单次训练任务的平均耗时降低XXX%,保障模型按计划更新迭代。

2.SFT微调:针对客户垂域知识问答任务,构建高质量指令微调数据集;设计两阶段微调策略,先在通用任务上稳定模型基础能力,再注入行业专属知识;通过损失监控与早停机制,在有限算力下将下游任务平均准确率提升至XXX%。

3.RLHF对齐:为解决模型输出安全与价值观对齐问题,组建标注团队采集偏好数据,设计多维度标注标准;基于PPO算法实现奖励模型训练与策略模型优化,通过KL散度惩罚控制模型偏离,将有害内容生成率降低至XXX%以下,并通过A/B测试验证用户体验评分提升XXX%。

4.算法架构设计:主导新一代推理框架的设计与开发,针对长文本输入场景引入PagedAttention等内存管理技术,重构模型服务层的KV缓存机制;将最大可处理上下文长度扩展至XXXK,单位token推理显存占用减少XXX%,支撑了核心产品的长文档分析功能上线。

5.模型压缩与部署:为满足客户端侧部署的严苛资源限制,探索并应用模型量化、知识蒸馏、结构化剪枝等技术方案;主导完成百亿参数模型从FP16到INT8的量化迁移,在精度损失小于XXX%的前提下,将模型体积压缩XXX倍,推理速度提升XXX%,成功推动多个标杆项目的落地交付。

6.数据治理:建立从数据采集、清洗、标注到评估的全流程数据质量管理体系,针对合成数据引入多样性筛选与真实性校验规则;开发自动化数据流水线工具,将数据处理环节的人力投入减少XXX%,同时将用于微调的高质量数据占比从XXX%提升至XXX%。

7.团队协作与技术研究:负责带领XXX人的算法小组,制定技术路线并分配研发任务;定期组织代码评审与技术分享,沉淀出模型训练调参、问题排查等多篇内部Wiki;跟踪学术界最新进展,将RetNet等新架构引入技术选型评估,完成原型验证并输出对比实验报告,为团队技术迭代提供决策依据。


工作业绩:

1.成功主导完成公司首个千亿参数通用大模型从零到一的训练,模型在权威中文评测集上综合得分进入前XXX%,成为公司核心产品基石。

2.通过SFT与RLHF技术栈的深度优化,驱动金融风控问答、合规文本生成等核心场景的模型效果显著提升,客户满意度调查得分从XXX分提升至XXX分,直接促成与XXX家头部金融机构的续约。

3.设计的推理优化架构与模型压缩方案,将服务成本降低XXX%,使得公司产品在同等效果下具备价格竞争优势,助力销售团队新签年框合同金额超XXX万元。

4.构建的高效数据治理流程,支撑了超过XXXTB训练数据的生产,保障了后续多个垂直领域模型项目的快速启动与数据供给。

5.培养与带领算法团队,输出标准化开发规范与知识库,团队任务交付准时率提升XXX%,并获得公司年度优秀技术团队称号。

主动离职,希望有更多的工作挑战和涨薪机会。

项目经历

2024-09 - 2025-12
金融领域多模态大模型内容安全与应用项目
项目负责人

公司为某头部券商定制的私有化大模型项目,原有纯文本风控模型无法处理客户上传的包含图表、截图的多元化金融材料,漏报率高达XXX%;同时,模型在生成投顾建议、研报摘要时存在事实性错误与合规表述模糊的风险,已引发数次客户投诉。项目需在XXX个月内交付一个能安全、准确处理图文混合输入并生成可靠文本的端到端系统。

项目职责:

1.功能开发:负责多模态理解模块与内容安全过滤器的核心算法开发,采用视觉编码器与语言模型交叉注意力融合的方案,实现图文联合理解;基于规则引擎与微调的小型判别模型构建多层内容安全过滤网。

2.性能优化:通过模型剪枝与动态批处理技术优化多模态融合模块的计算图,将单张图片的特征提取与对齐耗时从XXX毫秒降低至XXX毫秒,保障交互端响应流畅。

3.技术攻坚:解决大模型在金融数据上的事实幻觉问题,设计检索增强生成流程,搭建专属知识库与实时检索系统,确保生成内容的关键数字与条款有据可依。

4.工程化落地:协调前后端团队,将算法模型封装为高可用、可扩展的微服务;设计并实施模型的灰度发布与效果回滚机制,确保线上服务稳定。

5.质量保障:构建涵盖事实准确性、合规性、安全性三个维度的自动化评估体系,开发评估脚本与看板,实现模型迭代效果的量化监控与快速验证。

项目业绩:

1.交付的多模态模型在客户内部测试集上,对图文混合材料的关键信息抽取准确率达到XXX%,相比旧系统提升XXX个百分点,漏报率下降至XXX%以下。

2.通过RAG与安全过滤器的应用,将模型生成内容的事实性错误率降低XXX%,完全杜绝了高危违规内容的生成,客户投诉次数归零。

3.优化后的服务端推理pipeline,QPS从XXX提升至XXX,支持客户日均XXX次查询请求,平均响应时间低于XXX秒。

4.项目成功上线并稳定运行超过XXX个月,成为客户数字员工系统的核心组件,助力客户获得行业数字化转型创新奖,并直接推动公司获得该客户后续XXX万元的二期合作订单。

教育背景

2020-09 - 2024-07
南京理工大学
计算机科学与技术 本科

GPA X.XX/X.X(专业前XX%),主修自然语言处理与机器学习核心课程,参与知识图谱与智能问答课程设计(使用Python+PyTorch),在团队中负责关系抽取模块算法实现与调优,完成对XXX篇学术摘要的信息结构化,熟练掌握PyTorch、Hugging Face等深度学习框架与工具链。

自我评价

专业背景:X年人工智能算法研发经验,近X年深度聚焦于大语言模型与多模态大模型的技术研究、工程落地与团队管理,完整经历从模型预训练、指令微调、人类反馈对齐到产业应用的全链路。技术深度:精通Transformer架构及多种训练优化技术,能够独立设计并实施百亿至千亿参数规模模型的训练与调优方案,具备将前沿论文成果快速转化为工程实践的能力,曾主导模型在多类评测中效果提升XXX%。工程能力:具备强烈的工程落地意识,不仅关注算法效果,同样重视推理性能、资源成本与系统稳定性,主导的模型压缩与服务框架优化使线上服务成本下降XXX%,推理速度提升XXX%。业务影响:始终以解决实际业务问题为导向,主导的算法项目直接驱动了金融、内容安全等核心场景的产品能力升级,提升客户满意度XXX%,并转化为可观的商业收入。个人特质:逻辑清晰,具备良好的跨团队沟通与项目推动能力,擅长在资源约束下制定可行技术方案并拿到结果,能够带领团队在高强度、快节奏的研发环境中保持高效输出。

培训经历

2024-09 - 2025-12
岗湾培训中心
AWS机器学习认证 北京

系统学习了云上大规模机器学习解决方案的架构设计与管理。将认证知识应用于公司模型训练平台的建设,基于AWS SageMaker重构了训练任务调度与资源管理模块,通过弹性训练集群与Spot实例策略,将大型预训练任务的综合计算成本降低了XXX%,同时提高了集群资源利用率。

查看高级大模型算法现代简历模板文字版
《高级大模型算法现代简历模板》简历文字详情

姓名:陈小湾

性别:

年龄:26

学历:本科

婚姻:未婚

年限:4年

面貌:党员

邮箱:xiaowan@gangwan.com

电话:18600001654

工作性质:全职

应聘职位:大模型算法

期望城市:北京

期望薪资:8000-10000

求职状态:离职-随时到岗

北京XX科技有限公司 | 大模型算法

2024-09 - 2025-12

公司背景:

XXX智能是专注大模型行业应用的AI科技公司,团队规模约XXX人,核心业务是为金融、内容创作领域提供私有化大模型解决方案,自研技术包括多模态理解、模型压缩与加速框架,产品已服务超过XXX家行业客户,与多家头部金融机构建立深度合作。

工作内容:

工作概述:

1.模型预训练:依据业务场景需求制定千亿参数模型的预训练数据配方,设计并清洗涵盖金融研报、代码、多轮对话的混合数据集;搭建分布式训练框架,优化数据加载与梯度同步流程,通过混合精度训练与梯度检查点技术,将单次训练任务的平均耗时降低XXX%,保障模型按计划更新迭代。

2.SFT微调:针对客户垂域知识问答任务,构建高质量指令微调数据集;设计两阶段微调策略,先在通用任务上稳定模型基础能力,再注入行业专属知识;通过损失监控与早停机制,在有限算力下将下游任务平均准确率提升至XXX%。

3.RLHF对齐:为解决模型输出安全与价值观对齐问题,组建标注团队采集偏好数据,设计多维度标注标准;基于PPO算法实现奖励模型训练与策略模型优化,通过KL散度惩罚控制模型偏离,将有害内容生成率降低至XXX%以下,并通过A/B测试验证用户体验评分提升XXX%。

4.算法架构设计:主导新一代推理框架的设计与开发,针对长文本输入场景引入PagedAttention等内存管理技术,重构模型服务层的KV缓存机制;将最大可处理上下文长度扩展至XXXK,单位token推理显存占用减少XXX%,支撑了核心产品的长文档分析功能上线。

5.模型压缩与部署:为满足客户端侧部署的严苛资源限制,探索并应用模型量化、知识蒸馏、结构化剪枝等技术方案;主导完成百亿参数模型从FP16到INT8的量化迁移,在精度损失小于XXX%的前提下,将模型体积压缩XXX倍,推理速度提升XXX%,成功推动多个标杆项目的落地交付。

6.数据治理:建立从数据采集、清洗、标注到评估的全流程数据质量管理体系,针对合成数据引入多样性筛选与真实性校验规则;开发自动化数据流水线工具,将数据处理环节的人力投入减少XXX%,同时将用于微调的高质量数据占比从XXX%提升至XXX%。

7.团队协作与技术研究:负责带领XXX人的算法小组,制定技术路线并分配研发任务;定期组织代码评审与技术分享,沉淀出模型训练调参、问题排查等多篇内部Wiki;跟踪学术界最新进展,将RetNet等新架构引入技术选型评估,完成原型验证并输出对比实验报告,为团队技术迭代提供决策依据。


工作业绩:

1.成功主导完成公司首个千亿参数通用大模型从零到一的训练,模型在权威中文评测集上综合得分进入前XXX%,成为公司核心产品基石。

2.通过SFT与RLHF技术栈的深度优化,驱动金融风控问答、合规文本生成等核心场景的模型效果显著提升,客户满意度调查得分从XXX分提升至XXX分,直接促成与XXX家头部金融机构的续约。

3.设计的推理优化架构与模型压缩方案,将服务成本降低XXX%,使得公司产品在同等效果下具备价格竞争优势,助力销售团队新签年框合同金额超XXX万元。

4.构建的高效数据治理流程,支撑了超过XXXTB训练数据的生产,保障了后续多个垂直领域模型项目的快速启动与数据供给。

5.培养与带领算法团队,输出标准化开发规范与知识库,团队任务交付准时率提升XXX%,并获得公司年度优秀技术团队称号。

项目名称:金融领域多模态大模型内容安全与应用项目

担任角色:项目负责人

项目背景:
项目内容:

公司为某头部券商定制的私有化大模型项目,原有纯文本风控模型无法处理客户上传的包含图表、截图的多元化金融材料,漏报率高达XXX%;同时,模型在生成投顾建议、研报摘要时存在事实性错误与合规表述模糊的风险,已引发数次客户投诉。项目需在XXX个月内交付一个能安全、准确处理图文混合输入并生成可靠文本的端到端系统。

项目业绩:

项目业绩:

1.交付的多模态模型在客户内部测试集上,对图文混合材料的关键信息抽取准确率达到XXX%,相比旧系统提升XXX个百分点,漏报率下降至XXX%以下。

2.通过RAG与安全过滤器的应用,将模型生成内容的事实性错误率降低XXX%,完全杜绝了高危违规内容的生成,客户投诉次数归零。

3.优化后的服务端推理pipeline,QPS从XXX提升至XXX,支持客户日均XXX次查询请求,平均响应时间低于XXX秒。

4.项目成功上线并稳定运行超过XXX个月,成为客户数字员工系统的核心组件,助力客户获得行业数字化转型创新奖,并直接推动公司获得该客户后续XXX万元的二期合作订单。

南京理工大学

计算机科学与技术 | 本科

主修课程:

GPA X.XX/X.X(专业前XX%),主修自然语言处理与机器学习核心课程,参与知识图谱与智能问答课程设计(使用Python+PyTorch),在团队中负责关系抽取模块算法实现与调优,完成对XXX篇学术摘要的信息结构化,熟练掌握PyTorch、Hugging Face等深度学习框架与工具链。

专业背景:X年人工智能算法研发经验,近X年深度聚焦于大语言模型与多模态大模型的技术研究、工程落地与团队管理,完整经历从模型预训练、指令微调、人类反馈对齐到产业应用的全链路。技术深度:精通Transformer架构及多种训练优化技术,能够独立设计并实施百亿至千亿参数规模模型的训练与调优方案,具备将前沿论文成果快速转化为工程实践的能力,曾主导模型在多类评测中效果提升XXX%。工程能力:具备强烈的工程落地意识,不仅关注算法效果,同样重视推理性能、资源成本与系统稳定性,主导的模型压缩与服务框架优化使线上服务成本下降XXX%,推理速度提升XXX%。业务影响:始终以解决实际业务问题为导向,主导的算法项目直接驱动了金融、内容安全等核心场景的产品能力升级,提升客户满意度XXX%,并转化为可观的商业收入。个人特质:逻辑清晰,具备良好的跨团队沟通与项目推动能力,擅长在资源约束下制定可行技术方案并拿到结果,能够带领团队在高强度、快节奏的研发环境中保持高效输出。