
正在查看高级大模型算法现代简历模板文字版
陈小湾
求职意向
工作经历
XXX智能是专注大模型行业应用的AI科技公司,团队规模约XXX人,核心业务是为金融、内容创作领域提供私有化大模型解决方案,自研技术包括多模态理解、模型压缩与加速框架,产品已服务超过XXX家行业客户,与多家头部金融机构建立深度合作。
工作概述:
1.模型预训练:依据业务场景需求制定千亿参数模型的预训练数据配方,设计并清洗涵盖金融研报、代码、多轮对话的混合数据集;搭建分布式训练框架,优化数据加载与梯度同步流程,通过混合精度训练与梯度检查点技术,将单次训练任务的平均耗时降低XXX%,保障模型按计划更新迭代。
2.SFT微调:针对客户垂域知识问答任务,构建高质量指令微调数据集;设计两阶段微调策略,先在通用任务上稳定模型基础能力,再注入行业专属知识;通过损失监控与早停机制,在有限算力下将下游任务平均准确率提升至XXX%。
3.RLHF对齐:为解决模型输出安全与价值观对齐问题,组建标注团队采集偏好数据,设计多维度标注标准;基于PPO算法实现奖励模型训练与策略模型优化,通过KL散度惩罚控制模型偏离,将有害内容生成率降低至XXX%以下,并通过A/B测试验证用户体验评分提升XXX%。
4.算法架构设计:主导新一代推理框架的设计与开发,针对长文本输入场景引入PagedAttention等内存管理技术,重构模型服务层的KV缓存机制;将最大可处理上下文长度扩展至XXXK,单位token推理显存占用减少XXX%,支撑了核心产品的长文档分析功能上线。
5.模型压缩与部署:为满足客户端侧部署的严苛资源限制,探索并应用模型量化、知识蒸馏、结构化剪枝等技术方案;主导完成百亿参数模型从FP16到INT8的量化迁移,在精度损失小于XXX%的前提下,将模型体积压缩XXX倍,推理速度提升XXX%,成功推动多个标杆项目的落地交付。
6.数据治理:建立从数据采集、清洗、标注到评估的全流程数据质量管理体系,针对合成数据引入多样性筛选与真实性校验规则;开发自动化数据流水线工具,将数据处理环节的人力投入减少XXX%,同时将用于微调的高质量数据占比从XXX%提升至XXX%。
7.团队协作与技术研究:负责带领XXX人的算法小组,制定技术路线并分配研发任务;定期组织代码评审与技术分享,沉淀出模型训练调参、问题排查等多篇内部Wiki;跟踪学术界最新进展,将RetNet等新架构引入技术选型评估,完成原型验证并输出对比实验报告,为团队技术迭代提供决策依据。
工作业绩:
1.成功主导完成公司首个千亿参数通用大模型从零到一的训练,模型在权威中文评测集上综合得分进入前XXX%,成为公司核心产品基石。
2.通过SFT与RLHF技术栈的深度优化,驱动金融风控问答、合规文本生成等核心场景的模型效果显著提升,客户满意度调查得分从XXX分提升至XXX分,直接促成与XXX家头部金融机构的续约。
3.设计的推理优化架构与模型压缩方案,将服务成本降低XXX%,使得公司产品在同等效果下具备价格竞争优势,助力销售团队新签年框合同金额超XXX万元。
4.构建的高效数据治理流程,支撑了超过XXXTB训练数据的生产,保障了后续多个垂直领域模型项目的快速启动与数据供给。
5.培养与带领算法团队,输出标准化开发规范与知识库,团队任务交付准时率提升XXX%,并获得公司年度优秀技术团队称号。
主动离职,希望有更多的工作挑战和涨薪机会。
项目经历
公司为某头部券商定制的私有化大模型项目,原有纯文本风控模型无法处理客户上传的包含图表、截图的多元化金融材料,漏报率高达XXX%;同时,模型在生成投顾建议、研报摘要时存在事实性错误与合规表述模糊的风险,已引发数次客户投诉。项目需在XXX个月内交付一个能安全、准确处理图文混合输入并生成可靠文本的端到端系统。
项目职责:
1.功能开发:负责多模态理解模块与内容安全过滤器的核心算法开发,采用视觉编码器与语言模型交叉注意力融合的方案,实现图文联合理解;基于规则引擎与微调的小型判别模型构建多层内容安全过滤网。
2.性能优化:通过模型剪枝与动态批处理技术优化多模态融合模块的计算图,将单张图片的特征提取与对齐耗时从XXX毫秒降低至XXX毫秒,保障交互端响应流畅。
3.技术攻坚:解决大模型在金融数据上的事实幻觉问题,设计检索增强生成流程,搭建专属知识库与实时检索系统,确保生成内容的关键数字与条款有据可依。
4.工程化落地:协调前后端团队,将算法模型封装为高可用、可扩展的微服务;设计并实施模型的灰度发布与效果回滚机制,确保线上服务稳定。
5.质量保障:构建涵盖事实准确性、合规性、安全性三个维度的自动化评估体系,开发评估脚本与看板,实现模型迭代效果的量化监控与快速验证。
项目业绩:
1.交付的多模态模型在客户内部测试集上,对图文混合材料的关键信息抽取准确率达到XXX%,相比旧系统提升XXX个百分点,漏报率下降至XXX%以下。
2.通过RAG与安全过滤器的应用,将模型生成内容的事实性错误率降低XXX%,完全杜绝了高危违规内容的生成,客户投诉次数归零。
3.优化后的服务端推理pipeline,QPS从XXX提升至XXX,支持客户日均XXX次查询请求,平均响应时间低于XXX秒。
4.项目成功上线并稳定运行超过XXX个月,成为客户数字员工系统的核心组件,助力客户获得行业数字化转型创新奖,并直接推动公司获得该客户后续XXX万元的二期合作订单。
教育背景
GPA X.XX/X.X(专业前XX%),主修自然语言处理与机器学习核心课程,参与知识图谱与智能问答课程设计(使用Python+PyTorch),在团队中负责关系抽取模块算法实现与调优,完成对XXX篇学术摘要的信息结构化,熟练掌握PyTorch、Hugging Face等深度学习框架与工具链。
自我评价
培训经历
系统学习了云上大规模机器学习解决方案的架构设计与管理。将认证知识应用于公司模型训练平台的建设,基于AWS SageMaker重构了训练任务调度与资源管理模块,通过弹性训练集群与Spot实例策略,将大型预训练任务的综合计算成本降低了XXX%,同时提高了集群资源利用率。
高级大模型算法现代简历模板
763人使用适用人群: #大模型算法 #高级[5-10年]
[基本信息]
姓名:陈小湾
性别:男
年龄:26
学历:本科
婚姻:未婚
年限:4年
面貌:党员
邮箱:xiaowan@gangwan.com
电话:18600001654
[求职意向]
工作性质:全职
应聘职位:大模型算法
期望城市:北京
期望薪资:8000-10000
求职状态:离职-随时到岗
[工作经历]
北京XX科技有限公司 | 大模型算法
2024-09 - 2025-12
XXX智能是专注大模型行业应用的AI科技公司,团队规模约XXX人,核心业务是为金融、内容创作领域提供私有化大模型解决方案,自研技术包括多模态理解、模型压缩与加速框架,产品已服务超过XXX家行业客户,与多家头部金融机构建立深度合作。
工作概述:
1.模型预训练:依据业务场景需求制定千亿参数模型的预训练数据配方,设计并清洗涵盖金融研报、代码、多轮对话的混合数据集;搭建分布式训练框架,优化数据加载与梯度同步流程,通过混合精度训练与梯度检查点技术,将单次训练任务的平均耗时降低XXX%,保障模型按计划更新迭代。
2.SFT微调:针对客户垂域知识问答任务,构建高质量指令微调数据集;设计两阶段微调策略,先在通用任务上稳定模型基础能力,再注入行业专属知识;通过损失监控与早停机制,在有限算力下将下游任务平均准确率提升至XXX%。
3.RLHF对齐:为解决模型输出安全与价值观对齐问题,组建标注团队采集偏好数据,设计多维度标注标准;基于PPO算法实现奖励模型训练与策略模型优化,通过KL散度惩罚控制模型偏离,将有害内容生成率降低至XXX%以下,并通过A/B测试验证用户体验评分提升XXX%。
4.算法架构设计:主导新一代推理框架的设计与开发,针对长文本输入场景引入PagedAttention等内存管理技术,重构模型服务层的KV缓存机制;将最大可处理上下文长度扩展至XXXK,单位token推理显存占用减少XXX%,支撑了核心产品的长文档分析功能上线。
5.模型压缩与部署:为满足客户端侧部署的严苛资源限制,探索并应用模型量化、知识蒸馏、结构化剪枝等技术方案;主导完成百亿参数模型从FP16到INT8的量化迁移,在精度损失小于XXX%的前提下,将模型体积压缩XXX倍,推理速度提升XXX%,成功推动多个标杆项目的落地交付。
6.数据治理:建立从数据采集、清洗、标注到评估的全流程数据质量管理体系,针对合成数据引入多样性筛选与真实性校验规则;开发自动化数据流水线工具,将数据处理环节的人力投入减少XXX%,同时将用于微调的高质量数据占比从XXX%提升至XXX%。
7.团队协作与技术研究:负责带领XXX人的算法小组,制定技术路线并分配研发任务;定期组织代码评审与技术分享,沉淀出模型训练调参、问题排查等多篇内部Wiki;跟踪学术界最新进展,将RetNet等新架构引入技术选型评估,完成原型验证并输出对比实验报告,为团队技术迭代提供决策依据。
工作业绩:
1.成功主导完成公司首个千亿参数通用大模型从零到一的训练,模型在权威中文评测集上综合得分进入前XXX%,成为公司核心产品基石。
2.通过SFT与RLHF技术栈的深度优化,驱动金融风控问答、合规文本生成等核心场景的模型效果显著提升,客户满意度调查得分从XXX分提升至XXX分,直接促成与XXX家头部金融机构的续约。
3.设计的推理优化架构与模型压缩方案,将服务成本降低XXX%,使得公司产品在同等效果下具备价格竞争优势,助力销售团队新签年框合同金额超XXX万元。
4.构建的高效数据治理流程,支撑了超过XXXTB训练数据的生产,保障了后续多个垂直领域模型项目的快速启动与数据供给。
5.培养与带领算法团队,输出标准化开发规范与知识库,团队任务交付准时率提升XXX%,并获得公司年度优秀技术团队称号。
[项目经历]
项目名称:金融领域多模态大模型内容安全与应用项目
担任角色:项目负责人
公司为某头部券商定制的私有化大模型项目,原有纯文本风控模型无法处理客户上传的包含图表、截图的多元化金融材料,漏报率高达XXX%;同时,模型在生成投顾建议、研报摘要时存在事实性错误与合规表述模糊的风险,已引发数次客户投诉。项目需在XXX个月内交付一个能安全、准确处理图文混合输入并生成可靠文本的端到端系统。
项目业绩:
1.交付的多模态模型在客户内部测试集上,对图文混合材料的关键信息抽取准确率达到XXX%,相比旧系统提升XXX个百分点,漏报率下降至XXX%以下。
2.通过RAG与安全过滤器的应用,将模型生成内容的事实性错误率降低XXX%,完全杜绝了高危违规内容的生成,客户投诉次数归零。
3.优化后的服务端推理pipeline,QPS从XXX提升至XXX,支持客户日均XXX次查询请求,平均响应时间低于XXX秒。
4.项目成功上线并稳定运行超过XXX个月,成为客户数字员工系统的核心组件,助力客户获得行业数字化转型创新奖,并直接推动公司获得该客户后续XXX万元的二期合作订单。
[教育背景]
南京理工大学
计算机科学与技术 | 本科
GPA X.XX/X.X(专业前XX%),主修自然语言处理与机器学习核心课程,参与知识图谱与智能问答课程设计(使用Python+PyTorch),在团队中负责关系抽取模块算法实现与调优,完成对XXX篇学术摘要的信息结构化,熟练掌握PyTorch、Hugging Face等深度学习框架与工具链。
