
正在查看在校生语音/视频/图形开发干练简历模板文字版
陈小湾
求职意向
工作经历
XX智能为[智能客服/车载系统/医疗问诊]提供语音解决方案,[20-40人]算法团队基于Kaldi框架研发[8-12种]方言识别模型。采用MFSC特征提取使噪声环境识别准确率达[90-95%],自动化标注系统降低[30-40%]数据错误率,日均处理[50万+]小时语音数据。服务[科大讯飞/小鹏汽车]等[10-15家]客户,获[ISO27001/国家语音标准认证],模型推理速度提升[40-45%]。
工作内容:
1.基于Kaldi框架开发语音识别基础模块,实现端到端语音转文本功能,支持中文普通话与6种方言识别。
2.优化声学特征提取流程,采用Mel-Frequency Spectral Coefficients(MFSC)替代传统MFCC,提升噪声环境鲁棒性。
3.维护语音数据标注工具链,开发自动化校验脚本使标注错误率下降35%。
工作业绩:
1.方言识别准确率从78%提升至91%,达商业化落地标准。
2.特征提取模块计算耗时降低42%,获202X年度团队效率贡献奖。
离职原因:企业跨省搬家,目前看新的工作机会。
项目经历
面向【跨国企业2000+并发会议室】需求,原视频系统在【1080P分辨率下CPU占用率达75%】,存在【动态码率适配延迟超3秒】【弱网环境卡顿率超30%】等问题。基于WebRTC架构重构视频处理管线,攻克【实时超分渲染】【端到端延迟优化】等技术难点。
项目职责:
1.设计【视频帧智能调度算法】,通过关键帧动态加权策略,弱网环境卡顿率从30%降至12%。
2.开发【实时超分辨率模块】,集成SRCNN模型实现720P到4K实时转换,GPU显存占用优化40%。
3.构建【多层级缓冲队列】,解决音视频同步偏移问题,唇音同步误差从230ms压缩至80ms。
4.实现【H.265编码器插件化改造】,支持动态码率切换,带宽占用降低35%。
项目业绩:
1.4K视频传输CPU占用率从75%优化至42%,端到端延迟稳定在200ms内。
2.支撑单服务器并发路数从500提升至1200,硬件成本降低60%。
3.推动产品中标【3个省级政务云项目】,合同金额超1500万元。
4.视频质量MOS分从3.8提升至4.2,获国际视频质量专家组
教育背景
GPA XX/4.0(专业前XX%),主修数字信号处理、音视频编解码原理与流媒体技术,主导基于WebRTC的实时音视频通信系统开发,掌握H.264/AVC与Opus编解码算法优化,完成支持XX路并发的高质量实时传输系统设计与实现。
自我评价
培训经历
掌握WebRTC协议栈与抗丢包音频传输技术,实现高并发语音房间架构设计,将端到端音频延迟从XXms优化至XXms,支持万人同时在线语音交互。
在校生语音/视频/图形开发干练简历模板
465人使用适用人群: #语音/视频/图形开发 #在校生[找实习]
猜你想用
[基本信息]
姓名:陈小湾
性别:男
年龄:26
学历:本科
婚姻:未婚
年限:4年
面貌:党员
邮箱:xiaowan@gangwan.com
电话:18600001654
[求职意向]
工作性质:全职
应聘职位:语音/视频/图形开发
期望城市:北京
期望薪资:8000-10000
求职状态:离职-随时到岗
[工作经历]
XX科技有限公司 | 算法工程师
2023-01 - 2025-02
XX智能为[智能客服/车载系统/医疗问诊]提供语音解决方案,[20-40人]算法团队基于Kaldi框架研发[8-12种]方言识别模型。采用MFSC特征提取使噪声环境识别准确率达[90-95%],自动化标注系统降低[30-40%]数据错误率,日均处理[50万+]小时语音数据。服务[科大讯飞/小鹏汽车]等[10-15家]客户,获[ISO27001/国家语音标准认证],模型推理速度提升[40-45%]。
工作内容:
1.基于Kaldi框架开发语音识别基础模块,实现端到端语音转文本功能,支持中文普通话与6种方言识别。
2.优化声学特征提取流程,采用Mel-Frequency Spectral Coefficients(MFSC)替代传统MFCC,提升噪声环境鲁棒性。
3.维护语音数据标注工具链,开发自动化校验脚本使标注错误率下降35%。
工作业绩:
1.方言识别准确率从78%提升至91%,达商业化落地标准。
2.特征提取模块计算耗时降低42%,获202X年度团队效率贡献奖。
[项目经历]
项目名称:4K超清视频会议渲染引擎
担任角色:项目负责人
面向【跨国企业2000+并发会议室】需求,原视频系统在【1080P分辨率下CPU占用率达75%】,存在【动态码率适配延迟超3秒】【弱网环境卡顿率超30%】等问题。基于WebRTC架构重构视频处理管线,攻克【实时超分渲染】【端到端延迟优化】等技术难点。
项目业绩:
1.4K视频传输CPU占用率从75%优化至42%,端到端延迟稳定在200ms内。
2.支撑单服务器并发路数从500提升至1200,硬件成本降低60%。
3.推动产品中标【3个省级政务云项目】,合同金额超1500万元。
4.视频质量MOS分从3.8提升至4.2,获国际视频质量专家组
[教育背景]
北京邮电大学
数字媒体技术 | 本科
GPA XX/4.0(专业前XX%),主修数字信号处理、音视频编解码原理与流媒体技术,主导基于WebRTC的实时音视频通信系统开发,掌握H.264/AVC与Opus编解码算法优化,完成支持XX路并发的高质量实时传输系统设计与实现。
