返回 职位详情 登录/注册
语音算法工程实习生(音频生成与理解方向)
400-500元/天
定位 北京海淀区度小满金融总部西北旺东路10号院西
更新 2025-12-10 20:28:00 浏览 393
职位详情
语音算法 经验不限
岗位职责:
1.参与语音大模型的技术研发工作,涵盖语音识别、语音合成、端到端语音对话系统、音频理解等相关方向;
2.推动核心技术在实际业务场景中的应用落地,解决关键技术难题,并持续提升算法性能;
3.跟踪语音与音频领域的前沿算法进展,探索创新方法,优化模型在准确性、生成质量及推理效率等方面的表现;
4.构建并完善音频理解与生成的核心技术架构,促进技术在多样化应用场景中的推广与落地。

职位要求
1.熟悉语音理解与生成相关算法,具备语音系统实际落地及业务效果调优的项目经验;
2.拥有大规模数据处理能力,能够利用海量数据驱动模型优化与迭代;
3.精通深度学习技术,熟练使用PyTorch框架,具备端到端语音识别模型(如Transformer、RNN-T、CTC等)的调优经验;或熟悉传统TTS系统各模块(如G2P、TN、多音字处理、韵律预测、声学模型、声码器等),并有实际应用经验。

加分项(满足任意一项即可):
1.在客服系统或其他大规模实际场景中成功部署过语音系统;
2.具备前沿端到端语音系统的优化实践经验;
3.在国际权威会议或主流期刊(如NeurIPS、ICML、ICLR、ACL、Interspeech、ICASSP等)发表过相关论文;
4.曾在语音或机器学习领域的国际竞赛中取得奖项;
5.参与过具有广泛影响的开源项目。
公司信息
度小满科技(北京)有限公司
明细
北京市海淀区西北旺东路10号院西区4号楼6层606室
万州人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!