返回 职位详情 登录/注册
大模型开发
1.1-2.2万元/月
定位 北京海淀区地锦路9号院1
更新 2025-12-11 14:21:19 浏览 813
职位详情
大模型算法 3-5年 深度学习 · 大模型研发
面向人工智能、科学计算与大数据处理深度融合的智能体系架构,开展大规模预训练模型相关研究工作。
涵盖数据预处理、算法研发、训练与推理优化、模型轻量化等关键技术方向。

岗位职责:
1.与团队协作完成核心模块的设计与实现,推进系统功能落地,并持续进行性能调优;
攻关大模型研发中的关键算法难题,如模型评估、幻觉抑制等技术挑战。
2.积极探索前沿技术路径,推动方法创新,提升研发效率与团队协同开发水平。

任职要求:
1.硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关领域亦可考虑;
2.具备良好的编码规范与技术文档编写能力,有团队协作开发及代码评审经验,对代码质量有高标准要求;
熟悉主流开发流程与规范,熟练使用git等工具,具备代码库构建与维护实践经验;
3.掌握深度学习基础理论,至少精通一种主流框架,如PyTorch、TensorFlow、Paddle、MindSpore等,具有模型开发、部署及微调实际项目经历;
4.深入理解Transformer结构与深度学习原理,能基于学术论文复现算法,具备大规模预训练模型训练与研发经验者优先;
在ACL、EMNLP、COLING、NAACL等高水平会议发表过相关研究成果者优先。
公司信息
北京远浪信息技术有限公司
明细
北京市密云区康宝路9号院1号楼等6幢(1号楼1层2号)
万州人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!