大模型应用开发工程师（工作地：长春）招聘_中科聚信信息技术(北京)有限公司-万州人才网

大模型应用开发工程师（工作地：长春）

1.5-3万元/月

上海浦东新区环球金融中心1

更新 2025-12-13 12:08:50 浏览 551

职位详情

大模型算法经验不限

岗位职责
1.大模型应用功能的二次开发与参数优化：依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台进行定制化开发及深度参数调整，实现专属文档解析模块、向量索引机制、Agent工具集成、Prompt架构设计、重排序模型配置、权限控制逻辑等功能扩展。
2.大模型推理引擎的部署与性能优化：结合pytorch、vllm、sglang等开源工具，根据客户实际硬件环境调优推理参数，实现推理效率最大化。
3.私有化场景下的端到端部署与交付：基于K8S完成大模型应用的定制化封装，并完成在客户现场的全流程部署与上线支持。
4.系统后续迭代与运维保障：承担系统上线后的版本更新、问题排查与技术支持任务，输出运维文档、故障处理流程及培训资料。

任职要求
1.计算机类专业本科及以上学历，具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握以下至少两类开源框架，并拥有实际部署与二次开发实践：LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.至少了解一种主流大模型推理方案，如hf原生/vllm/sglang，掌握其背后使用的推理并行技术原理。
4.精通Python及PyTorch框架，具备扎实的工程实现能力；能够使用C++/CUDA或Golang开发高性能计算组件或Sidecar服务。
5.熟悉主流向量数据库（Milvus、Weaviate、PGVector、OpenSearch-k-NN）的高可用架构部署、性能调优及数据迁移策略；
6.具备强烈的技术探索意愿，良好的表达能力和协作意识，对新技术保持敏感度，能快速融入新环境；拥有出色的逻辑分析能力、沟通技巧、抗压素质与情绪管理能力。

【base城市：北京or长春】

公司信息

中科聚信信息技术(北京)有限公司

北京市海淀区学院南路62号中关村资本大厦4层401室

万州人才网温馨提示

求职过程请勿缴纳费用，谨防诈骗！若信息不实请举报。

相似职位

很抱歉,暂无相似职位！