大模型应用开发工程师(需长期外派)
1.5-3万元/月
更新 2025-12-14 14:16:28
浏览 962
职位详情
大模型算法
经验不限
计算机相关专业
岗位职责
1.大模型应用的二次开发与参数优化:依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源框架进行功能扩展与深度调参,实现自定义文档解析、向量索引策略配置、Agent工具集成、Prompt工程体系构建、重排模型接入及权限控制钩子等定制化需求。
2.大模型推理引擎部署与性能优化:基于pytorch、vllm、sglang等开源推理框架,结合客户实际硬件环境调整推理参数,提升系统响应效率与资源利用率。
3.私有化场景下的端到端部署交付:基于K8S完成大模型应用系统的定制化封装,并实现从环境准备到上线运行的全流程部署落地。
4.系统持续迭代与运维保障:承担系统上线后的版本更新、问题排查与技术支持工作,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握至少两项以下开源框架,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉至少一种主流大模型推理方案(如hf原生/vllm/sglang),了解其底层并行推理机制与优化路径。
4.精通Python与PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能算子或配套Sidecar服务。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方法。
6.具备强烈的技术探索意愿,良好的协作意识与沟通技巧,能快速融入新环境并应对复杂挑战;拥有出色的逻辑分析能力、抗压能力与情绪管理能力。
【base城市:北京or长春】
1.大模型应用的二次开发与参数优化:依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源框架进行功能扩展与深度调参,实现自定义文档解析、向量索引策略配置、Agent工具集成、Prompt工程体系构建、重排模型接入及权限控制钩子等定制化需求。
2.大模型推理引擎部署与性能优化:基于pytorch、vllm、sglang等开源推理框架,结合客户实际硬件环境调整推理参数,提升系统响应效率与资源利用率。
3.私有化场景下的端到端部署交付:基于K8S完成大模型应用系统的定制化封装,并实现从环境准备到上线运行的全流程部署落地。
4.系统持续迭代与运维保障:承担系统上线后的版本更新、问题排查与技术支持工作,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握至少两项以下开源框架,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉至少一种主流大模型推理方案(如hf原生/vllm/sglang),了解其底层并行推理机制与优化路径。
4.精通Python与PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能算子或配套Sidecar服务。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方法。
6.具备强烈的技术探索意愿,良好的协作意识与沟通技巧,能快速融入新环境并应对复杂挑战;拥有出色的逻辑分析能力、抗压能力与情绪管理能力。
【base城市:北京or长春】
相似职位
很抱歉,暂无相似职位!