大模型应用研发工程师(需出差)
1.5-3万元/月
更新 2025-12-13 11:48:12
浏览 838
职位详情
大模型算法
3-5年
岗位职责
1.大模型应用功能二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台进行定制化开发及深度参数调优,实现个性化文档解析模块、向量索引机制、Agent工具集成、Prompt架构设计、结果重排序模型、权限控制插件等功能。
2.大模型推理系统部署与性能优化:结合pytorch、vllm、sglang等开源技术栈,根据客户硬件环境调整推理配置,提升推理效率与资源利用率。
3.全流程私有化部署与项目交付:依托K8S完成大模型应用的定制开发与集成,实现从环境搭建到客户现场的端到端部署落地。
4.系统升级与运维保障:承担上线后系统的版本迭代、问题排查与技术支持,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机类专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握至少两项以下框架,并有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉主流大模型推理方案中的至少一种,如hf原生/vllm/sglang,了解其底层并行推理技术原理。
4.精通Python&PyTorch,具备扎实的工程实现能力;可使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调参及数据迁移策略;
6.具备强烈的技术探索意愿,良好的表达能力和协作意识,能积极应对变化并快速融入新场景;拥有出色的逻辑分析、沟通协调、抗压调节与情绪管理能力。
1.大模型应用功能二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台进行定制化开发及深度参数调优,实现个性化文档解析模块、向量索引机制、Agent工具集成、Prompt架构设计、结果重排序模型、权限控制插件等功能。
2.大模型推理系统部署与性能优化:结合pytorch、vllm、sglang等开源技术栈,根据客户硬件环境调整推理配置,提升推理效率与资源利用率。
3.全流程私有化部署与项目交付:依托K8S完成大模型应用的定制开发与集成,实现从环境搭建到客户现场的端到端部署落地。
4.系统升级与运维保障:承担上线后系统的版本迭代、问题排查与技术支持,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机类专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握至少两项以下框架,并有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉主流大模型推理方案中的至少一种,如hf原生/vllm/sglang,了解其底层并行推理技术原理。
4.精通Python&PyTorch,具备扎实的工程实现能力;可使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调参及数据迁移策略;
6.具备强烈的技术探索意愿,良好的表达能力和协作意识,能积极应对变化并快速融入新场景;拥有出色的逻辑分析、沟通协调、抗压调节与情绪管理能力。
相似职位
很抱歉,暂无相似职位!