AI技术解决方案专家
3-5万元/月
更新 2025-12-11 08:21:17
浏览 697
职位详情
机器学习
3-5年
C/C++ · Java · 图像算法 · 深度学习 · 算法工程化经验 · 大模型算法 · 自然语言处理算法 · 多模态算法 · 模型加速/性能优化 · Python
职位描述:
1.承担大模型运行所需GPU软硬件平台的适配与调优任务,处理在适配和优化过程中涉及的软硬件兼容、系统性能、稳定性及高可用性等方面的技术挑战;
2.面向金融机构设计并实施GPU软硬件平台的整体交付方案,涵盖算力资源评估与规划、基础软件选型、计算环境构建、训推平台部署以及大模型评测工具链集成,提供可落地的技术实践支持;
3.为金融行业客户在GPU算力资源池建设中提供高性能网络技术的选型建议、架构设计、部署实施与性能调优服务,解决GPU设备、服务器节点、集群系统及POD层级在网络接入与组网过程中的控制面与数据面转发问题。
职位要求:
1.计算机、通信或相关专业本科及以上学历,具备GPU硬件适配及大模型底层软硬件系统工程化交付的实际经验;
2.掌握PyTorch或TensorFlow等主流机器学习框架,理解神经网络基本结构,熟悉张量、梯度等核心数据形式及其前向与反向传播机制;
3.熟悉GPU虚拟化技术与RDMA网络架构,了解资源虚拟化、调度分配原理,掌握RDMA常用协议及典型网络设计方案;
4.熟悉大模型应用中的Prompts、RAG、插件机制与Agent开发模式及相关技术生态;
5.精通Linux操作系统、Kubernetes编排系统及容器化技术,能熟练运用Python/shell编写自动化部署与运维脚本;
6.精通至少一门编程语言(如Python、C、C++),并具备CUDA编程实践经验;
7.具备主流训练与推理框架使用及性能优化经验者优先考虑。
1.承担大模型运行所需GPU软硬件平台的适配与调优任务,处理在适配和优化过程中涉及的软硬件兼容、系统性能、稳定性及高可用性等方面的技术挑战;
2.面向金融机构设计并实施GPU软硬件平台的整体交付方案,涵盖算力资源评估与规划、基础软件选型、计算环境构建、训推平台部署以及大模型评测工具链集成,提供可落地的技术实践支持;
3.为金融行业客户在GPU算力资源池建设中提供高性能网络技术的选型建议、架构设计、部署实施与性能调优服务,解决GPU设备、服务器节点、集群系统及POD层级在网络接入与组网过程中的控制面与数据面转发问题。
职位要求:
1.计算机、通信或相关专业本科及以上学历,具备GPU硬件适配及大模型底层软硬件系统工程化交付的实际经验;
2.掌握PyTorch或TensorFlow等主流机器学习框架,理解神经网络基本结构,熟悉张量、梯度等核心数据形式及其前向与反向传播机制;
3.熟悉GPU虚拟化技术与RDMA网络架构,了解资源虚拟化、调度分配原理,掌握RDMA常用协议及典型网络设计方案;
4.熟悉大模型应用中的Prompts、RAG、插件机制与Agent开发模式及相关技术生态;
5.精通Linux操作系统、Kubernetes编排系统及容器化技术,能熟练运用Python/shell编写自动化部署与运维脚本;
6.精通至少一门编程语言(如Python、C、C++),并具备CUDA编程实践经验;
7.具备主流训练与推理框架使用及性能优化经验者优先考虑。
相似职位
很抱歉,暂无相似职位!