机器人VLA大模型专家-U6917D
6-9万元/月
更新 2025-12-12 16:04:33
浏览 284
职位详情
GIS工程师
5-10年
VLA · 具身智能 · 大模型
岗位职责:
1.VLA模型架构创新与研发:主导机器人视觉-语言-动作(VLA)大模型的结构设计、算法开发与工程实现,突破多模态特征高效融合、动作序列推理生成与优化等核心技术瓶颈,显著增强模型在机器人操控、自动驾驶等复杂场景下的端到端任务执行性能;
2.机器人多模态智能系统构建:搭建融合视觉、语言与动作信号的联合训练体系,研发基于Transformer或扩散模型的跨模态交互机制,提升模型在动态环境中的语义解析、情境认知与自主决策水平;
3.模型高效部署与优化:针对具身智能硬件平台(如机械臂、移动机器人),深度优化VLA模型的实时推断效率,综合运用算子融合、量化压缩与模型剪枝等先进技术,实现模型在边缘计算设备上的高性能、低时延运行;
4.跨模态数据闭环体系搭建:建立面向具身智能的大规模高质量数据采集、增强与标注流程,开发仿真验证工具链,形成数据驱动的模型迭代闭环,持续强化VLA模型在真实应用环境中的稳定性与泛化能力。
任职要求:
1、专业背景:计算机视觉、机器人学、自然语言处理等相关领域博士学历,研究方向集中于多模态大模型、具身智能或机器人决策控制。
2、技术能力:
(1)熟练掌握PyTorch/TensorFlow框架,具备VLA模型(如RT-2、OpenVLA、DiffusionPolicy)改进与部署经验,了解强化学习、模仿学习等相关方法;
(2)熟悉多模态对齐技术(CLIP、DINOv2等),拥有视觉语言模型(VLM)与动作生成模块联合调优实践;
(3)掌握机器人操作系统(ROS/ROS2),具备机器人感知-决策-控制全链路开发经历者优先。
3、经验要求:
(1)5年以上多模态算法研发经历,主导过VLA相关项目(如自动驾驶、机械臂操作等)并推动其商业化落地;
(2)在NeurIPS/ICML/CoRL等国际顶级会议发表过VLA相关论文,或持有具身智能方向核心专利。
1.VLA模型架构创新与研发:主导机器人视觉-语言-动作(VLA)大模型的结构设计、算法开发与工程实现,突破多模态特征高效融合、动作序列推理生成与优化等核心技术瓶颈,显著增强模型在机器人操控、自动驾驶等复杂场景下的端到端任务执行性能;
2.机器人多模态智能系统构建:搭建融合视觉、语言与动作信号的联合训练体系,研发基于Transformer或扩散模型的跨模态交互机制,提升模型在动态环境中的语义解析、情境认知与自主决策水平;
3.模型高效部署与优化:针对具身智能硬件平台(如机械臂、移动机器人),深度优化VLA模型的实时推断效率,综合运用算子融合、量化压缩与模型剪枝等先进技术,实现模型在边缘计算设备上的高性能、低时延运行;
4.跨模态数据闭环体系搭建:建立面向具身智能的大规模高质量数据采集、增强与标注流程,开发仿真验证工具链,形成数据驱动的模型迭代闭环,持续强化VLA模型在真实应用环境中的稳定性与泛化能力。
任职要求:
1、专业背景:计算机视觉、机器人学、自然语言处理等相关领域博士学历,研究方向集中于多模态大模型、具身智能或机器人决策控制。
2、技术能力:
(1)熟练掌握PyTorch/TensorFlow框架,具备VLA模型(如RT-2、OpenVLA、DiffusionPolicy)改进与部署经验,了解强化学习、模仿学习等相关方法;
(2)熟悉多模态对齐技术(CLIP、DINOv2等),拥有视觉语言模型(VLM)与动作生成模块联合调优实践;
(3)掌握机器人操作系统(ROS/ROS2),具备机器人感知-决策-控制全链路开发经历者优先。
3、经验要求:
(1)5年以上多模态算法研发经历,主导过VLA相关项目(如自动驾驶、机械臂操作等)并推动其商业化落地;
(2)在NeurIPS/ICML/CoRL等国际顶级会议发表过VLA相关论文,或持有具身智能方向核心专利。
相似职位
很抱歉,暂无相似职位!