软件定义算力,算力定义汽车
通过 OrionX 远程调用 +RDMA 网络能力,使 AI 开发环境不再局限在某一台 GPU 服务器上运行,而是在集群中任意一台服务器(即使是 CPU 服务器)都能实现对 GPU 资源的调用能力,GPU 资源池的灵活度大幅提升,减少 GPU 资源消耗,利用率提升3倍以上;
总结
趋动科技 GEMINI 双子座 AI 训练平台解决方案
自动驾驶与 AI 算力
趋动科技 OrionX 猎户座 AI 算力资源池化解决方案
汽车产业发展现状
支持 AI 分布式多机多卡训练,让 AI 训练任务不受单节点 GPU 数量限制,加速自动驾驶 AI 训练结果输出。
落地案例2:AI开发训练平台解决方案
趋动科技自动驾驶行业落地案例
平台实现 AI 任务所需数据、镜像、代码的集中管理,方便数据复用和分享,在保障算法工程师高效协同的同时,兼顾了企业的信息安全保障。
使用趋动科技解决方案后客户收益:
打造统一 GPU 资源池,统一图形化管理,统一资源调度分配。通过 OrionX 的 GUI 界面实时监控 GPU 资源使用情况,有效辅助运维工程师管理 GPU 集群。
深度整合的算法开发环境与离线模型训练环境,代码开发完成后一键提交,简单易用,避免中间迁移出错。
具备完善的平台账户管理、权限管理、配额管理能力,配合丰富的可视化监控视图,方便运维工程师实现高效清晰的运维管理工作。
趋动科技通过 OrionX AI 算力资源池化解决方案为客户构建自动驾驶数据中心 GPU 动态资源池。在采用 OrionX 软件之前,客户的每位算法工程师都会被分配一张或几张独占的物理 GPU 卡。在采用 OrionX 软件之后,每位算法工程师仍然会被分配一张或几张虚拟 GPU 卡,这些虚拟 GPU 卡在算法工程师看来还是“独占”的,这样算法工程师的工作方式和体验并没有改变。但是在算法工程师真正开始运行代码之前,OrionX 软件并不会为算法工程师预留任何物理 GPU 资源。只有在算法工程师开始运行代码后,OrionX 软件才会自动从资源池中为其分配物理GPU资源,等代码运行完成后,这些物理 GPU 资源又会被自动回收到资源池中。这样借助 OrionX 软件按需分配、灵活调度、动态挂载和释放等能力,就可以实现使用少量物理 GPU 资源支撑大量算法工程师对独立开发环境的需求,打破一人一卡占用造成利用率极低问题,即便不切分 GPU 仍然能显著提升 GPU 利用率,某些场景适度切分 GPU 后整体利用率还能够继续提升;
使用趋动科技解决方案后客户收益:
趋动科技 Gemini AI 开发训练平台是集成AI开发、训练、运维的一体化管理解决方案,能够帮助客户完成 CPU、物理 GPU、 OrionX vGPU 和存储资源的统一纳管和统一分配。因其与 OrionX 深度整合,所以 Gemini AI 训练平台在简化运维工作的同时,还能大幅提升 GPU 利用率。
上一篇:智能APP可“包办”志愿填报?专家建议不要依赖
下一篇:2022年6月北京新三板企业市值TOP100:1/4为软件和信