研究显示,AI工程化落地过程中,出现痛点从高到底依次是资源利用率、大模型落地、分布式训练效率、推理效率、国产化、异构芯片调度。其中,资源利用率出现频率接近后面五名的总和。深挖痛点,其背后是资源分配不均衡、资源规划不合理、资源碎片多的问题。
为了解决以上问题,可以引入云原生加存储资源盘活的组合解决方案。
云原生(Cloud Native)是构建应用程序一类技术的统称,也是面向“云”而设计的应用,在使用云原生技术后,开发者无需考虑底层的技术实现,可以充分发挥云平台的弹性和分布式优势,实现快速部署、按需伸缩、不停机交付等。通过云原生技术可以构建出可弹性扩展的应用程序,这些应用程序可以被运行在不同环境当中,比如公有云、私有云、混合云等新型动态环境中。利用云原生技术,形成以容器服务为核心,以云原生技术作为基础架构的AI工程解决方案,无缝的整合了云的计算、负载均衡等服务,同时贯穿了AI任务的全生命周期。但是,如何有效支撑各种云主机应用与微服务应用,对于存储系统提出了很大挑战。随着容器、微服务平台的大规模应用,快速开发迭代、发布频繁对于存储系统的弹性支撑能力提出了严峻挑战,且不同的业务数据保存在计算节点本地或者不同的外部存储设备中,数据流动性差,不仅导致存储空间及性能资源浪费严重,数据灾备方案难以统一。
为了解决以上问题,可以引入云原生加存储资源盘活的组合解决方案。
云原生(Cloud Native)是构建应用程序一类技术的统称,也是面向“云”而设计的应用,在使用云原生技术后,开发者无需考虑底层的技术实现,可以充分发挥云平台的弹性和分布式优势,实现快速部署、按需伸缩、不停机交付等。通过云原生技术可以构建出可弹性扩展的应用程序,这些应用程序可以被运行在不同环境当中,比如公有云、私有云、混合云等新型动态环境中。利用云原生技术,形成以容器服务为核心,以云原生技术作为基础架构的AI工程解决方案,无缝的整合了云的计算、负载均衡等服务,同时贯穿了AI任务的全生命周期。但是,如何有效支撑各种云主机应用与微服务应用,对于存储系统提出了很大挑战。随着容器、微服务平台的大规模应用,快速开发迭代、发布频繁对于存储系统的弹性支撑能力提出了严峻挑战,且不同的业务数据保存在计算节点本地或者不同的外部存储设备中,数据流动性差,不仅导致存储空间及性能资源浪费严重,数据灾备方案难以统一。