AWS推出GPU租赁服务:降低AI工作负载成本
来源:ictimes 发布时间:2023-11-15 分享至微信

随着生成式AI的崛起,GPU算力需求持续增长。然而,高昂的GPU价格和供不应求的市场环境给许多企业和研究机构带来了挑战。为了解决这一问题,AWS近日推出了一项创新服务——「亚马逊弹性运算云(EC2)机器学习容量区块」(Amazon Elastic Compute Cloud Capacity Blocks for ML),允许客户在需要的时候租用GPU算力,以执行特定的AI相关任务。


这项新的服务让客户能够预约NVIDIA H100 Tensor Core GPU实例,并在EC2 UltraCluster中获取低延迟、高吞吐量的连接,以便进行分散式训练。客户可以根据需要灵活地安排GPU算力的使用时间点以及时数,从而降低整体费用。


这项服务特别适合那些只需要在少数工作中使用到昂贵的GPU资源的情况。通过EC2容量区块,客户可以在1到14天内保留GPU算力容量,从1个到64个丛集,每个丛集配置8颗GPU(最高为512颗GPU),从而可以灵活地执行各种AI工作负载。


该服务最早可提前8周预约,并已在亚马逊的美国东部(俄亥俄州)区域推出。这项服务的推出不仅能帮助客户降低成本,同时也为AWS提供了将GPU资源效率最大化的机会,确保了相关的营收。然而,这些GPU资源的价格将根据实际的供需情况动态浮动。


AWS新的GPU租赁服务为那些需要执行AI工作负载但又面临GPU价格和供应挑战的客户提供了新的选择。通过按需租赁GPU算力,客户可以更灵活地满足其特定需求,同时降低了整体费用。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!