IBM 案例研究

IBM logo
“我们一直在寻找一种解决方案,它既要足够简单易于维护,同时又能让服务团队在所有方面拥有100%的所有权。我们于2022年初使用 Knative Eventing(由 Knative Kafka Broker 提供支持)为我们的 watsonx Assistant 用例构建了一个原型系统。我们的初步结果在各个层面都超出了我们现有的基准。在投入足够时间使其达到生产就绪状态后,我们将其推广到六个地理区域的所有生产 IBM 云集群中。”

IBM watsonx Assistant 使用 Knative Eventing 训练机器学习模型

随着 IBM 的云战略不断发展并转向私有云和混合云,IBM Cloud Pak for Data 和托管云服务提供商 (MCSP) 等解决方案现在需要高度可移植的 watsonx 服务,这些服务能够运行在客户硬件、私有基础设施以及 IBM 无法访问的数据存储提供商上。我们现有的机器学习训练基础设施最初设计时几年前专注于公共云基础设施,之后进行了一次升级,以确保与各种云基础设施解决方案的兼容性。然而,随着我们的客户群在这些平台上的扩展,相关的运营成本也随之增加。与此同时,提高机器学习训练时间以改善客户体验的压力也越来越大。随着时间的推移,我们对意图识别算法和训练基础设施堆栈进行了大量优化,将训练时间从 3.5 分钟缩短到令人印象深刻的 90 秒。然而,进一步的优化带来了挑战,包括分布式设置中的资源利用率和背压处理等问题。认识到需要一个全面的解决方案,我们开始了一场范式转变,以重新定义我们整个 ML 训练基础设施。

请在 CNCF 网站阅读完整案例研究

  • IBM watsonx Assistant 如何使用 Knative Eventing 训练机器学习模型
  • 了解更多

    我们使用分析和 cookie 来了解网站流量。有关您使用我们网站的信息会与 Google 共享以达到此目的。了解更多。