F5和NVIDIA正在全面提高性能,许多租户和AI期间的
发布时间:2025-07-13 09:58
巴黎,2025年7月9日,F5(NASDAQ:FFIV),是应用程序交付和API安全解决方案的领导者,最近宣布推出新的F5 Big-IP功能,以遵循Kubnetes。该解决方案与NVIDIA Bluefield-3 DPU和NVIDIA DOCA软件框架深入集成,并通过欧洲客户Sesterce的实际扩展证明了这一点。 Sesterce是欧洲基础设施和主权人工智能(AI)运营商的主要新一代,它致力于满足加速计算和AI开发的严格需求。作为F5应用程序交付和安全平台的额外扩展,Cubertes的下一个Big-IP现在可以运行到NVIDIA Bluefield-3 DPU的本地运行,该公司为大型基础设施提供了高性能交通管理和安全保护,从而显着提高了操作效率,操作效率,控制功能和AI应用程序的性能。今年早些时候,F5宣布了前任正式发布解决方案时,通用的局限性并显示出更好的性能优势。今天,Sesterce完成了联合解决方案的一些基本技能的验证,涵盖了以下领域:Sesterce Manssouri的首席执行官兼联合创始人Youssef El说:“ F5和NVIDIA的解决方案整合已经显示出了很久以来很久以来都在进行任何试验之前就可以实现任何试验。还可以通过在Cubertes的高度通过Cuberte in。提供更大的价值变化,包括新解决方案的基本值:在此联合解决方案中,企业可以以较低的成本将简单的与AI相关的任务路由较轻的LLM来支持AI开发,同时使更复杂的查询在更强大的智能RAN中,也可以改善智能质量的特定输出质量。客户体验。先进的F5流量管理技术可确保查询准确地分布到最合适的模型节点,从而减少延迟并加速单词生成的第一次。 F5的首席创新官Kunal Anand表示:“目前,企业已经进一步采用了多模型体系结构来创建高级的AI体验,但是消耗了LLM交通智能分类和计算资源的界限,这很容易导致系统。系统性能会减慢速度,并启动llm blue fightia nvidia bluglia forne nviia blugia forder -3 dpu figit效果。 NVIDIA DYNAMO有效地通过统一的调度,交通状态和内存管理等重大任务来支持大型环境中的扩展和倾向模型。解决方案是从CPU到Bluefield DPU的一些计算操作,从而越来越改善整体开发可以通过存储KV缓存和通过KV Cache存储和重复使用机制来以较低的成本实现性能优化,并且可以直接占据昂贵的GPU存储源。加速,为企业和服务提供商提供了单个控制点,这有助于工厂实现良好的GPU使用,并加速数据摄入,模型培训,识别,增强(RAG)和代理AI。流量处理。此外,F5对IRULES可编程性的多租赁和连续优化的支持为进一步整合高级功能的基础,例如将来由KV Cache Manager分发的NVIDIA DYNAMO等高级功能。 “ MCP是人类启动的开放协议,旨在稳定如何向LLM提供上下文信息。在MCP服务器中,F5可以充当反向代理,增强它们。适应AI协议的快速演变,并进一步防止出现网络安全风险。 “实施代理AI的企业越来越依赖MCP部署来提高LLM的安全性和性能。F5Big-IP接下来是基于NVIDIA Bluefield-3 DPU平台的Cubertes Deployed,现在可以使用。
下一篇:没有了