新一轮的人工智能技术浪潮中,越来越多的大模型企业,正与云计算厂商深度绑定到一起,从国外的OpenAI与微软,到国内的文心一言与百度智能云,无不如此。
一方面,大模型预训练需要灵活调用且充沛的算力资源,这离不开云计算厂商的算力支持。另一方面,云计算企业持续开疆扩土获客创收,也需要迎合市场需要,不断研发并强化自身的技术能力。
那么,作为国内公有云互联网云服务前三的金山云,在新的人工智能 2.0时代,会有哪些适应市场变化的举措呢?
近日,金山云宣布升级全栈云计算体系,同时发布包括MaaS互信推理专区方案2.0在内的多款新品。在与新浪科技沟通中,金山云方面表示,“金山云已初步建成人工智能时代全栈的云计算体系”。
当新一轮的人工智能技术浪潮到来时,决定做人工智能时代云上“助力者”的金山云,取得了哪些新突破?
人工智能 2.0时代,大模型厂商用云时最关心什么?
2023年以来,随着云原生、AIGC、大模型等新兴技术的迅速发展,全新的人工智能 2.0时代正在开启,而云计算作为数字经济重要的支撑基础,正发挥越来越重要的作用。据IDC 2023年发布的报告显示,“未来5年,以大模型、生成式人工智能驱动的下一代人工智能有望带动整体云产业穿过下行阶段,重回高增长时代。”
然而,生成式人工智能技术在催生新的发展机遇的同时, 也对云厂商提出了越来越多的挑战。
一方面,大模型预训练所需消耗的大量算力资源,对云厂商的存储运算、网络调度等产品技术能力提出了更高要求。另一方面,在高性能算力稀缺的情况下,大模型训练所需的大量算力资源和稳定获得,并且价格能够被大模型厂商接受,也成了困扰大模型企业们选择云厂商的一大关键要素。
以算力供给为例,2023年,随着国外高端芯片引进受限,一些大模型厂商在引进算力的过程中,即使与一些算力提供方签订了采购协议,但随后却又被其他厂商以更高的价格抢走了订单。
与此同时,一些云厂商在面向新兴大模型企业提供算力资源和相关服务的同时,也正在积极地推出自家的自研大模型,这些操作或多或少地也影响着新兴初创企业们对于自家模型以及数据安全的担忧。“对于大模型企业或模型应用厂商而言,他们虽然需要云计算资源支撑,却也担心自己训练出来的模型资产、用户数据、隐私等,过多地受制于单一云厂商。”
在这样的情况下,越来越多的新兴大模型企业在做云计算厂商选择和未来产品规划的同时,也会更加关注选择的云厂商能否做数据跨云迁移?能否提供安全可信可靠的技术?
围绕这一系列问题,如何满足大模型或模型应用企业的算力资源供给,同时将自己的算力和基础能力以他们愿意接受的价格,稳定安全地提供给他们?成为云计算厂商们需要重点思考的问题。
全面支持生态伙伴用云规划,金山云有何硬实力?
顺应大模型人工智能 2.0发展与产业需要,金山云深入探索前沿技术,围绕AIGC升级核心计算、存储、网络等产品,从多个维度全面拥抱人工智能。据金山云方面介绍,在刚结束的2023年,“通过技术自研和升级,金山云已初步建成人工智能时代全栈的云计算体系。”
在满足大模型算力需求方面,金山云第七代云服务器X7搭载第四代英特尔? 至强? 可扩展处理器、支持英特尔? AMX原生加速能力,CPU性能较上代最高提升60%,内存升级至DDR5,频率较上一代性能提升50%。融合金山云自主创新的加速技术,云服务器X7可有效提升模型推理性能。
生成式人工智能的快速爆发,对存储的性能提出了更高的要求。据介绍,根据数据从极热到极冷的不同热度,金山云对象存储已覆盖标准存储、低频存储、深度低频存储、归档存储、深度冷归档存储和全闪存储等不同访问热度的存储产品。其中,金山云对象存储KS3极速型最高可提供1Tbps/PB的兑付带宽,相较基于机械硬盘(HDD)的对象存储性能提升了上百倍,能为AIGC、存算分离和高性能计算等场景提供强有力的存储解决方案。
此外,为解决云厂商与大模型企业间的可信交互问题,金山云还推出了互信虚拟私有网络,对进出VPC的通信行为有着更为严格的控制,帮助客户解决合规和互信问题。与此同时,金山云还发布了MaaS互信推理专区方案2.0(MaaS 2.0),可实现云上LangChain的一键部署,默认对接多个生态合作商业大模型和开源大模型。
据介绍,MaaS 2.0同时还支持包括BGE、Bert等在内的Embedding模型,能无缝对接金山云全托管向量数据库Milvus,提供面向企业开发者的简单易用、安全可信的一站式推理应用部署平台;同时也支持通过标准化的API接口和Web前端界面,实现包括模型推理和知识库搭建的RAG大模型场景应用……
目前,金山云已全面支持金山办公等生态伙伴的人工智能用云规划,同时也正与MiniMax等独立人工智能企业加强生态合作,为大模型企业提供云服务。据介绍,“金山云全栈技术体系,已形成以云产品基础设施为底座能力,云产品平台服务为核心技术能力,并通过MaaS互信推理专区方案和金山云轻舟智问为人工智能客户提供助力。”
严守中立定位,做大模型的助力者
公开数据显示,从年初到年末,国内大模型数量超过200个。与人工智能的结合,给了云更多的想象空间,也给各行业都带来了新的生产力。随着技术的进一步完善和落地,云计算将迎来更强更久的生命力。
根据Gartner统计,2022年全球云计算市场规模为4910亿美元,增速19%,预计在大模型、算力等需求刺激下,市场仍将保持稳定增长,到2026年全球云计算市场将突破万亿美元。另据中国信通院统计,2022年我国云计算市场规模达4550亿元,较2021年增长40.91%。相比于全球19%的增速,我国云计算市场仍处于快速发展期,预计2025年我国云计算整体市场规模将超万亿元。
空前的市场机遇下,人工智能大模型在加速重构企业数字化的过程中,为节约经济成本和效益最大化,未来大模型市场参与者的分工会更加明确,更多企业将在云厂商的算力、模型和数据资源基础上开发人工智能原生应用,推动云上人工智能原生应用市场的繁荣。而这,也为金山云等已在国内市场站稳脚跟的云计算企业,创造了新的增长可能性。
基于MaaS互信推理专区方案,金山云将持续针对模型供需方关注的互信和安全升级产品和技术。该方案的继续升级和完善,有望为更多大模型领域的客户提供服务。实际上,凭借中立性的定位,金山云已签约及洽谈商机的人工智能客户已达数十家。
回顾2023年金山云的发展,金山云方面总结道:“过去的一年,我们所做的两件事可以用‘夯实基础’和‘勇立潮头’两个词来总结。一方面,云计算在核心产品上还在持续演进,另一方面,大模型起来后,所有人都在围绕这个做工作。金山云也要勇做时代弄潮儿,去给行业和客户提供适合自己的产品和技术。”
据介绍,通过持续不断的产品能力升级,以及云平台上不断完善的大模型生态能力,目前金山云已服务超500优质客户。相信即将到来的人工智能2.0时代,“严守中立定位,做大模型的助力者”差异化定位的金山云,也将迎来属于自己的全新时代机遇。