欢迎来到亿配芯城! | 免费注册
你的位置:ADI亚德诺半导体-芯片线上商城 > 芯片产品 > 英特尔瞄准大模型市场,一天发布两款新CPU
英特尔瞄准大模型市场,一天发布两款新CPU
发布日期:2024-02-10 10:59     点击次数:154

英特尔的名字是̵AI 到处都是”在新闻发布会上,中美市场被明确视为人工智能的两个关键市场,并在硅谷和北京举行了新闻发布会。尽管英特尔没有在北京的新闻发布会上宣布预期的GPU Gaudi 3的最新进展,但其人工智能战略重点已逐渐转向引导用户使用CPU产品进行大模型推理。从两款新产品的升级点可以看出,英特尔正在加强CPU,同时补充GPU和NPU的不足。

在新闻发布会上,英特尔推出了两种新的CPU产品:一种是企业云服务器CPU-第五代强处理器,另一种是普通消费者的核心 Ultra 处理器。这是英特尔多年来首次在同一天更新云和端两侧的产品,显示了其全面布局人工智能市场的决心。

随着人工智能芯片市场三足鼎立格局的形成,英特尔计划采取双向策略,在云端和终端占领人工智能市场。新发布的酷睿 Ultra 除CPU模块外,处理器是一种复合芯片,它还集成了锐炫GPU和NPU模块用于图形处理和AI推理。

该处理器最大的亮点是其集成的GPU模块,这是英特尔历史上最大的GPU升级。具体来说,该模块支持硬件光追逐,集成了多媒体引擎和显示引擎,整体性能是上一代的两倍。与此同时,英特尔首次为大型模型推理添加了NPU模块,这显然是为了提高人工智能大型模型在实际应用中的性能。

大型模型的推理和培训是两个关键环节。培训是制造大型模型的过程,而推理是使用大型模型的过程。随着大型模型制造商模式的逐渐清晰和大型模型在各个行业的广泛应用,预计培训需求将迅速增长,这也是许多芯片制造商竞争的市场。

目前,对于企业来说,大型模型的培训更具挑战性,对速度的要求也更高。因此,英伟达的A100仍然是首选,这是其他制造商不可动摇的地位,包括英特尔。然而,在大型模型的推理环节中,场景更加多样化和细分,制造商将根据实际情况选择更多样化的芯片架构。

例如,平行度最高的GPU通常适用于高吞吐量的应用程序,如文生图和大参数的大语言模型;NPU是一种计算能力高、能耗低的芯片,更适合需要在后台运行的任务,如视频会议中的持续视频和音频处理;CPU具有计算能力高、编程方法简单等特点,可以处理更普遍的任务。

有业内人士告诉36氪,虽然GPU或NPU是大模型推理场景的主流选择,但在考虑成本和产能因素时,行业已经开始讨论CPU运行大模型推理的可能性。这一次,英特尔还将更强的GPU和NPU包装在CPU中,ADI亚德诺半导体,芯片线上商城,模拟芯片推出酷睿 Ultra 处理器显然希望突破大模型推理环节,占据更多的人工智能市场份额,避免与英伟达的积极竞争。

英特尔第五代至强处理器主要升级人工智能加速性能,大大提高了计算能力、内存和人工智能推理性能。与上一代相比,第五代至强处理器的平均性能提高了21%。然而,英特尔并没有通过减少芯片工艺来提高性能,而是通过调整芯片的底层结构来实现。

具体来说,第五代至强处理器采用64核设计(上一代为60核),每个核可进一步分为两个模块,上一代为四个模块。这意味着每个CPU模块中的核数量是上一代的两倍。此外,第五代至强处理器的缓存也大大改善,内存带宽高达5600MT/s。

总的来说,第五代到强处理器的云计算自然语言性能提高了23%,边缘计算性能提高了24%,人工智能推理性能提高了42%。

英特尔还升级了TDX功能,以解决云大模型运行中可能存在的数据安全和隐私问题。在传统的云计算中,大部分应用于虚拟机运行,下层是承载用户数据的操作系统。在英特尔的TDX模式中,虚拟机被隔离,为用户提供了更大的可信空间。

英特尔也在加快业务推广,适应了大多数大型模型制造商。第五代强处理器可以运行20B参数大型模型,实现软件与平台的兼容性。

在新闻发布会上,英特尔还邀请了京东云和百度作为其平台。英特尔表示,在Llama270B模型测试中,在100G高速网络下,4台第五代至强处理器的整体性能比上一代提高了2.8倍,延迟降低到了87ms。

总的来说,英特尔至强处理器在架构、内存、计算能力、安全隐私等方面的提升,都是为了云服务厂商的需求,提高了云大模型的效率和性能。英特尔表示,目前有20多家OEM/ODM厂商和7家云厂商使用至强处理器。

在GPU领域,英伟达上个月发布的H200正在疯狂升级内存容量和计算性能;AMD最近也升级了MI300系列。AMD首席执行官苏子丰表示,MI300系列在训练端相当于英伟达的H100,但推理表现更好。

然而,英特尔和AMD的GPU产品线并没有真正动摇英伟达的地位,战争也没有真正燃烧起来。在此之前,英特尔希望首先建立自己稳定的CPU,首先抓住云和PC端人工智能的机会,侵蚀更广阔的大型推理市场。