商业报道-o

数字世界的基石:英特尔以太网800系列适配器技术指南

以太网的发展历史

1906年,一家以复印/打印为主要业务的公司施乐(Xerox),在美国康涅狄格州的费尔菲尔德县成立。如今,该公司股价在13.7美元左右,和当今的全球PC行业标准制定者英特尔的股价相差数倍,但是就是这个绝大多数人都未曾听说过的施乐公司,诞生了奠定未来的以太网技术。

1973年,罗伯特·梅特卡夫提出了以太网的概念,并在Xerox Palo Alto Research Center (PARC)实验室中开发了第一个以太网原型系统。在随后的50年里,以太网经历了硬件商业化、IEEE 802.3标准化、双绞线10Mbps传输网络的诞生直到……100Gbps以太网。随着以太网发展的还有服务器OEM/ODM服务商,有数据表示,在2022年全年,全球服务器出货金额达到1000.10亿美元,同比增长9.88%。出货量达到1350万台,同比增长10.66%。中国在世界服务器市场的位置举足轻重,在2022年,中国服务器市场出货金额全年预计达到273.4亿美元,占据全球服务器出货金额的1/4。

目前服务器发展主要受到以下几个趋势影响:云计算、AI、边缘计算。这三点对以太网的依赖主要体现在以下几个方面:

• 高带宽和低延迟:由于云计算、AI和边缘计算需要大量数据的传输和处理,因此对网络通讯的带宽和延迟要求较高;

• 云计算、AI和边缘计算需要网络通讯能够保持稳定并且可靠地传输数据,以确保系统的正常运行;

• 由于涉及到大量的数据传输和处理,不管是商业网络还是国家敏感部门的通讯,需要具备高度的安全性,以防止数据泄露和网络攻击;

• 云计算、AI和边缘计算需要网络通讯具备灵活性和可扩展性,以适应不断变化的业务需求、数据规模扩充和成本效率优化。

• 由于涉及到大量的数据传输和处理,网络通讯需要具备智能化的管理能力,以优化网络资源的利用和提高系统的性能。

现代服务器OEM/ODM厂商的新蓝海

自2013年始,英特尔® 以太网适配器和控制器全球出货量持续处于良性上涨通道中,并在2022年创下历史新高。

采购高性能以太网适配器的客户,正在面临本世纪以来最大的挑战,数据爆炸、云原生和微服务、工作负载演变等一系列产业与技术革命,正在冲击传统网络资源供应商。边缘计算的兴起,将数据处理和存储功能从传统的集中式数据中心转移到接近数据源和终端用户的边缘设备上。总的来说,边缘计算是一种利用边缘设备进行数据处理和存储的计算模式,旨在提高数据处理效率,降低延迟,并支持大规模的物联网和智能设备应用。

2022年,生成式AI模型一炮而红,大部分生成式AI模型采用了基于Transformer的架构,这种架构在自然语言处理领域中表现非常出色,因为它能够在处理长文本时保持较好的性能。这使得AI模型能够生成自然、流畅的文本,不仅被人们作为聊天工具,还广泛用于法律、自媒体等几乎所有行业。

该模型采用了大规模的预训练数据集,这使得它能够学习到更多的语言知识和语言模式。这些预训练数据集包括了从互联网上收集的大量文本数据,如百科、新闻和网络用户的发帖等。这些数据集使得生成式AI模型具备了更强的语言理解和生成能力,从而在自然语言生成领域中表现出色。

巨大的访问请求+巨大的模型库,构成了生成式AI非常高的硬件壁垒,即便是AI语言大模型的代码公开发布,即便是全球用户对生成式AI资源请求如此渴求,也鲜有民间公司再组织起类似于OpenAI这类超大语言模型供全民使用,这也在无形中给服务器OEM/ODM商创造了一片新蓝海。

当然了,要响应汇集全球海量访问请求的生成式AI模型服务器,对网络硬件的要求也极高。生成式AI模型通常需要大量的内存来存储模型参数和中间计算结果。因此,服务器需要具备大容量的内存和硬件存储空间,如数百GB的内存容量进行交换数据,数PT的存储空间用来保证模型训练,最后为了保证生成式AI模型能够快速地接收和发送数据,服务器需要具备高带宽的网络接口,如更高速的网络接口。

2024以太网新基建

构建现代互联网基础设施的服务器节点进程,目前正面临了严峻的挑战。一方面服务提供商(SP)继续投入大量资金来扩展其网络并满足不断增长的数据流量需求,仅2018年到2023年,物联网消费市场已经从61亿增长到147亿,这些都意味着网络基础设施需要持续的投资才能跟上,而服务提供商也在继续投入大量资金来扩展其网络并满足不断增长的数据流量需求。

然而另一方面,服务器产品供应商面临来自其他同质化严重的制造商的竞争压力,不得不降低产品利润以维持竞争力;在全球范围内,原材料价格波动、全球化供应链脱节、劳动力成本上升等因素已经导致了生产成本上升;即便在国内,社会对环保和可持续发展的关注也在不断增加,OEM商需要考虑如何降低产品的能耗和环境影响,以响应“零碳发展”号召,符合社会和政府的要求。

以物联网技术为例,目前每个区域的物联网的设备接入需求可能还只是“数以千计”,而在未来可预测的数年内,将有数十亿个小工具连接到互联网,单是人体内部或许都将有大量高速网络的植入体设备。大量连接互联网的小工具无法通过物联网系统连接。因此,必须实施分散式架构,以尽量减少服务器的负担。连接问题可以在区块链技术中得到解决,而区块链技术又需要具备如下特征的节点:

• 超低延迟; • 超高并发;

• 超大带宽; • 节能环保;

• 安全可信; • 兼容性强;

• 灵活性和可扩展性高。

这些特性,将在基于Intel® Ethernet 800 Series的下一代以太网适配器上得以呈现。

在Intel® Ethernet 800 Series系列产品前,大部分网络服务供应商广泛采用了英特尔500/700系列适配器。英特尔X710系列10 Gb以太网(GbE)服务器网络适配器可满足下一代数据中心的苛刻需求。通过为服务器和网络虚拟化、小数据包性能和低功耗提供无与伦比的功能;数据中心网络具有灵活性、可扩展性和弹性。

上一代产品Intel® Ethernet 700 Series已经拥有相当出色的网络服务处理性能,支持高达25Gbe规范,为客户提供差异化的、安全的互联网服务。包括文件防火墙:即经过签名和身份验证的FW保护、FW安全检测和恢复措施;

VXLAN、NVGRE和GENEVE资源卸载:这些无状态资源卸载为覆盖网络保留了应用程序性能。有了这些卸载,就有可能在CPU核心之间优化分配网络流量。同时,X710从主机软件中卸载LSO、GSO和校验和,从而减少了CPU开销。

移动和云应用程序加速:英特尔的数据计划开发工具包(DPDK)提供了一个开放的驱动程序,用户可以在其中微调小数据包性能,它提供128字节的线路速率和64字节的近线路速率。

虚拟化性能:借助英特尔虚拟化技术(VT),X710系列适配器可在虚拟化服务器环境中提供出色的I/O性能。这些适配器通过为每个虚拟机(VM)的网络流量提供智能卸载来减少I/O瓶颈,从而为小数据包提供近线速率速度,并支持几乎无限量的隔离流量,以便您可以扩展云环境;

使用动态设备个性化(DDP)配置文件包修改表定义,通过应用DDP Profile来满足网络控制器的功能需求;

低延迟:英特尔® 以太网流导器提供基于硬件的应用转发服务,英特尔数据直接I/O使CPU缓存成为I/O数据的主要收发地,而不是DRAM。综合来看,延迟得到了有效降低,而吞吐量提高了三倍;

在同样的基础设施上(配合安装的网络适配器)优化不同网络环境下的流量处理,而无需重置网络适配器或者重启服务器。

而新一代Intel® Ethernet 800 Series不仅带来了100Gbps具备极其高效的队列利用率,通过分配和隔离每个应用程序的网络资源,实现性能最大化。Intel® Ethernet 800 Series系列网络适配器支持高达100Gbps的传输速度,并更新了更多先进功能,以优化工作负载性能。

云应用程序的性能

提供要求苛刻的云工作负载(包括边缘服务、Web 服务器、数据库应用程序、缓存服务器和存储目标)所需的带宽和更高的应用程序吞吐量。

针对通信工作负载的优化

为高带宽网络和通信工作负载(包括移动核心、5G RAN 和网络设备)提供数据包分类和排序优化。

支持超融合解决方案

Intel® Ethernet 800 Series系列广泛的适配器产品组合具有不同的端口数量和外形规格,可在高效利用服务器处理器的同时提供性能。

兼容性和互操作性

对IEEE和以太网技术联盟标准进行广泛的一致性测试

对不同介质类型和以太网交换机进行广泛的网络互操作性测试,以实现一流的兼容性

全面的操作系统和虚拟机管理程序支持

性能保证

针对英特尔® 架构进行了优化

支持数据平面开发套件(DPDK),可实现更快的网络功能虚拟化(NFV)、高级数据包转发和高效的数据包处理

全球产品支持

零售以太网产品的有限终身保修

遵守全球监管、环境和市场要求

Intel® Ethernet 800 Series系列相比Intel® Ethernet 700 Series系列的提升

延迟降低45%

16B Rx描述符的64B数据包转发率超过110MMPs

双向吞吐量180Gbps

Intel® Ethernet 800 Series产品详解:

目前800系列网卡产品以上市销售的分别为

E810-CAM2 (2x100GbE)、E810-CAM1 (1x100GbE)和E810-XXVAM2(2x25GbE)

E810-CAM2采用16nm工艺制成,插槽长度为X16,双端口配置,每端口数据传输率100Gb/s,支持PCIe 4.0/3.0.

高性能网络的关键要求

对于数据/密钥缓存业务:

• 增加高达60%可预测性

• 最多减少60%延迟。

Redis内存数据库结构复杂,它支持多种数据结构,包括字符串、哈希表、列表、集合、有序集合等,对于这种数据的提升也非常明显,增加50%可预测性,降低45%延迟,增加30%吞吐量。

数据库后端服务器对适配器的要求主要有:带宽、延迟、稳定性、支持协议、硬件加速等,使用英特尔800系列以太网适配器后,45%可预测性,降低15%延迟,增加75%吞吐量。

英特尔800系列以太网适配器提供高性能存储访问;

支持NV03 VXLAN NVGRE GENEVE

C-VLAN S-VLAN Q-in-Q GTP IPoE L2TP MPLS PPPoE;

注:这些是网络中的不同协议和技术,用于在不同的网络层次上实现虚拟化、隔离、封装和路由等功能。

其中,NV03、VXLAN、NVGRE和GENEVE是用于虚拟化网络的隧道协议,可以在物理网络之上创建虚拟网络,实现虚拟机、容器等虚拟化实例之间的通信。

C-VLAN、S-VLAN、Q-in-Q是用于实现虚拟局域网(VLAN)的技术,可以将一个物理网络划分为多个逻辑网络,实现网络隔离和流量控制等功能。

GTP、IPoE、L2TP、MPLS、PPPoE是用于实现不同类型的网络连接和路由的协议和技术,如移动网络、宽带接入、虚拟专用网等。

英特尔® 以太网800系列适配器关键技术解析

利用动态技术提高数据包处理效率设备个性化(DDP)

DDP可定制包过滤,以及增强的数据平面开发套件 (DPDK) ,支持云和NFV工作负载的高级包转发和高效包处理。

800系列固件在驱动程序初始化时加载了一个增强的DDP配置文件,具有许多特定于工作负载的协议,以获得更大的灵活性。当系统中存在多个800系列以太网适配器时,每个适配器的通道可以使用不同的DDP配置文件进行独立编程。

应用设备队列(ADQ)

随着现代数据中心规模的扩大,一个关键的挑战是---提供可扩展的、可预测的应用程序级执行。ADQ技术通过将队列专用于关键工作负载,通过大幅减少波幅来提供可预测的高性能,从而提高性能可伸缩性和可预测性。通过降低波幅来提高应用程序响应时间的可预测性,可以为任务分配更多的计算服务器,并允许更多的用户访问系统,提供更好的终端用户体验。即使是规模不大的应用程序也可以从更高的一致性中受益,使它们更容易满足服务水平协议(SLA)。

至于ADQ的具体描述,可以参考英特尔的官方描述:应用设备队列(ADQ)是一种队列和转发技术。通过部署具有ADQ的英特尔® 以太网800系列网络适配器,组织可以提高可预测性和性能,以提供更好的客户体验并始终如一地满足SLA。ADQ现在支持更广泛的工作负载和环境:容器化、裸机化、虚拟化。ADQ也更容易配置和部署。在容器化工作负载或CDN上管理延迟、可预测性和吞吐量可能具有挑战性。

目前已有使用ADQ的商业数据库案例,是来自美国的Aerospike Inc.,这家企业是一家提供高性能NoSQL数据库解决方案的公司。Aerospike公司的主要产品是Aerospike数据库,这是一个高性能、高可靠性的NoSQL数据库解决方案,专为大规模、实时数据应用而设计。Aerospike数据库具有快速的读写能力、强大的横向扩展性和低延迟的特点,适用于互联网、广告技术、金融服务、物联网等领域的实时数据处理需求。

Aerospike公司的服务对象主要是那些需要处理大规模实时数据的企业和组织,包括互联网公司、广告科技公司、金融服务机构、电子商务平台、物联网设备制造商等。这些客户通常需要处理海量数据、实时分析和个性化推荐等应用场景,因此他们需要高性能、可靠的数据库解决方案来满足业务需求。Aerospike数据库可以帮助这些客户实现快速的数据访问和实时分析,从而提升业务竞争力。

目前Aerospike公司实时从大数据中获取有用的样本。根据 Aerospike在英特尔实验室的测试,与之前优化的 NUMA 固定方法相比,ADQ可以使 Aerospike 4.7或更高版本的下一代 NoSQL数据库的吞吐量提高75%以上,最重要的是,在基于第二代英特尔® 至强® 可扩展处理器的双插槽服务器上运行,配置了两个采用 ADQ 技术的英特尔® 以太网800系列网络适配器,ADQ可使吞吐量提高45%以上。

另一个采用ADQ方案的是企业是推特,根据推特公司的报告,截至2021年第三季度,推特公司在全球拥有3.39亿月活跃用户。这些用户包括个人用户、企业用户以及其他实体用户。而在海量用户的入驻让推特公司服务器不堪重负,根据推特公司的报告,截至2021年第三季度,推特公司在全球拥有3.39亿月活跃用户。这些用户包括个人用户、企业用户以及其他实体用户。在峰值使用期间保持性能时,响应时间受到最慢异常值(尾部延迟)的限制。Twitter和Intel合作,通过使用ADQ.1加速Twitter的Pelikan Cache框架,实现了高达10倍的尾部延迟改进。

英特尔IEEE 1588 Precision Time Protocol (PTP)精确时间协议

精确时间协议(Precision Time Protocol, PTP)提供了IEEE 1588-2008 Precision Clock Synchronization Protocol for Networked Measurement and Control System Standard中定义的1588 Precision Time Protocol时间戳信息。1588 PTP逻辑生成已发送和接收的数据包的96位时间戳信息。生成的时间戳代表Start of Frame Delimiter(SFD)字节之后的第一个比特穿过FPGA串行管脚(Medium Dependent Interface, MDI)的那一时刻。

英特尔® 以太网800系列同时支持IEEE 1588支持两款PTP精确时间协议,v1和v2。产品以个位数纳秒提供更高的精度级别,并且可以在每个包都进行报告,这种计时精度有助于确保跨网络部署的紧密同步,从5G RAN到金融服务、工业自动化和能源监控。

提高吞吐量并降低延迟

保护、检测和故障恢复

800系列以太网适配器的零信任设计理念是一种安全设计策略,默认情况下,组织不应该自动信任任何系统访问请求,这包括来自外部的请求以及内部的请求。零信任要求每一个在授予访问权限之前对访问请求进行验证。

800系列中的信任根保护固件和关键设备设置的身份验证每一个访问。

已签名的固件更新、硬件信任根保护、验证关键设备设置与内置的损坏检测和自动设备恢复。这些功能结合在一起可以确保设备安全返回到初始编程状态。

英特尔® 以太网800系列网络适配器设计简述

英特尔® 以太网控制器E810-XXVAM2特性

IEEE 1588:IEEE 1588 也称为精密时间协议(PTP),是一个用于通过计算机网络同步时钟的协议。在局域网上,它可实现微秒以内的时钟精确度,因而适合测量和控制系统。

iWARP/RDMA:iWARP 通过以太网远程直接内存存取(RDMA)向数据中心提供融合、低延迟的结构化服务。提供低延迟的关键 iWARP 组成部分为内核旁路、直接数据放置和传输加速。

RoCEv2/RDMA:RoCEv2/RDMA(通过融合以太网 v2 的远程直接内存访问)通过经 UDP/IP 的 RDMA 向数据中心提供融合的低延迟结构服务。UDP/IP(用户数据报协议)是一种通信协议,用于对时间敏感的传输,如视频或语音,它通过不需要接收方的"握手"来加快通信速度。

英特尔® Data Direct I/O Technology:英特尔® Data Direct I/O Technology 是一项平台技术,可提高 I/O 设备的数据交付和数据消耗的 I/O 数据处理效率。借助英特尔® Data Direct I/O Technology,英特尔® Server Adapters 和控制器可直接与处理器缓存通信,而无需通过系统内存绕行,从而可降低延迟,提高系统 I/O 带宽,并减少能耗。

【主机接口】

遵从PCIe 4.0;

可同一时间内处理256个未提交的请求;

【软件接口】

基本模式VF与英特尔®的兼容性

2048个Tx队列和2048个Rx队列,动态分配队列给函数

灵活分配2048个中断向量;

每秒2000万次中断;

控制队列包括

PF-VF和的邮箱队列

软件固件的管理队列

供软件访问的边带队列

256个Tx “门铃”DB队列

512个Tx完成队列

量子描述符(QD)每个Tx队列的队列

可编程的Rx描述符字段;

【包处理】

增强型数据平面开发工具包(DPDK)

【虚拟化】

通过VMDQ和SR-IOV实现主机虚拟化

多达256个SR-IOV虚拟功能

隧道数据包的无状态卸载(网络虚拟化支持)

恶意VF保护

虚拟机负载平衡(VMLB)

高级数据包过滤

支持VLAN标签插入,剥离和数据包过滤,最多支持4096VLAN标签

VxLAN、GENEVE、NVGRE、MPLS、VxLAN GPE具有网络服务标头(NSH)

英特尔® 以太网自适应虚拟功能驱动程序

【QoS】

WFQ传输调度程序,拥有9个可编程层;

管线共享和避免饥饿,支持多个指令流可以同时在同一个流水线上执行,从而提高了系统的并行处理能力和吞吐量;支持灵活的调度策略,例如公平调度、优先级调度等,来确保所有任务或进程都能够得到公平的资源分配,从而避免饥饿现象的发生;

通过802.1p PCP或差异化服务提供QoS代码点(DSCP)值;

数据包整形;

【可管理性】

SMBus运行速度高达1Mb/s;

DMTF兼容NC-SI 1.1 100Mb/s接口;

PCIe和SMBus上的MCTP;

通过本地BMC;

SNMP和RMON统计计数器;

看门狗计时器;

MCTP上的PLDM;PLDM监测;PLDM固件更新;RDE的PLDM;

固件管理协议支持;

【虚拟化】

通过VMDQ和SR-IOV实现主机虚拟化;

多达256个SR-IOV虚拟功能;

隧道数据包的无状态卸载(网络虚拟化支持);

恶意VF保护;

虚拟机负载平衡(VMLB);

高级数据包过滤;

支持VLAN标签插入,剥离和数据包过滤,最多支持4096;

VLAN标签:VxLAN、GENEVE、NVGRE、MPLS、VxLAN GPE具有网络服务标头(NSH);

英特尔® 以太网自适应虚拟功能驱动程序;

【RDMA】

iWARP和RoCEv2

256K队列对(QP)

【电源管理】

支持PCI电源管理状态:D3hot和D3cold

意味着设备或系统能够在PCI总线规范定义的D3热插拔和D3冷插拔电源管理状态下正常工作。支持PCI电源管理状态D3hot和D3cold表明英特尔® 以太网800系列适配器能够根据需要在不同的电源管理状态下进行切换,以实现能效优化和节能管理。

【预启动】

支持HTTPS引导的签名UEFI选项ROM,意味着设备的 UEFI(统一扩展固件接口)选项 ROM 被数字签名并且与 HTTPS 引导兼容。Pre-Boot支持HTTPS引导的签名UEFI选项ROM,意味着设备的 UEFI(统一扩展固件接口)选项 ROM 被数字签名并且与 HTTPS 引导兼容。"支持HTTPS引导的签名UEFI选项ROM" 表明设备的固件扩展可以通过数字签名验证,并且可以与安全的HTTPS引导方式兼容,从而提高系统的安全性和可靠性。

【安全】

基于硬件的信任根;

NVM读取和通电时的身份验证;

内置固件/关键设置检测,具有自动设备恢复功能的损坏。

英特尔® 以太网800系列网络适配器形态

单端口适配器:速率100 Gb

• 单端口英特尔® 以太网网络适配器 E810-CQDA1的两种形态

• 主流的PCIe形态与未来的OCP3.0形态

• 1x100/50/25/10GbE,OCP 网络适配器 3.0

两款以太网网卡的区别主要是接口形态,OCP 3.0网卡采用PCIe Gen4接口,而OCP 2.0网卡采用PCIe Gen3接口。OCP 3.0网卡支持更多的高级网络协议和功能,但是目前来看,由于PCIe形态的通用性更好,该形态目前依然是更多服务商的主流选择。

双端口适配器系列:速率涵盖50GB~100GB

• 2款800系列双端口适配器面向 OCP 3.0 的英特尔® 以太网网络

• 适配器 E810-XXVDA2,2x25接口/10GbE速率

• 面向 OCP 3.0 的英特尔® 以太网网络适配器 E810-CQDA2

• 拥有2x100/2x50/4x25/8x10GbE四种方案

采用英特尔® 以太网网络适配器的技术优势总结

应用设备队列(ADQ) 2.0

大幅提升提高应用程序吞吐量

减少应用延迟

提高应用程序可预测性

动态设备个性化(DDP)

在网络适配器中进行帧分类可以提高效率,减少主机 CPU 开销

高精度定时

支持 IEEE 1588 精度时间协议 v2。为 5G RAN、金融服务和工业用途提供高精度时钟同步

RDMA

RDMA 是一种主机卸载、绕过主机的技术,允许应用程序之间通过网络进行直接内存到内存数据通信

多种尺寸形态灵活组合

可以拆分适配器,以1做多,减少验证并简化部署

也可以用极少的适配器阵列,实现数倍于传统适配器规模的性能

为什么选择采用英特尔® 以太网适配器方案

目前,已经全行业包括云服务、电信运营商、金融、医疗等跨国巨头选择英特尔以太网适配器,例如DigitalOcean、NxtGen、Mail.Ru和金山游戏云等。由英特尔以太网适配器构筑起的服务网络为这些巨头提供了极强的数据弹性、服务可靠性和广泛互操作性的质量阈值;获取具有动态设备个性化(DDP)配置文件包的表定义修改的部分可编程管道;使用英特尔® 以太网自适应虚拟功能(英特尔® 以太网 AVF)降低复杂性并简化升级。而新一代英特尔® 以太网 800 系列网络适配器又带来了应用程序设备队列 (ADQ) 、增强的动态设备个性化(DDP) 、远程直接内存访问(RDMA)等新技术,并将以太网速度从700系列的40Gbps提升到100 Gbps。

客户可以接受英特尔的终身支持,通过英特尔的技术、研发和制造资源走得更远、更快,利用英特尔® 技术进行扩展,推动企业更快向前发展,无论您处在哪个行业或现状如何,也不论您是选择构建还是购买,都有采用英特尔技术的解决方案提供您可信赖的所需性能、安全功能和可扩展性。

注:英特尔、英特尔标识以及其他英特尔商标是英特尔公司或其子公司在美国和/或其他国家的商标。*其他的名称和品牌可能是其他所有者的资产。 © 英特尔公司版权所

希望看到您的想法,请您发表评论x