(资料图片)
作者:易客
2022年,国家全面启动了“东数?算”?程,即通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部地区的算力需求有序地引导到西部地区,优化数据中心的建设布局,促进东西部协同联动。在此新形势下,各大云厂商纷纷开展技术创新,强化算?资源布局,?争在“算??络”中抢占?地。
康文静是半导体和计算机领域国际顶尖企业(2022年世界排名145名)的高级技术专案经理,广泛涉猎计算机领域的各项前沿技术,对行业市场动向有独到前瞻性眼光。2019年,中国通信领域排名前三公司之一首次提出为数据中心配置智能网卡需求,康文静作为该项目的牵头人,在当时中国缺少智能网卡软硬件开发能力,同时政策大力扶持和驱动的市场环境下,率先联合多个部门,为客户创新开发了一款基于现场可编程逻辑门阵列(FPGA - Field Programmable Gate Array)的
基础设施处理单元(Infrastructure Processing Unit,IPU),或称智能网卡,为该公司继续站稳中国运营商云数据中心市场奠定了扎实基础。
为了更好的服务处于数据中心新兴阶段的中国市场,康文静推动公司改变以往仅服务具备软件自研能力的云客户的发展战略方针,转变为对中国有潜力的云客户定制开发全套基础软件方案,包含驱动层、虚拟适配层和应用层,包括 VirtIO、DPDK、SPDK驱动代码,GENEVE、VXLAN等协议栈代码,以及智能网卡管理软件。
该公司之所以改变服务战略,是康文静经过调查和研究13家中国云计算服务商,总结出中国数据中心对智能网卡需求的共性,以及在未来几年中智能网卡需求量将持续高速增长,特别是有着相当辽阔的市场前景的运营商云服务。康文静从专业技术出发,深入了解数据中心行业痛点:在企业租用多个服务器时,横向的服务器和服务器之间的流量增加,处理这些横向网络流量所需的内核数量呈指数级增长,会占用大量内核计算资源,严重降低租户可用计算资源所占的比例。在传统数据中心的架构中,通常借助传统的网卡 (Network InterfaceCard,NIC) 产品来负责执行物理层与数据链路层的数据流量处理,而更高层的功能则需要处理器等计算资源的参与。而在提供云服务过程中,这一情况则更为突出。处理器不仅要处理网络和存储虚拟化接口收发的报文、OpenvSwitch (OVS) 等虚拟交换技术的报文转发,还要处理数据安全加解密算法,同时管理虚拟机或者裸金属服务。这样的发展趋势伴随着数据规模的不断增大?(端口带宽正逐步从?25G向100G乃至更高演进),裸金属服务对安全的需求加深,以及轻量化容器部署的普及,对云数据中心带来巨大挑战。
因此,各个云数据中心亟待寻求一种全新的智能架构来突破行业技术瓶颈。在康文静的牵头和协调下,召集了公司各个领域的开发小组,包括负责网卡、FPGA和SoC处理器这三个独立的部门,整合成一个虚拟开发团队(virtualdevelopteam),对客户的数据中心基础设施卸载的需求做了全面的分析,梳理构建客户所需的软硬件架构并推动内部四地(美国、印度、爱尔兰、中国)三部门协同开发,最终推出了公司第一套完整的软硬件解决方案,将数据平面,控制平面以及 Hypervisor 等基础设施管理负载和云服务基础设施能力都从主机服务器中卸载,一方面让宝贵的算力资源更多地用于用户关键业务,另一方面也通过将各种能力卸载到专用设备获得加速,有效提升各种数据处理负载的执行效率,来全面帮助云数据中心构建新的基础设施能力加速引擎。
在康文静的牵头领导下,开发团队为中国最大移动通信商云服务器提供了智能网卡IPU解决方案,其搭载至强®服务器,成为中国市场上为大型的云服务器厂商提供可以卸载网络服务器流量的第一个成功方案。2021年4月,基于IPU架构的计算型裸金属服务器发布, 2022年6月,基于IPU的第四代云主机——计算增强型虚拟云主机发布,这两款云服务实现了网络、存储算?卸载,突破了云服务性能瓶颈,降低了算?损耗同时提升了算?编排效率;这款同时实现了云主机与弹性裸?属基础技术架构的统?,完成计算、存储和?络能?体系的融合,夯实算??络底层设施基础,充分提升了客户既有技术架构的优势。
通过横向与行业顶尖竞争对手的技术对比分析,结果显示,这款定制化服务器性能已经达到了业内前三的水平。因此项目,康文静在公司荣获SMG市场销售技术部门技术进步奖(Technical Advance Award)、最佳部门组织奖(Department for Organizational Award)等奖项。目前智能网卡项目在国内仍处于起步阶段,康文静继续牵头领导开发团队将方案推向第三方智能网卡合作伙伴,加速IPU产品在中国二线云客户的合作落地。根据麦肯锡2020年的预测,2025年在中国将会有$1.46B IPU产品营收,未来不可限量。
广告