Communication&Information Technology|热点技术I2021/01| 张剑峰赵凌齐',罗林春;赵川斌'
(1中国电信股份有眼公司四川分公司,四川成都610041;2中国电信股份有眼公司宜宾分公司,四川宜宾644002)
摘要:围绕对GPU技术及AI技术与应用展开深入研究,探索了GPU与CPU的架构原理、应用趋势,分析AI技术核心要素及AI芯片应用趋势,介绍国内GPU云服务器的市场现状格局。论述GPU云服务器的应用空间,对未来运营商在GPU云服务器资源布局方向提供建设性战略指引。
关键词;GPU;CPU;GPU云服务器;AI;芯片
中图分类号:TP29文献标识码:B文章编号:1672-0164(2021)01-0033-03
1绪论
云计算时代的到来,虚拟化技术将应用软件与系统硬件全面解耦,同时推动发展rr架构一些列分布式的技术与应用。 这里以深入研究GPU和AI技术为核心,推论AI技术与应用的趋势发展,介绍国内GPU云服务器的市场现状格CPU具备完善的Control、DRAM、Cache、及ALU;而GPU省略掉了Control和大量的Cache,设计更多的ALU计算单元”
硬件设计上,冯诺依曼架构的CPU包含控制器单元(Conttol)[\运算器单元(计算逻辑单元ALU)、及高速缓冲存储器Cache、主存储器DRAM;CPU更利于先后顺序的串行处理。而GPU芯片硬件架构设计,没有控制器单元,节省出更大的空间设计成更多的小且高效的计算逻 局。论述GPU云服务器的应用空间,对未来运营商在辑单元(ALU),每列计算单元分配一份高速缓冲存储
GPU云服务器资源布局方向提供建设性战略指引。
2GPU云服务发展解析
2.1CPU与GPU的发展
追本溯源,当今云计算时代的所有云端的计算资源,仍以总线结构的冯诺依曼结构计算机为基础的,冯诺依曼结构的计算机即通过系统总线以二进制制式处理输入的数据后进行结果输出,包括五大组件:运算器、控制器、存储器、输入设备、输出设备。
CPU(CenttalProcessing Unit)称为中央处理器;作为计算机系统的运算和控制核心,主要完成处理指令、执行操作、控制时间、处理数据;着重是面向数据的处理。
GPU(Graphics Processing Unit)称为图像处理器;是一种专门图像运算工作的微处理器,又称显示核心、视觉处理器、显示芯片;主要面向2D、3D的图形处理与HPC(高性能计算)。锁架
两者的硬件架构有着本源的区别,如图1所示,器,这种架构使得GPU能够同时处理多任务而实现高性能的并行计算。
图1GPU与CPU硬件架构图闵
缓勸存储漿存/存储缓存/存储缓存/存储图2CPU的串行运算与GPU的并行运算示*图
通信与信息技*2021年第1期(总第249期)|
33
2021/01|热点技术I Communication&Information Technology
GPU缺少控制单元,不能脱离CPU而独立工作,必须由CPU进行控制调用才能工作;为了满足大规模并行处理的业务需求,产生了具备CPU通用计算处理能力的GPU,称为GPGPU,主要是具备GPU的并行计算工作能力,同时具备协助CPU通用计算运算的能力。随着AI技术应用的发展,近些年也出现了NPU(嵌入式神经网络处理器),采用"数据驱动并行计算”的架构葺擅长处理视频、图像类的海量
多媒体数据。基于CPU的衍生芯片可以说是百家争鸣,以至于除了CPU以外的芯片统称为XPU pl o NVIDIA公司2007年开创了并行处理编程语言CUDA (1.0版),称为"通用并行计算架构”(统一计算设备架构)[4],促进CPU与GPU并用的"协同处理”发展;时下CUDA体系结构已经具备完善的开发库、运行期环境、驱动,是推动CPU与GPU融合发展的积极推动者与践行者。
2.2GPU虚拟化与GPU云服务器的应用
GPU虚拟化主要包含硬件虚拟化及软件虚拟化。硬件的虚拟化GPU硬件提供厂商主要是Intel和NVidia AMD。在虚拟化场景的应用中,AMD的SR-IOV是完全基于硬件技术,NVidia的GRID是硬件与软件相结合的技术。
Intel的虚拟化方案包括有API转发,硬件直通,全虚拟化。其中硬件直通是PCI中通用的解决方案,其他GPU厂商也能支撑。软件虚拟化也出现了像KVMVMWare 等软件实现虚拟化。
目前流行的商用GPU虚拟化方案可以分为以下几类: GPUS通模式,GPU SRIOV模式,GPU半虚拟化(mediatedpassthrough:包括Intel GVT-g和Nvidia GRID vGPU),VMWare的GPU全虚拟化(vSGA)。
均质泵GPU云服务器是指具备GPU资源卡的云端服务器,以提供GPU的差异化计算能力。GPU云服务器产
品形态是云端服务器含GPU插卡,GPU插卡的运行工作方式也分为直通或共享:直通,硬件一对一透传给租户应用系统,跨过VM虚拟化平台层直接调用GPU资源;共享,硬件一对多轮巡使用,通过VM虚拟化平台调用GPU资源。
因GPU插卡数量受限于服务器PCI插槽数,通常GPU云服务器的GPU资源均以VGPU虚拟化(一张卡虚多个VGPU供多个租户使用、多卡虚拟一个用户使用)技术方式进行共享式使用。
目前国内各家云服务提供商(包括阿里、腾讯、百度、华为、运营商的中国电信天翼云),均已拥有自己的GPU资源池布局,已面向公众用户提供差异化GPU云服务器产品服务。
星空轮3AI应用发展解析
3.1AI技术的核心要素解析
AI(Artificial IntelHgence)为人工智能。人工智能可以分为"人工”和"智能”。前者是让机器可以替代人的劳作,后者是让机器可以拥有人类一样的智慧(包括意识、思考、学习等)。AI技术将计算机的信息录入、信息处理、信息输出、信息存储等仿生于人类的学习过程,进而让计算机拥有人类的工作能力或思考学习能力。
如何实现人工智能的愿景,其核心本质是解决人工智能的三大要素问题:计算力、算法、大数据。
计算力:计算机对录入信息进行加工处理、深度学习,拥有强大的并行计算能力是AI技术发展应用的基石,犹如电力对电器的支撑一般。
鼠标笔算法:计算机对录入信息如何做到高效的学习理解,拥有精确的算法是AI技术的灵魂。
大数据:计算机对学习处理的结论输出,越宽泛的周界将会越精确,拥有海量的数据来源供算法提纯精炼,是助于AI应用发展的基础。
3.2 AI芯片发展解析
风动旗杆
AI技术的发展与应用,初始阶段均以GPU支撑AI的计算能力需求,AI初创公司都是在GPU上做软件算法,然后集成到现成的服务器做落地应用;实力雄厚的AI科技公司,会潜心专注自己的AI芯片设计研发,以通过芯片硬件实现AI计算力的显著提升(利用MAC"乘加计算”加速阵列对CNN"神经网络”中最主要的卷积运算进行加速)。
AI芯片的应用分类:
(1)云端:谷歌TPU,英伟达GPU.
(2)设备端:PC、手机、pad等。
(3)物联网网关端。
AI芯片应用领域:智能手机(终端)、ADAS自动驾驶辅助系统、CV计算机视觉、VR、语音交互、无人机、安防监控等。
AI算法的淬炼提升,是人类智力运动的共同结果,差异化将会拉平,而硬件层面的芯片产品竞争将会加剧,伴随着GPU与CPU逐步走向统一计算架构的趋势,最终AI芯片的XPU也将会与GPU逐渐相融合。
4实践研析
实际调研了四川省成都市道桥处的一个项目实践,道桥处业务需求是日常对道路桥梁表面的主要病害检测与维护,其中病害包括:路面破损、路面积水、裂缝、沉陷、桥梁水位等io余种,原来是采用人工开车巡检,出现故障拍照方式进行取证及处理,效率低下。
34
四川道桥积极倡导数字化转型,与中国电信天翼云进行战略合作,对成都二环路探索5G+云+AI的智能视频巡检解决方案的实践;中国电信对成都二环路进行5G的基础设施建设覆盖,将巡检车辆进行改造增加前置/后置的监控摄像头,巡检车辆行驶过程中,实时的将监控图像以1080P高清制式通过5G回传
至业务平台进行AI的智能分析处理,业务平台部署至天翼云的GPU云资源里,通过GPU资源为平台的AI分析处理提供算力,AI实现智能的道桥病害分析,精准及时发现病害,业务平台再对接工单业务系统,实现业务需求的定向维修工单派发及告警通知等业务闭环。
四丿11省成都市道桥处的智能巡检解决方案实践是国内首个采用5G+云+AI的业务创新,智能识别替代人工巡查,实现从病害发现、维修、验收全业务智能闭环,及时高效发现病害。可向全国道桥行业复制,对于其他行业也有一定的指引作用。
云计算时代,基础算力是一切应用发展的基石,当前仍是以CPU为主的云资源池建设为主。当一系列新技术的演进,新需求、新应用也将破壳而出,将会对云计算带来一系列或深或浅的变革。智慧生活的未来对图像视频业务处理的泛化需求,都向我们预示着未来前进的方向,未来将会以图像视频为数据源进行深度学习与应用,AI终将伴随生活的每一个角落,而为AI支撑基础计算力的,将会由CPU向GPU演进,AI公司百家争鸣的XPU最终也会遵循统一计算架构走向统一。
5总结
国内的电信运营商,当前已经成功的转型为云计算服务商,对云计算GPU资源池的战略规划部署,是成为未来云计算服务资源及能力的关键点。在未来万物互联的生活里,拥有网络资源服务能力的运营商,应该是抢占AI应用发展赛道中计算力能力支撑服务的最佳主角。、
参考文献
[1]张建明,姚琴琴,张蔚,等.具有吗•诺依曼结
构的随机漂移粒子优化方法:201710173917.
5[P],2017-06-20.
[2]高源.面向大数据处理的并行计算模型及性能
风叶
优化[J].计算机产品与流通,2020,000(003):105-105.
[3]N Khammassi,JCL Lann.Tackling Real-Time
Signal Processing Applications on Shared Memory
Multicore Architectures Using XPU[C]//Erts,
February5,2014.
[4]Yang C,Li Y,Cheng F.Accelerating
k-Means on GPU with CUDA Programming[J].I0P
Conference Series Materials ence and Engineering,
2020,790:012036.
作者简介
究方向:云计算。
赵川斌(1985—),男,硕士,主要研究方向:
张剑峰(1975-),,男,学士,工程师,主要研究方向:云计算。
赵凌齐(1997—),男,学士,主要研究方向:云计算。
罗林春(1997—),男,学士,工程师,主要研云计算、移动通信。
(上•揍第50页)
毫米波具有频段高、带宽大、方向性好等特点,但毫米波由于频段高,其自由空间损耗损耗大;毫米
波的传输受限于诸多环境因素,如大气吸收、雨衰等;最后毫米波绕射能力差,容易被楼宇阻挡和反射。这一特性使毫米波很难应用于宏覆盖网络建设中,但将其作为5G高铁列车室内分布系统建设,其优势可以得到最大的发挥,同时其存在的不足,在高铁列车室分建设中,将可能成为优势。例如毫米波绕射能力差,容易被楼宇阻挡和反射的问题,可以很好地实现将毫米波信号限定在高铁列车车厢内,避免了与列车车厢外的信号互相干扰。、
参考文献
[1]焦燕鸿,王韬,李富强,马向辰,尧文彬.5G高铁
无线网建设关键技术与解决方案研究[J].电信科学,2020(06).
[2]何宇.5G在高铁场景下的覆盖分析[J].中国新
通信,2020(05).
[3]李新,陈旭奇.5G关键技术演进及网络建设[J1.电信快报,2017(11).
作者简介
李新(1977年一),男,高级工程师,研究方向:主要从事移动通信网络规划、设计等相关工作。
通信与信息技术2021年第1期(总第249期)|35