www.245678.com
从阿里平头哥含光芯片的发布解读AI芯片的发展历
发表时间:2019-09-30

  9月25号,云栖大会在杭州开幕,在此次大会上,最受人瞩目的便是阿里巴巴含光800AI芯片的发布。“平头哥”的发布人员介绍称含光已经成为“全球最高性能的 AI 推理芯片”,在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。至此,此次发布的芯片 “含光”,与 2 个月前发布的嵌入式 CPU“玄铁”和 1 个月前发布的系统芯片平台“无剑”遥相呼应,三大上古神剑终于聚首。

  追溯到AI的源头,AI这个词诞生于1956年的美国。一群科学家聚会在美国汉诺思小镇宁静的达特茅斯学院,他们试图利用暑假进行两个月封闭式的讨论和研究,而这次会议的主题就是“达特茅斯夏季人工智能研究计划”。 虽然这个会议实际只进行了一个多月,最终也没产生什么有影响力的研究成果,但是这个会议首次正式提出“人工智能”一词,Artificial Intelligence,AI,一直沿用至今。这次会议也就被认为是人工智能诞生的元年了。但是,在其后的多年,废柴男主热血逆袭的玄幻小说《吞天记》上榜第,由于处理器运算能力不足,人工智能的发展受到了硬件的限制,一直并未有实质性的进展。

  由于主流基于冯诺依曼架构的CPU处理器每一次的计算都必须撷取并译码指令,以及收集并储存数据于缓存器档案中,因此其效率无法应对当今的AI处理任务的要求。目前,主流的AI应用芯片主要分为GPU、FPGA以及ASIC专用芯片三大类,所谓TPU、NPU等概念,无非是以上三类芯片理念的组合与延申。三类芯片各有特点,未来将应用于AI应用的不同场景之中。

  从功能上来看,人工智能可以分为Training(训练)和Inference(推理)两个环节。如果笼统的用拟人化的比喻,训练环节相当于学生在学校的学习过程,通过不断对于题库中的内容进行训练,晚上自身解题的方法(即算法),提高做题解题的效率以及准确程度。而推理环节,则是在各类考试的实战中,发挥自身解题的能力,解决实际的考试问题。

  从应用场景来看,人工智能芯片又分为云端和设备端两大场景。云端(包含公有云及私有云)主要承载着大规模运算的任务,主要与各大云服务商绑定(阿里云、AWS等)。而设备端(即所谓边缘运算的概念),主要目的是在终端设备实现部分的推理过程,节约带宽以提高运算效率。由于大部分设备具有电源电压散热等限制,甚至用电池进行供电,所以能效比则成为了终端运算芯片设计的关键要素。针对于以上两个维度,GPU、FPGA以及ASIC根据其特点则对应了不同的主应用场景。

  GPU的全称是Graphic Processing Unit,即图形处理器,其在AI领域的应用可追溯至2011年。当时,谷歌AI专家吴恩达在训练图片识别算法时,利用12片GPU代替了2000片CPU,通过深度神经网络学习让机器在一周之内学会了识别猫,也拉开了GPU在机器学习应用中的序幕。相比于CPU,GPU拥有多核并行计算的基础结构且核心数非常多,可以支撑大量数据的并行计算,而深度学习在大数据训练中需要大量的并行的重复计算,也正符合GPU的特点。因此,直到今天,GPU仍然的广泛应用人工智能从训练到推算的全流程中,也仍然在深度学习训练中具有绝对的性能优势。在目前的市场中,美国巨头Nvidia的GPU具有近乎于垄断的地位,竞争对手AMD的GPU虽然在图像处理领域已经有一定成就,但在人工智能领域的性能仍有较大差距。今晚管家婆开奖结果

  FPGA全名叫“现场可编程逻辑阵列”,它本质是一种可编程的芯片。人们可以把硬件设计重复烧写在它的可编程存储器里,从而使FPGA芯片可以执行不同的硬件设计和功能。另外,你也可以在使用现场动态的改变它上面运行的功能,这就是为什么它们被称作“现场可编程”的原因。事实上,你可以每隔几秒就改变一次FPGA芯片上运行的硬件设计,因此这种芯片非常灵活。相比于CPU的通用架构,FPGA可以把指令锁定在架构上,然后在上面运行数据流,因此,针对于特定算法的运算效率会大幅提高。而与此同时,可编程的灵活度带来了其在不同场景算法之间切换的能力,因此,FPGA目前成为了众多企业在云端与设备端推断的选择。在市场上,包括Intel、微软等巨头均在FPGA上下了重注,同时也诞生了专注于此方向的龙头XILINX赛思灵。国内近年来也涌现了如深鉴科技(已被赛思灵收购)等独角兽企业,目前FPGA在边缘运算领域的应用已十分广泛。

  含光800所属的ASIC芯片全称为Application-Specific Integrated Circuit( 应用型专用集成电路),是一种专用芯片,是为了某种特定的需求而专门定制的芯片的统称,而我们在文中特制的就是AI领域的专用芯片。顾名思义,AI专用的ASIC芯片就是为特定的推断算法而设计,整体架构都直接根据特定的算法的需要进行定制。相较于我们常见的CPU、GPU等通用型芯片以及半定制的FPGA来说,所以其可以实现体积小、功耗低、高可靠性、保密性强、计算性能高、计算效率高等优势。以比特币挖矿举例,在比特币诞生之初,由于挖矿效率较高,对于算力要求也不高,早期人们大都直接采用电脑的CPU来“挖矿”。随后,随着挖矿难度的加大,大家便转向开始采用效率更高的GPU来挖矿。直到2013年左右,低成本灵活性强的FPGA才被用于挖掘比特币。而随着挖掘比特币所需的算力越来越高,以及挖掘成本(主要是电费)的提升,主要的矿机厂商都开始采用能效更高的ASIC芯片取代了GPU/FPGA来运行比特币SHA-256哈希算法。正因为这些ASIC芯片是针对运行SHA-256哈希算法而设计的,这也使得它在挖掘比特币的能效上要远高于CPU/GPU/FPGA,可是说是现阶段挖矿的“终极答案”。当然,ASIC芯片的缺点也很明显,因为其是针对特定算法设计的,一旦芯片设计完毕,其所适应的算法就是固定的,所以一旦算法发生变化就可能将会无法使用。由于ASIC芯片定制化、非标准化的特点,整体市场呈现出更加分散百花齐放的态势,诸多人工智能应用领域的企业均在自身场景算法对应的ASIC芯片领域有所投入。

  在了解完历史及现状,我们说回含光800,在这次发布会中,平头哥的含光800选取了ASIC芯片所擅长的特定算法推理环节的应用,与Nvidia GPU相对薄弱的环节进行了对比,有取巧的嫌疑。但从其公布的硬性指标看,笢弊腔楷桯岆岍賜腔儂郣ㄗ鏍夤萸ㄘ 2019-09-21!其推理运算能力已达到了较高的水平。同时,图像识别处理作为人工智能中目前发展最快,垂直场景应用最为成熟的细分领域,含光800的推出无疑提升基于阿里云的云端公有算力,降低算力的成本与价格,促进整体应用的发展。(云一资产:叶桦)



友情链接:

www.245678.com,黄大仙救世网,78345.com,www-78345.com,6合开奖结果,看开奖,手机看开奖结果,123kkj看开奖。

今晚开码结果| 本港台报码室| 今晚六合开奖结果| www.8647.com| 4987铁算盘开奖结果| 九龙老牌图库看图区| 香港正版挂牌之曾道人| 黄大仙救世报加大版| 解香港跑狗图的网站| www.6200444.com| 凤凰网| 手机看开奖|