A11芯片:无敌CPU+定制GPU+AI神经引擎

威锋网

A11芯片:无敌CPU+定制GPU+AI神经引擎

投稿by:小言来源:威锋网 PostTime:2017-09-14 14:58:50


  9 月 13 日凌晨,苹果在秋季发布会上正式推出了全新一代 iPhone 智能手机:iPhone 8、iPhone 8 Plus 和 iPhone X(发音为 iPhone 10)。这三款新设备的都搭载了全新的移动芯片,苹果称之为 A11 仿生(不是“Fusion”),并表示这是 iPhone 上有史以来最强大、最智能的芯片。

  通过发布会介绍的 A11 仿生芯片细节,不难发现苹果自主定制芯片野心非常大,可谓雄心勃勃。并且随着时间的推移,针对半导体芯片的定制设计越来越多,A11 达到了前所未有的高度。苹果在发布会中的幻灯片多次出现并多次强调,A11 仿生芯片内部的 CPU、GPU、性能控制器、神经网络单元、ISP 等这些都是苹果自己设计(Apple-designed)的。

  那么,关于苹果这枚“智能过人”的 A11 芯片,其亮点有哪些?对未来的重要影响又在哪里呢?


  自主设计的 CPU 内核:六个核心

  在 A10 芯片上,苹果推出了所谓的“Fusion”技术,CPU 采用新的四核心设计,拥有 2 个高性能核心和 2 个高能效核心。高低能效两种内核可以根据不同的需要,来达到理想的性能与能效表现。其中高能效内核用于应付密集型的重度任务,提升处理速度保证性能。而高能效内核则应用于日常事务,低能耗运行,从而保证电池续航能力的提升,享受更长的单次充电续航时间。


  最新的 A11 仿生芯片,苹果又向前迈进了一步。这一次 A11 仿生的 CPU 采用了六核心设计,由 2 个高性能核心与 4 个高能效核心组成。相比 A10 Fusion,其中两个性能核心的速度提升了 25%,四个能效核心的速度提升了 70%,性能与能效表现更加出众。关键是,苹果还准备了第二代性能控制器,因此可以同时发挥六个核心的全部威力,性能提升最高可达 70%,以应对多线程工作负载。

  对于六个 CPU 核心全部发挥性能这一点,究竟提升多大还不清楚,但至少在基准测试上,目前泄露的跑分成绩相当惊人。从下面图可以看到(10.2、10.3 和 10.5 分别对应三款新机型),A11 仿生在 Geekbench 4 的性能基准测试中,单核平均得分高达 4169,而多核得分也有 9837 将近一万的分数,秒杀所有手机行业内同基于 ARM 授权设计的移动处理器。


  对比自家,此前 A10 Fusion 的 iPhone 7 Plus 在单核模式下的得分约为 3514,在多核中则为 5970。而搭载苹果目前最强移动芯片 A10X Fusion 的最新 12.9 英寸 iPad Pro,单核跑分的成绩为 3924,多核则是 9371。若是对比 x86 平台的 2017 年款 MacBook Pro,这款搭载 3.1 GHz 英特尔Core i5 处理器的产品单核得分为 4274。当然,多核还是英特尔更强,毕竟没有在完全负载下跑分,但至少 A11 给 x86 阵营的低电压处理器带来了一定的威胁。

  A11 仿生的 CPU 性能澎湃已毋庸置疑,不过没有一台手机会时刻保持 CPU 多核同时高性能运行。因此,A11 仿生也会在性能核心与能效核心之间合理分配任务,智能地适当地管理任务,将轻量级的任务或后台任务交给高能效核心去处理,例如发短信或者浏览网页,很多日常做的事情大多交给高能效内核就能完成,耗电更少。

  此外,苹果还公布,A11 仿生芯片有 43 亿个晶体管。这就表示,A11 相比 A10 采用了更加先进的工艺制程打造,不出意外的话将是台积电的 10 纳米 FinFET 工艺制程。因为得益于新工艺,才能在既定面积之内塞进更多晶体管或先进的功能。如果 A11 芯片保持 125 平方毫米的尺寸,至少可将晶体管提高到 60 亿个,不过苹果在同一芯片区域内做了其他更多的工作。


  无论如何,虽然从早期 A4 到今天 A11 芯片,苹果无一不是基于 ARM 授权的指令集定制自主 CPU 核心,但始终能够能保持业内最强 CPU 性能的优势。所以,苹果没有理由不坚定走自主定制的道路,并且将优势进一步扩大。过去几年,竞争对手大多通过定制 ARM 内核并打造多核 CPU 的方式与 A 系列芯片竞争,起码不落下风,但今年苹果加入到多核的竞争中,性能领先优势再次扩大,对于高通、三星、麒麟等这些对手会如何回应,令人期待。

  苹果自主设计的 GPU

  之前苹果采用一直采用来自 Imagination Technologies 公司设计的 GPU 图形处理单元。不过,苹果早就已经确认将放弃 PowerVR GPU,改用将自主研发 GPU 图形芯片技术。苹果这一举动,直接导致 Imagination Technologies 公司在今年早些时候被迫挂牌出售。虽然 Imagination Technologies 认为在 2018 年之前苹果无法自主设计 GPU,但是苹果的举动就是那么意外。

  A11 仿生芯片的诞生证明了 Imagination Technologies 的推测是错误的。苹果在发布会上表示,A11 仿生芯片还整合了苹果自主设计的三核心 GPU 图形处理单元,图形处理速度与上一代相比最高提升可达 30% 之多。


  很显然,今年 A11 仿生芯片就能用上苹果自主设计的 GPU,这一点的确出乎很多人的意料,因为 Imagination Technologies 不认为苹果能够完全避开自家的 IP 知识产权、专利和保密信息,如果苹果从基础完全重新设计 GPU 架构而不侵犯 IP,这绝对是一项超级艰难的挑战。

  事实上,苹果不是无情抛弃 Imagination Technologies 的 GPU,反而是过去多年时间已经做了大量铺垫。可以说是 2013 年甚至更早,苹果就有了打造自主 GPU 团队的多个举动,很多 GPU 相关的移动芯片厂商被苹果收购,来自 IBM、AMD、飞思卡尔甚至是 Imagination Technologies 等公司的优质图形工程师人才被苹果抢到手。

  当一个 GPU 团队组建完成,再加上自主定制 CPU 的长期经验,相关 GPU 自主设计的工作也就顺其自然展开了。所以,其实从 A8 开始苹果就基于 Imagination Technologies 的 IP 定制 GPU,被誉为 GPU“心脏”着色器内核以及驱动都是自主完成设计。只不过到了 A11 仿生这一代芯片,苹果才真正公布了完全自主设计的 GPU。

  苹果没有透露太多自主设计 GPU 的细节,不过表示 A11 仿生的 GPU 图形处理单元已针对机器学习技术、新颖的沉浸式 3D 游戏和 AR 增强现实体验进行了优化。其中在 AR 方面苹果称,A11 能发挥六核 CPU 进行全局追踪、场景识别,GPU 图形处理单元还能配合进行惊人的 60 fps 高速处理,同时自主定制的 ISP 图像信号处理单元还可以实时进行光线预测,最后加上新双摄和重新校准的传感器,让 AR 体验更加超乎想象的流畅体验,且真实感达到了前所未有的新高度。

  A11 仿生只是苹果第一次自主设计 GPU 的尝试而已,虽然看起来是刚刚起步,但已经在 AR 方面发挥重大作用了,未来必然会往更重大的方向上前进。毕竟苹果为了保持行业的差异化,多年期就开始部署自主基础技术,围绕处理器或传感器技术展开工作,目的是掌握更高的控制权,打造属于自己最理想的图形性能、创新视觉和图形环境。

  神经网络引擎

  5 月份彭博社爆料苹果内部已经开始测试神经网络引擎,甚至是在搭载新 A 系列芯片的设备中测试,当时很多推测就认为 A11 非常有可能集成神经网络引擎。事实证明,A11 仿生成为了苹果第一枚神经网络引擎的 SoC 移动 芯片。那么,这一神经网络引擎有什么呢?

  苹果在发布会上解释,有一种 AI 人工智能叫作机器学习,即让电脑通过观察的方式进行学习。而神经网络引擎就是专为机器学习而开发的硬件,它不仅能执行神经网络所需的高速运算,而且具有杰出的能效。简而言之,通过神经网络引擎能够担 CPU 和 GPU 的任务,大幅提升芯片的运算效率,以更少的能耗更快的完成更多任务。


  在 A11 仿生中,苹果表示自家的神经网络引擎采用双核设计,每秒运算次数最高可达 6000 亿次。不过,苹果没有像华为那样透露具体的浮点运算性能(当时华为麒麟 970 的 NUP 在 FP16 下提供的运算性能可以达到 1.92 TFLOPs)。苹果表示,自家的 AI 单元主要用于胜任机器学习任务,能够识别人物、地点和物体,为“面容 ID”和“动话表情”等创新的功能提供强大的性能。

  其中对于 iPhone X 的“面容 ID”,面容 ID 功能会投射 30000 多个肉眼不可见的红外光点,然后将得到的红外图像和点阵图案传输给神经网络,创建脸部的数学模型,再将这些数据发送至安全隔区,以确认数据是否匹配。而且,就算样貌随着时间而改变,它也能随之进行调整适应。

  神经网络引擎是苹果在 A 系列芯片上的首次尝试,虽然目前服务的范围还很有限,更多的为 iPhone X 而设计,但未来这一 AI 单元很快会扩展到更多苹果生态的领域当中,包括无人驾驶汽车系统、AR 增强现实技术、Apple TV 和 HomePod 音箱等,让更多原本生硬的设备也能采用与人类同样的方式进行交互,变得真正会思考。

  A11让苹果有太多“过人”之处 静等对手

  在不到十年的时间里,苹果打造了一支世界级的芯片团队,并且在移动行业取得了巨大的成就,这令人难以置信。尽管大多数时候我们只简单看到了表面上的性能收益,但随着苹果越来越重视芯片和内部组件的定制设计和研发,除了无可比拟的性能优势之外,特定领域的功能特征上也形成巨大的竞争优势。

  有了最好的应用生态,最好的定制级移动处理器,最受赞誉可完全掌控的操作系统,可以说苹果的软硬件整合能力越来越强大了。这种碾压级的优势很多 OME 手机制造商根本难以与之竞争,部分原因在于,首先大多数智能手机制造商起步太晚,再者很多厂商负担不起的相关和巨额的研发支出。

  因此,对于苹果在手机行业的竞争对手而言,直接从高通这样的芯片公司购买方案显然更简单,也更可取。就拿 AI 单元来说,除了苹果和华为已有 NPU 神经网络单元之外,高通从 2014 年开始也公开了 NPU 的研发,并且在最新两代骁龙 8xx 芯片上都有所体现,例如骁龙 835 就集成了“骁龙神经处理引擎软件框架”,提供对定制神经网络层的支持,OEM 厂商和软件开发商都可以基于此打造自己的神经网络单元。

  其实 ARM 本身早已在神经网络上发力,今年所发布的 Cortex-A75 和 Cortex-A55 都融入了 自家的 AI 神经网络 DynamIQ 技术。ARM 声称,通过 DynamIQ 技术在未来 3-5 年内实现比当前设备高 50 倍的人工智能性能,可将特定硬件加速器的反应速度提升 10 倍。很显然,AI、神经网络单元、机器学习等这些词,今天只是开始而已。

  因此苹果对手实现超车是可能办得到的,就像华为买的寒武纪的 NPU 授权,小米的澎湃也可以去买,三星自己定制的 Exynos 完全可以基于 DynamIQ 技术,其他厂商只要采购高通芯片即可。当然,苹果不会止步不前,而且正如前述,苹果庞大的闭环生态链是其“过人”之处。更重要的是,苹果正逐渐拥有更多核心技术,所以我们看到了自主 S 系列芯片、T 系列芯片和自主储存控制器等,未来还会更多,持续占据主导地位。


© Joyslink Inc.