一直以来,AI 芯片在性能、功耗、延时方面的表现,主要依赖芯片算法、架构和工艺制程创新。人工智能时代的计算芯片,已从传统的 GPU 和 CPU,发展到专用的芯片 TPU /NPU 等,但这些芯片仍然在采用冯诺伊曼架构。
在冯诺伊曼架构中,大量数据搬运会带来功耗、效率等内存墙问题及灵活性问题,为克服该问题,近年来出现了存内计算、可重构芯片架构、异构等芯片架构,力图在 Memory 端打破存储墙限制,让能效有 1-2 个数量级的提升。
12 月 4 日,在 SynSense 时识科技主办的 2020 年类脑技术开放日会上,DeepTech 借机采访到了 SynSense 创始人乔宁。据悉他从中科院博士毕业后,于 2012 年前往苏黎世大学做博士后研究,之后转做助理教授,一直专注于超低功耗亚阈型模拟电路加异步电路的类脑相关研究。
因此,SynSense 时识科技的核心技术也起源于苏黎世大学与苏黎世联邦理工学院,涉及先进的数模混合神经形态处理器与神经形态算法研发成果,创始成员在 Nature/Science 等顶刊及类脑顶级国际会议期刊已发表过 700 + 篇论文 、引用量近 16000 次。
中外科学家携手创业
谈及创业初衷,乔宁表示:“类脑芯片,实现了算法层面包括芯片架构层面的全新变革。首先,类脑计算基于全新的算法;其次,全并行的运算架构打破了冯诺伊曼架构的束缚;另外,事件驱动的运算机制导致整个类脑系统在性能上有质的提升。所以,这不仅仅依赖于计算机理论体系,更融合了生物学理论体系,通过模仿神经元突触、神经脉冲等生物行为的工作机制,实现芯片在算法及架构的颠覆性创新,从而带来性能、功耗、延时等方面有极大提升。”
2017 年,乔宁和 Giacomo Indiveri 共同创立该公司,后者担任联合创始人兼首席科学家,其还是苏黎世大学与苏黎世联邦理工学院终身教授、苏黎世神经信息研究所 INI 所长。两者的携手创业,都是出于对类脑芯片技术发展的看好。目标是为一系列 AI 边缘运算应用场景提供开创性的亚毫瓦级超低功耗、超低延时的芯片设计及解决方案。
而谈到该公司更深的渊源,其实还与一位教父级人物有关。神经形态计算(Neuromorphic Computing)被称为类脑计算,该概念最早来自于加州理工学院的超大规模集成电路之父、摩尔定律的提出者之一卡弗米德(Carver Mead )教授。
图|神经形态电子学
1995 年~1996 年期间,卡弗米德的 6 个学生来到苏黎世大学,并成立了神经信息研究所,其中主要包含三位学者三个方向,分别是做动态视觉传感器(Dynamic Vision Sensor)的 Tobi Delbruck、做硅耳项目(Silicon cochlea)的 Shih-Chii Liu,以及做类脑芯片研究的 Giacomo Indiveri。
那时,Giacomo Indiveri 在卡弗米德课题组里主攻神经拟态工程相关研究,他利用工作在亚阈值的晶体管的电学特性,来模拟生物神经元及突触的工作机制,这一研究方向的发展主要依赖于亚阈值模拟电路和纯异步数字电路,相关研究积累为现在 SynSense时识科技的核心技术领先性提供了保障。
目前,除了SynSense时识科技之外,世界上有两家科技巨头在类脑芯片领域有所探索,IBM 曾于 2014 年推出 True North 芯片,Intel 于 2016 年设计了异步脉冲神经形态芯片 Loihi,而量产的可商用的类脑芯片,市场上其实还没有。
图 | 神经形态计算发展流派
功耗降低 100-1000 倍
对于该公司的芯片,Giacomo Indiveri 教授表示:“我们的类脑芯片目的并不是要取代 CPU 和 GPU,而是要提供可以放在机器人和物联网终端设备的实时传感,是一个非常低功率,紧凑而小型的计算单元。”
做 AI 技术的历代科学家,虽没有承认自己做神经形态计算或者类脑计算,但其实也是在想从 “脑” 再挖掘点东西。Google "TPU"、百度 “昆仑”、阿里平头哥 “含光”、寒武纪 “思元” 等 AI 芯片都在寻找提升 AI 能力的可能性。
谈及类脑芯片的最大优势,乔宁介绍,类脑技术可以做出不耗电的实时传感器信息处理系统。在物联网端上,传感器对环境信息提取模拟信号通常是第一步,在靠近传感端,把动态的信息先离散化数字化,只有动态信息发生的时候,才会实时生成数据,而处理器只能被动的由数据驱动运算(Data-driven computing)。”
而 SynSense时识科技提出的全新方案 —— 事件处理器(Event Processor),这类处理器芯片运算机制是基于脉冲 / 事件触发的运算,可以用于一维的实时传感器信号分析或是二维的图像信号处理,事件触发及数据驱动运算,将能使整个传感器系统在没有动态信息发生时完全不耗电。
图 | 各类芯片架构概览
颠覆传统芯片的技术路径——不耗电的事件处理器
乔宁认为,从芯片的电路实现上,类脑芯片的形态可以分为几种:
一是同步电路芯片,这主要是通过 EDA、通过传统的电路来设计;
二是同步电路与异步电路混搭,比如在类脑芯片中利用同步电路实现单核设计、利用异步电路完成多核的通信;
三是纯异步电路实现,不管单核运算或者多核交互,里面所有的运算及通讯单元都遵循事件触发的机制;
第四种更高阶的形态,则是异步电路加亚阈值模拟计算。在这种最高阶的研究中,苏黎世神经信息研究所有多年的深入研究及积累,他们最新的处理器芯片在 28nm 的工艺下,利用晶体管亚阈值模拟特性模拟生物形态的曲线,利用 pA 到 nA 级电流完成神经网络计算,能效较纯数字解决方案有 1-2 个量级的提升。
类脑芯片的另一个重要特征是实时性,它可以处理的最佳事件类型不是云端运算,而是端上的传感器信息,例如语音或手势识别或心跳生物信号。
Giacomo Indiveri 教授补充称:“这些端上的实时的传感信息是我们的芯片最适合处理的信号,具有可配置的动态参数来匹配环境传感器的动态信息,在近传感器的芯片端完成运算及决策,不需要与云端产生传输数据。这就是为什么我们可以以低带宽、低功耗来高效处理这些实时信息的原因。”
图 | DYNAP-CNN
在可扩展性上,SynSense 研发的 DYNAP-CNN,是世界上第一款直接能对接事件相机的专用视觉处理器,芯片具有极强的可配置性,可以支持复杂大规模 SCNN 模型及算法。
其基于相机事件触发的运算机制打破了帧的限制,可以实现 5-10ms 端到端识别响应延时;基于稀松数据的动态数据运算,可以实现 < 1mW 超低功耗,较传统解决方案功耗降低 100-1000 倍。
在系统级上,因为基于传感器 — 处理器直接对接的实时数据运算,无需缓存、系统成本降低 50%,整个系统级基于传感器数据触发运算,可以实现真正的 always-on,可广泛落地于智能家居人机交互、智能机器人、可穿戴设备、智能安防、工业互联网等领域。
除了视觉之外,SynSense 团队还专注于低维度的传感信息处理,这类芯片里面实现的是脉冲递归神经网络(SRNN)。基于独创的算法,该芯片的硬件资源消耗量比传统解决方案降低至少在一个量级以上。
另外,由于基于稀松动态数据的触发式运算,整个系统的运算功耗也极低,基于全新芯片的体征信号检测等应用,如心电信号异常检测,其总体功耗将低于 100uW 。
One more thing
此外,全新类脑计算专刊:NCE 期刊,已在 12 月 1 日由英国物理学会出版社 (IOP) 正式推出。NCE 为 “Neuromorphic Computing and Engineering” 的简称,这将是一本涵盖多个学科领域、采用开放获取形式出版的期刊。
NCE 将主要关注神经形态计算、设备和系统的应用和发展,是神经形态计算领域的专业期刊,而 SynSense 联合创始人及首席科学家 Giacomo Indiveri 将出任该期刊主编。期刊之外,SynSense 还将与苏黎世神经信息研究所一起,联合主办世界第三大国际类脑研讨会 SynSense Neuromorphic Workshop(SSNW),该研讨会计划于每年 10-11 月在中国举办,加速类脑技术国内发展及落地。
当天会上,演讲嘉宾清华“天机芯”研究者之一邓磊博士这样评论 SynSense 时识科技称:“类脑计算还没有形成像人工智能那么有体系的一个迭代发展的生态,与 7、8 年前做卷积神经网络一样,现在处于认识逐渐清晰且大家从不同的角度去推广的一个阶段。如果不做,那么以后中国在这个领域就一点话语权都没有。”
据悉,邓磊是美国加州大学圣塔芭芭拉分校(UCSB)电子计算机工程系博士后研究员、清华大学类脑计算研究中心博士。在活动现场,他对 SynSense 这家即将把类脑芯片商业化的公司给予了较高肯定。邓磊最后对 DeepTech 补充评价称:“不管是像乔宁推的终端应用,面向场景做深度定制,还是像我们研究大型的基础平台的建设,以及高校在研究的类脑模型和算法,其实都是站在不同的角度,以后都会融会贯通起来。”