清华魏少军:大部分AI芯片创业者将成为这场变革中的先烈 | 数盟

3 月 9 日,智东西、极果和 AWE 联合举办的 GTIC 2018 全球 AI 芯片创新峰会在上海举行。

在人工智能备受关注的今天,中国的 AI 芯片产业正在迎来最好的发展时机,初创公司层出不穷,并出现了寒武纪这样的独角兽。

然而盛世之下,似有隐忧。

“两到三年内,我们一定会碰到一个低潮,这是不可避免的。今天的一部分,甚至是大部分的创业者将成为这场技术变革当中的先烈。”

清华大学微纳电子系主任、微电子所长魏少军教授在大会上直言不讳。

在他看来,目前还不存在适应所有应用的通用算法,所以应用领域的确定是 AI 芯片发展的一个重要前提,AI 的杀手级应用到目前为止还没有出现。因此,AI 的发展还有很长的路要走。

以下是魏少军教授演讲全文,AI科技大本营整理,略有删减:

我是做芯片设计,研究芯片设计及其理论的。

两年前我们尝试做了一下 AI 芯片,效果不错。后来,(我们)在国际上连续发表了一些有影响力的论文,有些被 MIT Technology Review 所引用。所以突然间,我发现了自己成了 AI 芯片的专家,其实不是

今天跟大家做一些沟通,主要希望提出一些可能跟我们在坐的大佬们不太一样的观点,供大家评判,我的演讲题目是《人工智能发展需要应用和架构驱动创新双轮驱动》。

一、芯片是实现 AI 的当然载体

AI 不是一个新话题,早在(上世纪) 50 年代就出现过,经过 30 年的发展,从基本的概念开始转移到机器学习,再经过 30 年发展到了如今的深度学习。

今天看来,深度学习是我们主攻的一个重要内容,但它只是人工智能中非常窄的一个面。我们现在已经开始出现把一个很窄的东西来代替全面的人工智能,这是有偏颇的。

当然,这是有原因的,前年 AlphaGo 下棋赢了李世石,后来又赢了柯洁,这些都是很重要的标志性事件。但其实 2011 年的 IBM Waston 计算机参与的一个叫“危险边缘”的游戏,我觉得其实比 AlphaGo 更有代表性,当然大家可能不一定同意我的观点。

如果我们认真去思考,分析下两者比赛的过程,我们会发现 Waston 所具备的智能远远高于 AlphaGo,只是前者不够 fancy 而已。

智能化是下一轮(科技)发展的核心驱动力,这一点毫无疑问,但智能化到底是什么?对这个问题,大家的意见其实并不完全一致。

人类在处理一件事情时大致要经过以下几个过程:感知、传输、存储、处理、决策、传输、执行。在这样一个过程中,其实中间的一部分(也就是存储、处理加决策),我们更多地认为,它具备了现代计算逻辑、分析思维、经验知识判断、决策等各方面的主要内容,所以我们称中间这部分为智慧,前后两端为能力。

中文有时候会比较宽泛,说智能就包含了智慧和能力两部分,但其实我们更多的是在处理智慧部分,而不是能力部分。

所以人工智能这个词有问题,这个词是不清楚的,英文叫人工智慧而不是人工智能,但我们把两者结合到了一起。不过这无所谓了,因为我们可以认为它是可行的。

毫无疑问,芯片是实现 AI 的当然载体,包括 CPU、GPU、FPGA 等等,目前已经出现了 CPU+GPU、CPU+FPGA、CPU+ASIC 等芯片平台,所有这些都离不开芯片。

所以刚才讲了,无芯片,不 AI。

如果你要做 AI 的话,你一定要芯片。在发展 AI 的过程中,芯片是不可或缺的基础内容。

二、人工智能芯片的若干关键要素

人工智能芯片既然如此重要,那么我们应该如何去实现它?我可能和在场嘉宾的观点不太一样。

我们先说 AI 面临着两个现实的问题:

AI 算法非常多,而且在不断演进,现在的算法并没有固定下来;

一个算法对应一个应用,我们目前还没有一个统一算法可以覆盖所有应用,这是让做芯片的人最为痛苦的事情。

我们希望找到一个适应所有算法的芯片架构,而不是每一个应用做一种芯片,这个做起来非常困难。

神经网络有很多种,深度不一样,大小不一样,复杂程度不一样,但是无一例外,这些都是专用神经网络。面对这样一种情况,我们需要在芯片中实现一个具备深度学习的引擎,它是一个必备特性。

今天的深度学习所需要的计算量和参数量非常巨大。从 1997 年到 2007 年,那个时候只需要很少很少的运算量就可以完成一点点小工作,那时候整个计算量也上不去,而且一到十万个参数就很多了。

但是到了今天,比如 2014 年的时候,我们做到 19 层需要 196 亿次/秒的计算能力,加上 1.38 亿个参数;2015 年,参数已经增加到了 1.5 亿个。

这些东西需要这么大的运算量,所以也需要一个好的计算引擎。如果没有一个好的计算引擎,我们是完成不了这些运算工作的。

另一方面,从云端向终端迁移的过程中,我们必须有极高的能量效率,也就是所谓的每瓦多少个 TFLOPs。如果我们仍然效率不高,那么手机电池可能很快就耗完电了。

我们需要真实地去看待这件事情的发展,一个是计算量,一个是能量效率。

在这样的情况下,AI 芯片需要具备怎样的基本要素?

可编程性:它要适应算法演进和应用多样性

架构的动态可变性:适应不同算法,实现高效计算

高效的架构变换能力:< 10 Clock cycle,低开销、低延迟

高计算效率:避免使用指令这类低效架构;

高能量效率:~ 10 TOPS/W(某些应用:功耗 < 1mW;某些应用:识别速度 > 25 F/s);

低成本:能够进入家电和消费电子类

体积小:能够装载在移动设备上

应用开发简便:不需要芯片设计方面的知识

如果让一个人去开发芯片设计,那恐怕难度就很大了,所以目前的 CPU+SW、CPU+GPU、CPU+FPGA 或者 CPU+ASIC 可能都不是很理想的架构,未来我们需要探索架构创新。

既然谈到架构,我们就谈谈什么样的架构是合适的?应用和架构创新是人工智能芯片发展的必由之路。

首先来看应用。今天应用涵盖了几乎所有方面,无行业,不 AI。无论是人脸识别、语音识别、机器翻译、监控、交通规划、无人驾驶、智能陪伴、能源、舆情监控、智慧农业、智慧生产等等,AI 似乎涵盖了我们生产生活的方方面面。

但在这里我想问几个问题:哪些应用真的需要 AI?当我们用 AI 的时候,我们希望它能帮我们解决什么问题?我们做芯片的人特别想知道,什么是 AI 的杀手级应用?什么样的 AI 是我们每天都需要的?

这些问题直到今天都没有答案,有些貌似是 AI 的东西,但实际上不是 AI。

给大家说个笑话,今年是我的本命年,所以今年春节我要买一条红围巾,我就在网上搜了一下,但我没买,结果我就发现在我的手机上就不断出现红围巾的广告,这让我感到非常的烦,它是 AI 吗?它具备一种 AI 的性质,但它又不是 AI。它是给我帮助吗?是给我帮助,但不是我需要的帮助,我只不过看了一眼而已。回想几年以前,我想买一座台灯,结果在两个月当中,我的手机上就不断出现台灯广告。

我想,这都是对 AI 发展过程中的一种偏见,或者还没有达到 AI 真正需要的能力。

文章来源:AI科技大本营

注:转载文章均来自于公开网络,仅供学习使用,不会用于任何商业用途,如果侵犯到原作者的权益,请您与我们联系删除或者授权事宜,联系邮箱:contact@dataunion.org。转载数盟网站文章请注明原文章作者,否则产生的任何版权纠纷与数盟无关。
期待你一针见血的评论,Come on!

不用想啦,马上 "登录"  发表自已的想法.