一文读懂深度学习,值得收藏!

阿芯2018年3月23日
近日,中天微宣布与深鉴科技达成一项知识产权合作框架协议,双方将利用各自在嵌入式通用处理器以及深度学习处理方面的技术优势,合作构建具有中国知识产权的人工智能SoC平台与解决方案。


中天微成立于2001年,是一家从事32位高性能低功耗嵌入式CPU研发的集成电路设计公司,中国内地基于自主指令架构研发嵌入式CPU,并实现大规模量产的供应商。截至目前,基于C-SKY CPU的SoC芯片累计出货量已经突破7亿颗。

深鉴科技成立于2016年,提供先进的神经网络深度压缩技术和基于其自主研发的Aristotle架构和Descartes架构的高效深度学习加速器全栈式解决方案,可在极低的功耗下提供接近高端GPU的深度学习处理性能。

此次合作,中天微将在内置其高性能嵌入式CPU IP的SoC平台中,纳入深鉴科技的Aristotle架构DPU深度学习处理器IP,为客户提供高性能低功耗的嵌入式人工智能SoC解决方案。

同时,深鉴科技将为中天微的客户提供其DPU IP的软硬件集成、软件开发工具链、以及人工智能算法优化等全方位的技术支持,以缩短客户芯片的面世时间,减少客户芯片的研发风险。

什么是深度学习?

官方定义,深度学习(Deep Learning)(也称为深度结构学习【Deep Structured Learning】、层次学习【Hierarchical Learning】或者是深度机器学习【Deep Machine Learning】)是一类算法集合,是机器学习的一个分支。它尝试为数据的高层次摘要进行建模。

机器学习(Machine Learning)是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。

深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。

深度学习的应用

在实际应用中,很多问题都可以通过深度学习解决。那么,我们举一些例子:

黑白图像的着色

深度学习可以用来根据对象及其情景来为图片上色,而且结果很像人类的着色结果。这种解决方案使用了很大的卷积神经网络和有监督的层来重新创造颜色。

机器翻译

深度学习可以对未经处理的语言序列进行翻译,它使得算法可以学习单词之间的依赖关系,并将其映射到一种新的语言中。大规模的LSTM的RNN网络可以用来做这种处理

图像中的对象分类与检测

这种任务需要将图像分成之前我们所知道的某一种类别中。目前这类任务最好的结果是使用超大规模的卷积神经网络实现的。突破性的进展是Alex Krizhevsky等人在ImageNet比赛中使用的AlexNet模型。

自动产生手写体

这种任务是先给定一些手写的文字,然后尝试生成新的类似的手写的结果。首先是人用笔在纸上手写一些文字,然后根据写字的笔迹作为语料来训练模型,并最终学习产生新的内容。

自动玩游戏

这种任务需要将图像分成之前我们所知道的某一种类别中。目前这类任务最好的结果是使用超大规模的卷积神经网络实现的。突破性的进展是Alex Krizhevsky等人在ImageNet比赛中使用的AlexNet模型。

聊天机器人

一种基于sequence to sequence的模型来创造一个聊天机器人,用以回答某些问题。它是根据大量的实际的会话数据集产生的。

深度学习对硬件的需求

一般来说,深度学习包含两个阶段:数据训练和推断。

这种任务需要将图像分成之前我们所知道的某一种类别中。目前这类任务最好的结果是使用超大规模的卷积神经网络实现的。突破性的进展是Alex Krizhevsky等人在ImageNet比赛中使用的AlexNet模型。

在数据训练阶段,大量的标记或者未标记的数据被输入深度神经网络中进行监督或者无监督的学习。所谓监督学习,就是输出是有标记的学习,让模型通过训练,迭代收敛到目标值;而非监督学习不需要人为输入标签,模型通过学习发现数据的结构特征。从而使机器能够在大数据中提取更多的特征值。

随着深度神经网络模型层数的增多,与之相对应的权重参数成倍的增长,从而对硬件的计算能力有着越来越高的需求,尤其是在数据训练的阶段。因此,深度学习训练领域的前沿逐渐从算法转移到了对于高性能计算(HPC)的追逐上。目前被业内广泛接受的是“CPU+GPU”的异构模式和“MIC (Many Integrated Core)”众核同构来实现高性能计算。


相较于训练阶段执着于对高性能计算的需求,线上数据中心的推断不仅要求硬件有着高性能计算,更重要的是对于多指令数据的处理能力。就比如“Bing”搜索引擎同时要对数以万计的图片搜索要求进行识别推断从而给出搜索结果。目前而言,“CPU+GPU”的异构模式依旧是第一选择,但是“CPU+FPGA”异构计算已经显示出他在这方面的潜力。

而移动设备中的推断更强调在高性能计算和低功耗中寻找一个平衡点。在这个领域的深度学习的执行还是更多的依赖于“CPU+FPGA”与“ASIC”。

哪些芯片商在关注深度学习

目前关注深度学习市场的的芯片厂商有哪些呢?英伟达、谷歌、微软、IBM、寒武纪、地平线、中星微、英特尔等。其中英伟达进入市场较早,Intel 2016年以4.08 亿美元收购Nervana Systems开始进行布局。

寒武纪,是北京中科寒武纪科技有限公司的简称。2016年推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备。

Horizon Robotics(地平线机器人)由前百度深度学习研究院负责人余凯创办,致力于打造基于深度神经网络的人工智能“大脑”平台-包括软件和芯片,可以做到低功耗、本地化的解决环境感知、人机交互、决策控制等问题。

地平线的最终产品不止芯片,而是一个核心控制模块,具有感知、识别、理解、控制的功能。把这个控制模块做成产品去跟合作方做集成。换句话说,地平线提供的是一个带有人工智能算法的解决方案。

中星微在2016年6月20日率先推出中国首款嵌入式神经网络处理器(NPU)芯片,这是全球首颗具备深度学习人工智能的嵌入式视频采集压缩编码系统级芯片,取名“星光智能一号”。

这款基于深度学习的芯片运用在人脸识别上,最高能达到98%的准确率,超过人眼的识别率。该NPU采用了“数据驱动”并行计算的架构,单颗NPU(28nm)能耗仅为400mW,极大地提升了计算能力与功耗的比例。

今天获得消息,三星电子推出新款处理器Exynos7 9610,采用10纳米工艺,配置基于深度学习的技术,估计未来也会有更多企业开始关注深度学习领域。

来源:芯师爷

本文经授权发布,不代表芯方式立场。如若转载请联系原作者
半导体那些事儿半导体
说点什么
登录 后参与评论
0条评论