中国移动研究院常耀斌：主流人工智能技术栈的深度探讨和实践总结

发布时间：2019-04-26 16:45:28 所属栏目：经验来源：常耀斌

导读：导语：这几年人工智能技术之所以能够获得快速发展，主要是有三个元素的融合：神经元网络、芯片以及大数据。人工智能是让机器像人一样思考甚至超越人类，而机器学习是实现人工智能的一种方法，它最基本的做法是使用算法来解析数据、从中学习，然后对真实世

然后，分析一下人工智能平台分析引擎的处理过程。分析引擎的主要技术是机器学习和深度学习。机器学习框架涵盖用于分类，回归，聚类，异常检测和数据准备的各种学习方法，也可以包括神经网络方法。深度学习框架涵盖具有许多隐藏层的各种神经网络拓扑，包括模式识别的多步骤过程。网络中的层越多，可以提取用于聚类和分类的特征越复杂。常见的深度学习框架有Caffe，CNTK，DeepLearning4j，Keras，MXNet和TensorFlow。其中Deeplearning4j是应用最广泛的JVM开源深度学习工具，面向Java、Scala和Clojure用户群。它旨在将深度学习引入生产栈，与Hadoop与Spark等主流大数据框架紧密集成。DL4J能处理图像、文本、时间序列和声音等所有主要数据类型，提供的算法包括卷积网络、LSTM等循环网络、Word2Vec和Doc2Vec等NLP工具以及各类自动编码器。Deeplearning4j自带内置Spark集成，用于处理在集群上开展的分布式神经网络训练，采用数据并行来将网络训练向外扩展至多台计算机，每个节点靠一个(或四个)GPU运行。

深度学习框架的计算需要大量的图像数据，数据从前端传输到后端进行预处理，然后进行标注，获得训练数据集。数据整理好之后，进行模型训练，这是一个计算和通信非常密集的过程;模型训练完之后，我们进行推理预测，其主要是一个前向计算过程。其需要对批量样本的高吞吐高并发响应和单个样本的低延时响应。下面以图像识别的过程为例说明如下：

1. 数据的采集和获取：

是通过物联网传感器，将光或声音等信息转化为电信息。信息可以是二维的图象如文字、图象等，可以是一维的波形如声波、心电图、脑电图，也可以是物理量与逻辑值。

2. 数据预处理：

包括AD、二值化、图象的平滑、变换、增强、恢复、滤波等, 主要指图象处理。

3. 特征抽取和选择：

在模式识别中，需要进行特征的抽取和选择，例如，一幅64x64的图象可以得到4096个数据，这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。这就是特征提取和选择的过程。

4. 分类器设计：

分类器设计的主要功能是通过训练确定判决规则，使按此类判决规则分类时，错误率最低。

5. 分类决策：

在特征空间中对被识别对象进行分类。

最后，探讨人工智能平台分析引擎的深度学习，它是如何针对多层神经网络上运用各种机器学习算法解决图像、文本等问题?深度学习从大类上可以归入神经网络，不过在具体实现上有许多变化。深度学习的核心是特征学习，旨在通过分层网络获取分层次的特征信息，从而解决以往需要人工设计特征的重要难题。深度学习是一个框架，包含多个重要算法: CNN卷积神经网络、AutoEncoder自动编码器、Sparse Coding稀疏编码、RBM限制波尔兹曼机、DBN深信度网络、RNN多层反馈循环神经网络神经网络，对于不同问题(图像，语音，文本)，需要选用不同网络模型才能达到更好效果。

重点讲一下卷积神经网络，它就是至少包含一层的神经网络，该层的功能是：计算输入f与可配置的卷积核g的卷积，生成输出。卷积的目的就是把卷积核应用到某个张量的所有点上，通过卷积核的滑动生成新的滤波后的张量。卷积的价值在于对输入降维能力，通过降维改变卷积核的跨度strides参数实现。设置跨度是调整输入张量维数的方法，strides参数格式与输入向量相同，面临挑战：如果应对输入在边界，可以采用对图像边界填充方式。数据格式NHWC(数目，高度，宽度，通道数)。卷积核的作用常常是增强卷积核中心位置像素的灰度。卷积神经网络CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。

由于CNN的特征检测层通过训练数据进行学习，所以在使用CNN时，避免了显式的特征抽取，而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同，所以网络可以并行学习，这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性，其布局更接近于实际的生物神经网络，权值共享降低了网络的复杂性，特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。

激活函数：为神经网络的输入引入非线性，通过曲线能够刻画输入中更为复杂的变化，设计模型常推荐tf.nn.relu，tf.sigmoid,tf.tanh,tf.nn.dropout,性能较为突出，评价一个激活函数是否有用的因素如下：单调，采用梯度下降法寻找局部极值点;可微分，保证任何一个点可以求导数，可以使梯度下降法用到激活函数的输出上。模型的评价指标是敏感度、特异度和精度。灵敏度(敏感度，召回率recall，查全率sensitive)=TP/P =TPR;特异度(特效度specificity)=TN/N;精度(查准率，准确率precision)=TP/TP+FP。

总之，人工智能的框架时代已经成熟了，不是我们科学家和技术专家的主战场，我们是要重新定义一些计算模型和算法实现，来创新网络结构和训练方法，这样的深度学习算法会更加有效，能够在普通的移动设备端工作，甚至不需要多余的硬件支持或抑制内存开销，会触发人工智能技术进入大规模商用阶段，人工智能产品全面进入消费级市场。

【本文为51CTO专栏作者“移动Labs”原创稿件，转载请联系原作者】

戳这里，看该作者更多好文

【编辑推荐】

AI | 天呐噜！人工智能竟彻底消灭了Bug
人工智能与信息安全之间有何作用
首次应用人工智能——你需要思考五个问题
容器赋能AI-人工智能在360私有云容器服务上的实践
感知人工智能操作系统

【责任编辑：未丽燕 TEL：（010）68476606】
点赞 0

（编辑：甘孜站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

网站添加社会化标签有	百度站长工具怎么分析
为什么要建手机网站？	怎么看网站是否启动CD