深度学习是机器学习 (ML) 的一个子集,指人工神经网络(由算法建模而成,能够像人的大脑一样工作)学习大量数据。

深度学习的工作原理

深度学习由神经网络层驱动。

神经网络由一系列算法按照人类大脑的工作方式松散建模而成,而使用大量数据进行训练,即对神经网络的神经进行配置。

经过训练后,深度学习模型可以处理新数据,能够摄取并实时分析多个来源的数据,无需人为干预。在深度学习中,图形处理单元 (GPU) 可以同时处理多个计算,以优化方式训练深度学习模型。

在现实中,深度学习助力众多人工智能 (AI) 技术改善自动化和分析任务。

绝大多数人每天都会接触到深度学习,例如在浏览互联网或使用手机时。深度学习可为 YouTube 视频生成摘要;

在手机和智能音箱上执行语音识别;

针对图片开展人脸识别;

驱动无人驾驶汽车。

随着数据科学家和研究人员不断运用深度学习框架来处理日益复杂的深度学习项目,深度学习将逐步成为我们日常生活的一部分。

深度学习是机器学习的一个子集,使用人工神经网络来处理和分析信息。

神经网络由计算节点组成,这些节点分布于深度学习算法中的各层。每层都包含输入层、输出层和隐藏层。

训练数据馈送至神经网络,以帮助算法学习并提高准确率。

当神经网络除了输入层和输出层之外还包含多个隐藏层时,便被视为深度神经网络,而深度神经网络是深度学习的基础。

用于深度学习的一些常见类型的神经网络包括:

  • 前馈神经网络 (FF)是一种最早的神经网络形式,其中数据单向流过人工神经元层,直到获得输出。
  • 循环神经网络 (RNN) 是一种与前馈神经网络不同的神经网络,它们通常使用时序数据或涉及序列的数据。循环神经网络对前一层发生的事情具有“记忆”,这取决于当前层的输出。
  • 长/短期记忆 (LSTM) 是一种高级形式的 RNN,能够利用记忆“记住”先前层的状态。
  • 卷积神经网络 (CNN) 包含现代人工智能中一些最常见的神经网络,使用多个不同的层(先是卷积层,然后是池化层)过滤图片的不同部分,然后再将其全部放回(全连接层中)。
  • 生成对抗网络 (GAN) 包含两个神经网络(生成器和判别器),它们在博弈过程中相互对抗,从而不断提升输出的准确率。

什么是机器学习?

机器学习是人工智能的一个子集,使系统能够在无需显式编程的情况下自主学习与优化。机器学习算法的工作原理是识别模式和数据,并在有新数据输入系统时进行预测。

机器学习中通常使用多种模型,包括:

监督式学习

监督式学习是一种机器学习模型,它使用标注训练数据(结构化数据)将特定输入映射为输出。

在监督式学习中,输出结果是已知的(例如识别苹果图片),模型是使用已知输出的数据进行训练的。简单来说,要训练算法识别苹果的图片,则向其提供标记为苹果的图片。

目前最常用的监督式学习算法包括:

  • 线性回归
  • K 近邻算法
  • 朴素贝叶斯
  • 多项式回归
  • 决策树

非监督式学习

非监督式学习是一种使用无标签数据(非结构化数据)来学习模式的机器学习模型。与监督式学习不同,输出不会提前知道。相反,该算法无需人工输入(即无监督)即可从数据中学习,并根据属性将数据分组。

目前最常用的非监督式学习算法包括:

  • 模糊均值
  • K-means 集群
  • 层次聚类
  • 主成分分析
  • 偏最小二乘

半监督式学习。

人们还经常使用一种称为半监督式学习的混合式机器学习,其中仅标记部分数据。

在半监督式学习中,算法必须确定如何组织和构造数据才能得出已知结果。例如,机器学习模型被告知最终结果是苹果,但只有部分训练数据被标记为苹果。

强化学习

强化学习是一种机器学习模型,可以描述为通过一系列试错实验来“边做边学”。

“代理”通过反馈环学习执行定义的任务,直到其性能达到预期范围。

当智能体出色完成任务时,会获得正向强化;当智能体表现不佳时,则会受到负向强化。

什么是人工智能?

人工智能是一个科学领域,致力于构建能够进行推理、学习和行动的计算机或机器,其行为通常需要人类智能,或涉及规模超出人类分析能力的数据。

AI 是一个涵盖许多学科的大型领域,包括计算机科学、数据和分析、软件工程,甚至还有哲学。

在业务层面,AI 是一组技术,具有许多应用场景,包括数据分析、预测、自然语言处理、推荐、机器自动化、智能数据检索等。

人工智能、机器学习与深度学习

虽然这些术语彼此相关,但它们具有明确的层级关系:深度学习是机器学习的一个特化类型,而机器学习是更广义的人工智能领域中的核心学科。

主要区别体现在功能、复杂性和特征工程方面。

功能 人工智能 机器学习 深度学习
范围和定义 最广泛的概念。该领域致力于创建能够执行通常依赖人类智能的任务的系统或机器,例如推理、解决问题、学习和感知。 属于 AI 的一个子集。专注于开发能够基于数据进行学习和决策的系统,而无需为每个场景显式编程。 属于机器学习的一个子集。使用多层人工神经网络 (ANN),直接从海量原始数据中学习复杂模式和层次表示。
目标 在机器中模拟或复制人类智能。 使机器能够通过数据学习,准确执行特定任务。 借助深度神经网络从数据中自动学习特征,以实现更高的准确率,并应对更复杂的模式,尤其是非结构化数据中的模式。
方法 可以使用各种技术:逻辑、基于规则的系统、搜索算法、优化,以及最重要的——机器学习和深度学习。 使用算法(如线性回归、支持向量机、决策树、随机森林)来解析数据、学习,并做出有依据的决策或预测。 使用复杂的多层人工神经网络(受人脑结构启发),具有大量参数。
数据要求 差异很大。基于规则的 AI 可能只需少量数据,而依赖机器学习/深度学习的 AI 通常需要大量数据。 为了有效训练算法,需要大量结构化数据或标注数据。通常,数据越多,性能越高。 为了有效训练深度网络,需要非常庞大的数据集(通常包含数百万个数据点)。性能高度依赖数据规模。
硬件要求 不固定。简单的 AI 可在基础硬件上运行。 通常可在标准 CPU 上运行,但复杂模型更依赖计算能力。 由于需要进行大规模并行计算,通常依赖高性能计算资源,特别是 GPU 或 TPU,以实现高效训练。
特征工程 取决于所采用的方法。 通常需要大量手动特征工程。人类需要从原始数据中选择、转换并创建相关输入特征,以辅助算法学习。 执行自动特征提取。网络通过其层级结构直接从原始数据中提取相关特征,从而减少对人工特征工程的依赖。
训练时间 不适用于非学习型 AI。基于机器学习/深度学习的 AI 差异很大。 运行时间可能从几秒到几小时不等,在适合机器学习的任务中通常比深度学习更快。 由于数据集庞大且网络架构复杂,训练过程往往耗时数小时、数天甚至数周。
可解释性 因情况而异。基于规则的系统通常具有较高的可解释性。使用复杂机器学习/深度学习技术的 AI 模型可能难以解释。 因情况而异。较简单的模型(例如决策树、线性回归)通常具有较好的可解释性。复杂模型(例如集成方法)的可解释性可能较差。 通常缺乏透明性。由于深度学习模型的参数复杂且数量庞大,因此理解其为何做出某个特定决策可能具有挑战性。
主要应用场景和示例 专家系统、国际象棋程序、通用问题求解器,以及虚拟助理和自动驾驶汽车的整体概念。 适用于电子商务或流媒体服务的推荐系统、垃圾邮件过滤、预测性维护、结构化数据驱动的医疗诊断,以及客户流失预测等场景。 图像识别(照片标记)、自然语言处理(翻译、情感分析)、语音识别(语音助理)、自动驾驶汽车的感知系统,以及高级医学图像分析。
Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐