AI-神经网络

人工智能的另一个研究领域,神经网络,受到人类神经系统的自然神经网络的启发。

什么是人工神经网络 (ANN)?

第一台神经计算机的发明者Robert Hecht-Nielsen博士将神经网络定义为 -

"...由许多简单、高度互连的处理元件组成的计算系统,这些元件通过对外部输入的动态状态响应来处理信息。

人工神经网络的基本结构

人工神经网络的想法是基于这样一种信念,即通过建立正确的连接来模仿人脑的工作,可以使用硅和电线作为活的神经元树突来模仿。

人类大脑由86亿个称为神经元的神经细胞组成它们通过轴突连接到其他千个细胞。来自外部环境的刺激或来自感觉器官的输入被树突接受。这些输入产生电脉冲,电脉冲快速通过神经网络。然后,神经元可以将消息发送给其他神经元以处理问题,或者不将其向前发送。

神经元的结构

人工神经网络由多个节点组成,模仿人脑的生物神经元。神经元通过链接连接,它们相互作用。节点可以获取输入数据并对数据执行简单的操作。这些操作的结果被传递给其他神经元。每个节点的输出称为其激活节点值。

每个链接都与权重相关联。人工神经网络能够通过改变权重值进行学习。下图显示了一个简单的 ANN -

典型的人工神经网络

人工神经网络的类型

有两种人工神经网络拓扑 - 前馈反馈。

前馈人工神经网络

在此ANN中,信息流是单向的。一个单位向另一个单位发送信息,它不从中接收任何信息。没有反馈循环。它们用于 模式生成/识别/分类。它们具有固定的输入和输出。

前馈人工神经网络

反馈人工神经网络

在这里,反馈循环是允许的。它们用于内容可寻址存储器。

反馈人工神经网络

人工神经网络的工作原理

在所示的拓扑图中,每个箭头表示两个神经元之间的连接,并指示信息流的路径。每个连接都有一个权重,一个控制两个神经元之间信号的整数。

如果网络生成“良好或期望”的输出,则无需调整权重。但是,如果网络生成“不良或不需要的”输出或错误,则系统会更改权重以改善后续结果。

人工神经网络中的机器学习

人工神经网络具有学习能力,需要接受培训。有几种学习策略 -

  • 监督学习 - 它涉及的老师比ANN本身更学者。例如,教师提供一些示例数据,教师已经知道答案。

    例如,模式识别。ANN在识别的同时提出了猜测。然后老师向ANN提供答案。然后,网络将其猜测与教师的“正确”答案进行比较,并根据错误进行调整。

  • 无监督学习 - 当没有具有已知答案的示例数据集时,它是必需的。例如,搜索隐藏模式。在这种情况下,聚类,即根据某种未知模式将一组元素分成组是基于现有的数据集进行的。

  • 强化学习 - 这种策略建立在观察的基础上。ANN通过观察其环境来做出决定。如果观测值为负数,则网络将调整其权重,以便下次能够做出不同的所需决策。

反向传播算法

它是训练或学习算法。它通过榜样来学习。如果您向算法提交您希望网络执行的操作的示例,它将更改网络的权重,以便它可以在完成训练时为特定输入生成所需的输出。

反向传播网络是简单模式识别和映射任务的理想选择。

贝叶斯网络 (BN)

这些是用于表示一组随机变量之间的概率关系的图形结构。贝叶斯网络也称为信念网络或贝叶斯网络。国阵关于不确定域的原因。

在这些网络中,每个节点代表一个具有特定命题的随机变量。例如,在医学诊断域中,节点 Cancer 表示患者患有癌症的命题。

连接节点的边表示这些随机变量之间的概率依赖关系。如果两个节点中的一个正在影响另一个节点,那么它们必须直接在效果的方向上连接。变量之间关系的强度由与每个节点关联的概率量化。

BN 中的弧上只有一个约束,即不能仅通过遵循有向弧返回到节点。因此,BN被称为有向无环图(DAG)。

BN 能够同时处理多值变量。BN 变量由两个维度组成 −

  • 介词范围
  • 分配给每个介词的概率。

考虑一个离散随机变量的有限集合 X = {X1, X2, ...,Xn},其中每个变量 X i 可以从有限集合中获取值,用 Val(X i) 表示。 如果存在从变量 X i 到变量 X j 的有向链接,则变量 X i 将是变量 X j 的父级显示变量之间的直接依赖关系。

BN的结构非常适合结合先验知识和观察数据。BN可用于学习因果关系,理解各种问题域,并预测未来事件,即使在丢失数据的情况下也是如此。

构建贝叶斯网络

知识工程师可以构建贝叶斯网络。知识工程师在构建它时需要采取许多步骤。

示例问题 - 肺癌。一名患者一直呼吸困难。他去看医生,怀疑自己患有肺癌。医生知道,除肺癌外,患者可能患有各种其他可能的疾病,例如肺结核和支气管炎。

收集问题的相关信息

  • 患者是吸烟者吗?如果是,那么患癌症和支气管炎的机会很高。
  • 患者是否暴露于空气污染中?如果是,什么样的空气污染?
  • X射线阳性X射线表明结核病或肺癌。

识别感兴趣的变量

知识工程师试图回答这些问题 -

  • 要表示哪些节点?
  • 他们能采取什么价值观?他们可以处于哪种状态?

现在让我们考虑只有离散值的节点。变量一次必须只采用其中一个值。

离散节点的常见类型是 -

  • 布尔节点 - 它们代表命题,取二进制值TRUE(T)和FALSE(F)。

  • 有序值 − 节点污染可能表示并取自 {低、中、高} 的值,用于描述患者暴露于污染的程度。

  • 整数值 − 名为 Age 的节点可能表示患者的年龄,可能的值为 1 到 120。即使在这个早期阶段,建模选择也在进行中。

肺癌示例的可能节点和值 -

节点名称 类型 价值 节点创建
排泄 二元的 {低、高、中} BNN 节点创建
吸烟者 布尔 {真,法斯尔}
肺癌 布尔 {真,法斯尔}
X射线 二元的 {正,负}

在节点之间创建圆弧

网络的拓扑应捕获变量之间的定性关系。

例如,是什么原因导致患者患肺癌?- 污染和吸烟。然后将节点污染和节点吸烟者的弧添加到节点肺癌。

同样,如果患者患有肺癌,则X射线结果将是阳性的。然后将来自淋巴结肺癌的电弧添加到淋巴结 X 射线中。

BNN 弧形创建

指定拓扑

传统上,BN 的布局使弧从上到下指向。节点 X 的父节点集由 Parents(X) 给出。

肺癌节点有两个父级(原因或原因):污染和吸烟者,而节点吸烟者是节点X射线祖先同样,X射线是淋巴结肺癌的子项(后果或影响),也是淋巴吸烟者和污染的继任者

条件概率

现在量化连接节点之间的关系:这是通过为每个节点指定条件概率分布来完成的。由于这里只考虑离散变量,因此采用条件概率表(CPT)的形式。

首先,对于每个节点,我们需要查看这些父节点的所有可能值组合。每个这样的组合称为父集的实例化。对于父节点值的每个不同实例化,我们需要指定子节点将采用的概率。

例如,肺癌节点的父母是污染吸烟。它们取可能的值 = { (H,T), ( H,F), (L,T), (L,F)}。CPT 指定这些病例中每个病例的癌症概率分别为 <0.05、0.02、0.03、0.001>。

每个节点将具有关联的条件概率,如下所示 -

Probabilities

神经网络的应用

它们可以执行对人类来说很容易但对机器来说很难的任务 -

  • 航空航天 - 自动驾驶飞机,飞机故障检测。

  • 汽车 − 汽车制导系统。

  • 军事 - 武器定向和转向,目标跟踪,物体识别,面部识别,信号/图像识别。

  • 电子 - 代码序列预测,IC芯片布局,芯片故障分析,机器视觉,语音合成。

  • 财务 - 房地产评估,贷款顾问,抵押贷款筛选,公司债券评级,投资组合交易计划,公司财务分析,货币价值预测,文件阅读器,信用申请评估员。

  • 工业 − 制造过程控制、产品设计与分析、质量检测系统、焊接质量分析、纸张质量预测、化工产品设计分析、化工过程系统动态建模、机器维护分析、项目招标、规划和管理。

  • 医疗 - 癌细胞分析,脑电图和心电图分析,假体设计,移植时间优化器。

  • 语音 - 语音识别,语音分类,文本到语音转换。

  • 电信 - 图像和数据压缩,自动化信息服务,实时口语翻译。

  • 运输 − 卡车制动系统诊断、车辆调度、路线系统。

  • 软件 − 面部识别、光学字符识别等中的模式识别

  • 时间序列预测 - 人工神经网络用于预测股票和自然灾害。

  • 信号处理 - 神经网络可以被训练来处理音频信号并在助听器中适当地过滤它。

  • 控制 - 人工神经网络通常用于做出物理车辆的转向决策。

  • 异常检测 - 由于ANN是识别模式的专家,因此还可以训练它们在发生与模式不匹配的异常情况时生成输出。