AI-代理和环境
AI 系统由代理及其环境组成。代理在其环境中执行操作。环境可能包含其他代理。
什么是代理和环境?
代理是可以通过传感器感知其环境并通过效应器作用于该环境的任何事物。
-
人类代理具有与传感器平行的感觉器官,例如眼睛,耳朵,鼻子,舌头和皮肤,以及其他器官,例如手,腿,嘴,用于效应器。
-
机器人代理取代了传感器的摄像头和红外测距仪,以及效应器的各种电机和执行器。
-
软件代理已编码位字符串作为其程序和操作。
代理术语
-
代理的绩效衡量 − 它是确定代理成功程度的标准。
-
代理的行为 - 它是代理在任何给定的感知序列之后执行的操作。
-
感知 - 它是代理在给定实例中的感知输入。
-
感知序列 - 它是代理迄今为止感知到的所有历史。
-
代理功能 - 它是从戒律序列到行动的映射。
合理性
理性无非是理性、理智、有判断力的状态。
理性与预期的行为和结果有关,这取决于主体所感知的内容。以获取有用信息为目的的行动是理性的重要组成部分。
什么是理想理性代理?
一个理想的理性代理是能够执行预期行动以最大化其性能度量的代理,基于-
- 它的感知序列
- 其内置知识库
代理的合理性取决于以下因素 -
-
绩效度量,用于确定成功程度。
-
代理的感知序列到现在为止。
-
代理对环境的先验知识。
-
代理可以执行的操作。
理性主体总是执行正确的动作,其中正确的行动意味着导致代理在给定的感知序列中最成功的动作。代理解决的问题的特征是性能度量、环境、执行器和传感器 (PEAS)。
智能代理的结构
代理的结构可以看作是 -
- 代理 = 体系结构 + 代理程序
- 体系结构 = 代理执行的机器。
- 代理程序 = 代理功能的实现。
简单反射剂
- 他们仅根据当前感知选择操作。
- 只有当只根据现行的戒律做出正确的决定时,它们才是理性的。
- 他们的环境是完全可观察的。
条件-操作规则 − 它是将状态(条件)映射到操作的规则。
基于模型的反射剂
他们使用世界模型来选择他们的行动。他们保持内部状态。
模型 - 关于“世界上的事情是如何发生的”的知识。
内部状态 - 它是当前状态中未观察到的方面的表示,取决于感知历史。
更新状态需要有关 - 的信息
- 世界如何演变。
- 代理的行为如何影响世界。
基于目标的代理
他们选择自己的行动以实现目标。基于目标的方法比反射代理更灵活,因为支持决策的知识是显式建模的,从而允许修改。
目标 − 是对理想情况的描述。
基于实用程序的代理
他们根据每个状态的首选项(实用程序)选择操作。
目标不足时 -
-
存在相互冲突的目标,其中只有少数目标能够实现。
-
目标的实现存在一定的不确定性,您需要权衡成功的可能性与目标的重要性。
环境的本质
一些程序在完全人工的环境中运行,仅限于键盘输入,数据库,计算机文件系统和屏幕上的字符输出。
相比之下,一些软件代理(软件机器人或软机器人)存在于丰富、无限的软机器人域中。模拟器有一个非常详细,复杂的环境。软件代理需要从一长串操作中实时选择。旨在扫描客户的在线偏好并向客户展示有趣物品的软件机器人在真实和人工环境中工作。
最著名的人工环境是图灵测试环境,其中在平等的基础上测试一个真实代理和其他人工代理。这是一个非常具有挑战性的环境,因为软件代理很难像人类一样执行。
图灵测试
系统智能行为的成功可以用图灵测试来衡量。
两个人和一台待评估的机器参加测试。在这两个人中,一个扮演测试者的角色。他们每个人都坐在不同的房间里。测试人员不知道谁是机器,谁是人。他通过输入问题并将其发送给两个情报来询问问题,他会收到输入的回复。
该测试旨在愚弄测试人员。如果测试仪无法从人类的反应中确定机器的反应,那么机器就被称为智能的。
环境属性
环境具有多重属性 -
-
离散/连续 − 如果环境的不同、明确定义的状态数量有限,则环境是离散的(例如,国际象棋);否则它是连续的(例如,驾驶)。
-
可观察/部分可观察 − 如果可以从感知确定每个时间点环境的完整状态,则它是可观察的;否则,它只能部分观察到。
-
静态/动态 − 如果环境在代理操作时没有变化,则它是静态的;否则它是动态的。
-
单个代理/多个代理 − 环境可能包含其他代理,这些代理可能与代理的类型相同或不同。
-
可访问/不可访问 - 如果代理的感官设备可以访问环境的完整状态,则该代理可以访问该环境。
-
确定性/非确定性 − 如果环境的下一个状态完全由当前状态和代理的操作决定,则环境是确定性的;否则它是不确定的。
-
情节性/非情节性 − 在情节环境中,每集都由代理感知然后行动组成。其动作的质量仅取决于剧集本身。后续剧集不依赖于前几集中的操作。情节环境要简单得多,因为代理不需要提前考虑。