理性智能体 (rational agent) 需要为取得最佳结果或在存在不确定性时取得最佳期望结果而采取行动。
任何通过传感器(sensor) 感知 环境(environment) 并通过 执行器(actuator) 作用于该环境 的事物都可以被视为 智能体(agent) 。
理性智能体 (rational agent)是做正确事情的事物,人工智能通常坚持一种称为 结果主义 (consequentialism)的概念:我们通过结果来评估智能体的行为。
作为一般规则,更好的做法是根据一个人在环境中真正想要 实现的目标 ,而不是根据一个人认为智能体应该如何表现来设计性能度量。
全知、学习和自主:
任务环境 (task environment),本质上是“问题”,理性智能体 是“解决方案”。
PEAS (Performance,Environment,Actuator,Sensor),详细地讨论每个元素:性能度量、环境、执行器、传感器;
任务环境的属性:
人工智能的工作是设计一个 智能体程序 (agent program)实现智能体函数,即从感知到动作的映射。
假设该程序将运行在某种 具有物理传感器和执行器的计算设备上,我们称之为 智能体架构 (agent architecture):智能体 = 架构 + 程序
简单反射型智能体 (simple reflex agent):智能体根据当前感知选择动作, 忽略感知历史的其余部分。
基于模型的反射型智能体 :处理部分可观测性的最有效方法是让智能体追踪它现在观测不到的部分世界, 智能体应该维护某种依赖于感知历史的内部状态(internal state),从而至少反映当前状态的一 些未观测到的方面。(其中包含概念:世界的转移模型(transition model)、传感器模型(sensor model)、基于模型的智能体(model-based agent))
智能体的效用函数 (utility function)本质 上是性能度量的内部化。内部效用函数和外部性能度量一致,那么根据外部性能度量选择 动作,以使其效用最大化的智能体是理性的。
学习型智能体 ,学习型智能体可分为 4 个概念组件:区别在于负责提升的学习元素(learning element)和负责选择外部行动的性能元素(performance element)。
智能体组件间的工作方式: