决策网络
我们首先学习静态决策:利用决策网络进行简单决策。
为了建立静态决策需要的 Decision networks,我们分析影响决策的各种因素,它们之间的关系、它们和决策目标的关系。然后,我们基于决策网络,分析各种因素对效用的影响,量化评估各种方案的效用,做出最佳决策,并定量评估各种信息的价值。非常有意思。
我们要建立的决策网络包括三种节点:
首先,Chance 节点是以一定概率发生的节点,比如“发热”。
其次,Decision 节点是决策者要做出决策的节点,比如“血常规检查”。根据 Chance 节点的值(比如:是否发热),决定 Decision 节点的值(比如:是否做检查),这就是“策略”。
最后,Value 节点代表 Utility(效用)。每种策略,都有一个平均的 Utility(EU)。基于 EU,就可以比较各种策略,获得最佳策略。
让我们以买车为例。其中包括 Chance 节点:“Lemon(破车)”、“Report(检测结果)”;Decision 节点:“Inspect(购买前专业检测)”、“Buy(购买)”;Value 节点 U。
我们建立它们的决策网络,如下图所示:
如上图右上角的表格所示,一个人的购买取决于 Inspect 及其结果(Report)。但 Inspect 的结果可能失误:“破车”也可能有 0.2 的概率被报告为“好车”。
如上图右下角的表格所示,如果买到“破车”,我们的效用会下降 600(即 -600),而如果选择 Inspect,会付出 50 的费用(即 -50)。当然,如果我们没有车,效用也会下降 300。
因此,当收到检测结果为 Good 时,我们要不要买呢?因此,我们要比较此时买和不买的效用。基于上面的图,我们就可以利用概率的 Inference 方法算出。
我们还可以决策是不是要做“Inpect”。因此,我们要比较检查和不检查的效用。基于上面的图,我们就可以利用概率的 Inference 方法算出。基于这两个值的比较,我们就可以得到“Report”的价值,这就是 Value of Information:信息的价值。
课程材料
- 滑铁卢大学 CS486 人工智能 Decision Networks slides
课本材料
- [RN3] Sections 16.1 - 16.6
Index | Previous | Next |