决策网络

我们首先学习静态决策:利用决策网络进行简单决策。

为了建立静态决策需要的 Decision networks,我们分析影响决策的各种因素,它们之间的关系、它们和决策目标的关系。然后,我们基于决策网络,分析各种因素对效用的影响,量化评估各种方案的效用,做出最佳决策,并定量评估各种信息的价值。非常有意思。

我们要建立的决策网络包括三种节点:

首先,Chance 节点是以一定概率发生的节点,比如“发热”。

其次,Decision 节点是决策者要做出决策的节点,比如“血常规检查”。根据 Chance 节点的值(比如:是否发热),决定 Decision 节点的值(比如:是否做检查),这就是“策略”。

最后,Value 节点代表 Utility(效用)。每种策略,都有一个平均的 Utility(EU)。基于 EU,就可以比较各种策略,获得最佳策略。

让我们以买车为例。其中包括 Chance 节点:“Lemon(破车)”、“Report(检测结果)”;Decision 节点:“Inspect(购买前专业检测)”、“Buy(购买)”;Value 节点 U。

我们建立它们的决策网络,如下图所示:

如上图右上角的表格所示,一个人的购买取决于 Inspect 及其结果(Report)。但 Inspect 的结果可能失误:“破车”也可能有 0.2 的概率被报告为“好车”。

如上图右下角的表格所示,如果买到“破车”,我们的效用会下降 600(即 -600),而如果选择 Inspect,会付出 50 的费用(即 -50)。当然,如果我们没有车,效用也会下降 300。

因此,当收到检测结果为 Good 时,我们要不要买呢?因此,我们要比较此时买和不买的效用。基于上面的图,我们就可以利用概率的 Inference 方法算出。

我们还可以决策是不是要做“Inpect”。因此,我们要比较检查和不检查的效用。基于上面的图,我们就可以利用概率的 Inference 方法算出。基于这两个值的比较,我们就可以得到“Report”的价值,这就是 Value of Information:信息的价值。

课程材料

课本材料


Index Previous Next