决策网络

我们首先学习静态决策：利用决策网络进行简单决策。

为了建立静态决策需要的 Decision networks，我们分析影响决策的各种因素，它们之间的关系、它们和决策目标的关系。然后，我们基于决策网络，分析各种因素对效用的影响，量化评估各种方案的效用，做出最佳决策，并定量评估各种信息的价值。非常有意思。

我们要建立的决策网络包括三种节点：

首先，Chance 节点是以一定概率发生的节点，比如“发热”。

其次，Decision 节点是决策者要做出决策的节点，比如“血常规检查”。根据 Chance 节点的值（比如：是否发热），决定 Decision 节点的值（比如：是否做检查），这就是“策略”。

最后，Value 节点代表 Utility（效用）。每种策略，都有一个平均的 Utility（EU）。基于 EU，就可以比较各种策略，获得最佳策略。

让我们以买车为例。其中包括 Chance 节点：“Lemon（破车）”、“Report（检测结果）”；Decision 节点：“Inspect（购买前专业检测）”、“Buy（购买）”；Value 节点 U。

我们建立它们的决策网络，如下图所示：

如上图右上角的表格所示，一个人的购买取决于 Inspect 及其结果（Report）。但 Inspect 的结果可能失误：“破车”也可能有 0.2 的概率被报告为“好车”。

如上图右下角的表格所示，如果买到“破车”，我们的效用会下降 600（即 -600），而如果选择 Inspect，会付出 50 的费用（即 -50）。当然，如果我们没有车，效用也会下降 300。

因此，当收到检测结果为 Good 时，我们要不要买呢？因此，我们要比较此时买和不买的效用。基于上面的图，我们就可以利用概率的 Inference 方法算出。

我们还可以决策是不是要做“Inpect”。因此，我们要比较检查和不检查的效用。基于上面的图，我们就可以利用概率的 Inference 方法算出。基于这两个值的比较，我们就可以得到“Report”的价值，这就是 Value of Information：信息的价值。

课程材料