由上车引出的决策理论_马尔可夫决策过程理论

其他范文时间：2020-02-27 01:11:53 收藏本文下载本文

【www.daodoc.com - 其他范文】

由上车引出的决策理论由刀豆文库小编整理，希望给你工作、学习、生活带来方便，猜你可能喜欢“马尔可夫决策过程理论”。

由上车引出的决策理论

先看一个例子：有三辆汽车前往同一地点，它们相继经过你的等候地点。三辆汽车的舒适程度不同，你希望乘上它们之中最好的一辆汽车，可是并不知道它们以怎样的顺序开来，你应该采取怎样的策略？

这个问题来源于概率统计中的决策理论，在日常生活和经济生活中，往往会遇到一类需要及时决策，且没有反悔余地的问题，显然这个问题就是难于决断，却又需要及时决断，且没有反悔余地的，因为你不上车，那么汽车就开走了，我们以：好，中，差来表示这三辆车，如果认为反正是碰运气，那么就随便上一辆吧，于是上每一辆汽车的可能性都是三分之一。但是有没有办法提高自己上好车的可能性呢？我们可以采取“先看一看”的方针,即：一定不上第一辆开过来的车，如果第二辆开来的车比第一辆好，那么就上它，否则就上第三辆车，这种方针能否带来好处呢？我们来看，三辆车开过来的顺序有六种可能：①好中差②好差中

③中好差④中差好

⑤差好中⑥差中好

其中的黑体字表示在“先看一看”的方针下所乘的汽车。于是我们看到，有三种顺序可以上好车，有两种顺序可以上中车，只有一种顺序上差车，就是说，乘上“好中差”三种不同的车辆的可能性分别是111。可见此236方法有效地提高了乘上好车的可能性。

若开过来的只有两辆车，你是无论如何也不能提高上好车的可能性的。为什么呢？因为这涉及到一个信息收集的过程，我们收集信息后再比较观察，若只有两辆车，你要是观察第一辆的话，你就只能上第二辆，就别无选择了，而三辆车就不同了，你有一个观察的过程，你可以在第一辆车开过来进行观察，并且在第二辆车开来时做出上与不上的决策，因为你错过了第二辆车，你就别无选择只能上第三辆了。那么有的人要问:观察到何时为止?这是一个理论性问题,概率统计中称为“最佳停止问题”。最终的结论是：观察过程的最佳停止时间是候选对象数目的三分之一。

知道了这个结论，我们就可以在日常生活中遇到此类问题时，也采用先看一看的方针，从而提高自己决策正确的可能性。

下面看一个例子：某公司录用一名员工，共有十人报名，经理决定按报名顺序，前三个人面试后一定不录用，自第四个人起开始将他与前面面试过的人相比较，如果他的能力超过前面所有面试过的人，就录用他，否则就不录用，继续面试下一个，如果前九个人都不录用，那么就录用最后一个面试的人。为什么这样呢？因为面试的人太多，反而弄得分不清谁好谁差，还不如一旦遇见中意的就拍板决定更好。这样就有超过70%的可能性录用到能力最强的三人之

一。我们可以证明此种录用方法的可行性。

事实上，能力排名a 的人排在前三个，有3种选择位置的办法，而能力排名第1至a-1的人都排在后七位，谁位于它们之首就是谁被录用，有排法Ca1

7(a2)!种，其余10a个人可在剩的位置上任意排，有(10a)!中排法，故

a2有：录用能力第1人的排法有：A=

B=38!

P=8a13c7(a2)!(10a)!;能力排名第二的人被录用的排法有：a48a1a33c7(a2)!(10a)!;能力排名第三的人被录用的排法有：C=38!3c7(a2)!(10a)!，所以：8a1ABC17=>70%.10!24

所以这种方法是可行的，也是比较科学的。

下载由上车引出的决策理论.doc

将本文档下载到自己电脑，方便修改和收藏。

点此处下载文档

文档为doc格式

本文来源：https://www.daodoc.com/fanwen/qitafanwen/797090.html

相关专题马尔可夫决策过程理论理论

相关文章