由上车引出的决策理论_马尔可夫决策过程理论

其他范文 时间:2020-02-27 01:11:53 收藏本文下载本文
【www.daodoc.com - 其他范文】

由上车引出的决策理论由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“马尔可夫决策过程理论”。

由上车引出的决策理论

先看一个例子:有三辆汽车前往同一地点,它们相继经过你的等候地点。三辆汽车的舒适程度不同,你希望乘上它们之中最好的一辆汽车,可是并不知道它们以怎样的顺序开来,你应该采取怎样的策略?

这个问题来源于概率统计中的决策理论,在日常生活和经济生活中,往往会遇到一类需要及时决策,且没有反悔余地的问题,显然这个问题就是难于决断,却又需要及时决断,且没有反悔余地的,因为你不上车,那么汽车就开走了,我们以:好,中,差来表示这三辆车,如果认为反正是碰运气,那么就随便上一辆吧,于是上每一辆汽车的可能性都是三分之一。但是有没有办法提高自己上好车的可能性呢?我们可以采取“先看一看”的方针,即:一定不上第一辆开过来的车,如果第二辆开来的车比第一辆好,那么就上它,否则就上第三辆车,这种方针能否带来好处呢? 我们来看,三辆车开过来的顺序有六种可能:①好 中 差②好 差 中

③中 好 差④中 差 好

⑤差 好 中⑥差 中 好

其中的黑体字表示在“先看一看”的方针下所乘的汽车。于是我们看到,有三种顺序可以上好车,有两种顺序可以上中车,只有一种顺序上差车,就是说,乘上“好 中 差”三种不同的车辆的可能性分别是111。可见此236方法有效地提高了乘上好车的可能性。

若开过来的只有两辆车,你是无论如何也不能提高上好车的可能性的。为什么呢?因为这涉及到一个信息收集的过程,我们收集信息后再比较观察,若只有两辆车,你要是观察第一辆的话,你就只能上第二辆,就别无选择了,而三辆车就不同了,你有一个观察的过程,你可以在第一辆车开过来进行观察,并且在第二辆车开来时做出上与不上的决策,因为你错过了第二辆车,你就别无选择只能上第三辆了。那么有的人要问:观察到何时为止?这是一个理论性问题,概率统计中称为“最佳停止问题”。最终的结论是:观察过程的最佳停止时间是候选对象数目的三分之一。

知道了这个结论,我们就可以在日常生活中遇到此类问题时,也采用先看一看的方针,从而提高自己决策正确的可能性。

下面看一个例子:某公司录用一名员工,共有十人报名,经理决定按报名顺序,前三个人面试后一定不录用,自第四个人起开始将他与前面面试过的人相比较,如果他的能力超过前面所有面试过的人,就录用他,否则就不录用,继续面试下一个,如果前九个人都不录用,那么就录用最后一个面试的人。为什么这样呢?因为面试的人太多,反而弄得分不清谁好谁差,还不如一旦遇见中意的就拍板决定更好。这样就有超过70%的可能性录用到能力最强的三人之

一。我们可以证明此种录用方法的可行性。

事实上,能力排名a 的人排在前三个,有3种选择位置的办法,而能力排名第1至a-1的人都排在后七位,谁位于它们之首就是谁被录用,有排法Ca1

7(a2)!种,其余10a个人可在剩的位置上任意排,有(10a)!中排法,故

a2有:录用能力第1人的排法有:A=

B=38!

P=8a13c7(a2)!(10a)!;能力排名第二的人被录用的排法有:a48a1a33c7(a2)!(10a)!;能力排名第三的人被录用的排法有:C=38!3c7(a2)!(10a)!,所以:8a1ABC17=>70%.10!24

所以这种方法是可行的,也是比较科学的。

下载由上车引出的决策理论word格式文档
下载由上车引出的决策理论.doc
将本文档下载到自己电脑,方便修改和收藏。
点此处下载文档

文档为doc格式

    热门文章
      整站推荐
        点击下载本文