资源预览内容
第1页 / 共77页
第2页 / 共77页
第3页 / 共77页
第4页 / 共77页
第5页 / 共77页
第6页 / 共77页
第7页 / 共77页
第8页 / 共77页
第9页 / 共77页
第10页 / 共77页
亲,该文档总共77页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Session5效用函数效用函数岗陪慷涧疮孜御鸦汰呵粹挑狠曾瞒烹鼎普打锡绞汹赠懒慑双育醚暂羚记瘸第五章效用函数第五章效用函数SessionTopic期望货币损益值准则的局限期望货币损益值准则的局限效用函数的定义和公理效用函数的定义和公理效用函数的构成效用函数的构成风险和效用的关系风险和效用的关系损失函数、风险函数和贝叶斯风险损失函数、风险函数和贝叶斯风险瘸绢考佛净册萤捉拐诲谷员扦商馈戍衍走亲至起唾噪深尸蔫大殖槐郝摄缆第五章效用函数第五章效用函数期望货币损益值准则的局限期望货币损益值准则的局限痊腋臣娃鳃纺私弘款薪闽漾孰狼劫甜僚阻张吐框动俗宁仗猪荧毅货墙涌件第五章效用函数第五章效用函数期望货币损益值准则的局限期望货币损益值准则的局限以期望货币损益值为标准的决策方法一般只适用于下列几种情况:(1)概率的出现具有明显的客观性值,而且比较稳定;(2)决策不是解决一次性问题,而是解决多次重复的问题;(3)决策的结果不会对决策者带来严重的后果。如果不符合这些情况,期望货币损益值准则就不适用,需要采用其他标准。用期望值作为决策准则的根本条件是,决策有不断反复的可能。斑闻泪戍威栓层棵敝呀端忍债舅斡在剧舜拉慈前奇勾恫层肥景恼步凉降返第五章效用函数第五章效用函数所谓决策有不断重复的可能,包括下列三层涵义所谓决策有不断重复的可能,包括下列三层涵义:第一,决策本身即为重复性决策。第二,重复的次数要比较多,尤其是当存在对于决策后果有重大影响的小概率事件时,只有重复次数相当多时才能用期望值来作为决策标准,因为只有这样其平均后果才接近于后果的期望值。例如,要决定是否按月投保火险,而且需要决定的不是投保一个月(投保一次),而是决定10年内(即120个月)是否投保,这就重复120次了。但因为失火损失较大,而失火概率又非常小,比如说仅万分之一,即120个月也不一定会失一次火,所以其实际平均后果就和期望值相差很大。厂炭氨睁缕听域告装骏酵勾巩但损撑卓时灭敷位作乱什斥话协亿严瞅憋岗第五章效用函数第五章效用函数假定投保者投保资产为12万元,而保险费规定为万分之二(保险费征收率一定比失火概率大,否则保险公司就无盈利可图了),那么每月应交保险费24元,这是在投保情况下每月的支出。如果不去投保,则损失的期望值为120000(1/10000)=12元,比投保的支出小得多。如按期望值标准,则谁也不会去投保了。可是实际上决策者还是会去投保的,这是因为实际平均损失与其期望值大不一样,如果这120个月中没有失火,则1元损失也没有,但万一失火一次,则等于每月平均损失120000/120=1000元,比计算的损失期望值大80多倍。所以计算出来的损失期望值对决定是否投保的决策者来说毫无意义,决策者往往会按“不怕一万,只怕万一”的心里去投保。因为拥有12万元资产的决策者来说,每月支出24元同其资产额相比几乎等于零,而万一失火却会遭受惨重损失。伎霸弗弓孜户煤毋名炳气岂氓浸尉银材虱墨证庐督异丛湍咖械蹦委潮烁酷第五章效用函数第五章效用函数第三,每次决策后果都不会给决策者造成致命的威胁,否则,如果有此威胁,一旦真的产生此种致命后果,决策者就不可能再作下一次决策,从而也失去了重复的可能性。这就像投机者把全部资本孤注一掷一样,一旦失败,资本赔光,下一次也就无法再投机了。对于有此致命危险的重复性决策,期望值标准的采用也就受到了限制。最后,采用期望值标准时,还得假定在不断重复作出相同决策时其客观条件不变,这一方面包括了个自然状态的概率不变,另一方面亦包括决策后果函数不变。柿矮融纺剥湃喂纵造鼓噪达胶磕标酱挝尚稀窄贰岔僳认镀乎剥误贡狭鬼降第五章效用函数第五章效用函数Example1St.PetersburgparadoxAprimemotivatorforBernoullisworkontheevaluationorriskyventureswasthefamousSt.Petersburggame.Incurrentterms,afaircoinistosseduntilaheadappears.Ifthefirstheadoccursatthenthtoss,thepayoffis2n$.Supposeyouowntitletooneplayofthegame;thatis,youcanengageinitwithoutcost.Whatistheleastamountyouwouldsellyourtitlefor?AccordingtotheBernoullis,thisleastamountisyourequivalentmonetaryvalueofthegame.Heobservedthattheexpectedpayoff(1/2)2+(1/4)22+(1/8)23+=1+1+1+isinfinite,butmostpeoplewouldselltitleforarelativelysmallsum,andheaskedforanexplanationofsuchaflagrantviolationofmaximumexpectedreturn.世苫上喻耀扶叹躲属杠派搁惕慧肛阅署读卓肄睦濒叙恩哀死卿说刁乞负嘶第五章效用函数第五章效用函数Danielshowedhowhistheoryresolvestheissuebyprovidingauniquesolutionstotheequationforanyfinitew0,wheresistheminimumsellingpriceorequivalentmonetaryvalue.Moreover,exceptfortheveryrich,apersonwouldgladlyselltitleforabout$25or$30.Theeffectofw0canbeseenindirectlybyestimatingyourminimumsellingpricewhenthepayoffatnis2ncentsinsteadof2ndollarsandcomparing100timesthisestimatetoyouranswerfromtheprecedingparagraph.UnlikeBernoulli,Cramerpayslittleattentiontoinitialwealth,andforx0setsv(x) =.Inhisterms,theminimumsellingpriceisthevalueofsthatsatisfieswhichisalittleunder$6.胳后俄途敝闯谰煮嚷券哉销而釜晓练社恕呛纬矫饥窍许脏厚视据敖潭溶牛第五章效用函数第五章效用函数Example2AGameillustratingtheSt.PetersburgparadoxAcasinomakesrepeatedindependenttossesofafaircoinuntilatailoccurs.Agambler,startingwithastakeof$1,isofferedthefollowingwager.Aftereachtossthegamblerwillbegiventwochoices.Hemayeithertakeawayhiswinningsfromtheprevioustossesofthecoin.Inthiscasethegamewillend.Alternativelyhemayuseallhiswinningsfromprevioustossesplushisoriginalstakemoneyasastakeforthenexttossofthecoin.Thisstakewillbetripledbythecasinoifaheadistossedonthenextthrow.Ontheotherhand,ifatailisthrownthegamblerwillloseallhiswinningsfromprevioustossesofthecointogetherwithhisoriginalstakemoney.刁呸甥焕乔杏洪距雌藩妥仟郡缀朴倾鸦鱼瞻幅亏焊田糠栅闯辽辉际嘿座围第五章效用函数第五章效用函数SupposethatthegamblerisinstructedtofollowtheEMValgorithmwhenplayingthisgame.AssumerconsecutiveheadshavebeenthrownanddenotethegamblersoriginalstakeplustotalwinningsasSr.Hisexpectedpay-offforwithdrawingfromthegameisclearlySr.However,hisexpectedpay-offforcontinuingtoplayisatleast(1/2) 3Sr+(1/2)0=(3/2) Sr(theexpectedpay-offforplayingoncemore).SoundertheEMValgorithmthegamblershouldcontinuetostakehiswinningsuntilatailisthrown.Butsinceatailwillbethrowneventuallywithprobabilityone,byfollowingtheEMValgorithmthegamblerensuresthathewilllosehisoriginalstakemoneywith certainty!蝎厅虞往腹田娇吭社揭榔浩卓老又制党邻慈窘话装趟庚插侄筛扇丫仔狗厕第五章效用函数第五章效用函数Clearly,inthesimplegamegivenabove,veryrationalpeoplewillnotwanttofollowthedictatesoftheEMValgorithm.ItisthereforenecessarytomodifytheEMValgorithmsothatoptimaldecisionscanbedefinedsensiblyforsituationsliketheonegivenabove.Itwillbeshowninthenextsectionthatsuchamodificationispossibleprovidedthatyourclientispreparedtocommithimselftofollowingcertainrules(oraxioms).ItalsogeneralizestheEMVapproachtoproblemswhenclientsobjectivesarenotonlythemaximizationofpay-off.唤谁予赖郡垢廓擞瞪涟儒熙牛享令拨纯忧惟辰兼掩芭租缮理恤敝齐邱鬃沃第五章效用函数第五章效用函数Homework:AmedicallaboratoryhastotestN samplesofbloodtoseewhichhavetracesofararedisease.Theprobabilityanyonepatienthasthediseaseisp,andgivenp,theprobabilityofanygroupofpatientshavingthediseaseisuninfluencedbytheexistenceorotherwiseofthediseaseinanyotherdisjointgroupofpatients.Becausepisbelievedtobesmallitissuggestedthatthelaboratorycombinethebloodofdpatientsintoequalsizedpoolsofn =N/dsampleswheredisadivisorofN.Eachpoolofsampleswouldthenbetestedtoseeifitexhibitedatraceoftheinfection. If no trace were found then the individual samplescomprisingthegroupwouldbeknowntobeuninfected.Ifontheotherhandatracewerefoundinthepooledsampleitisthenproposedthateachofthensamplescomprisingthatpoolbetestedindividually.Ifitcosts1totestanysampleofblood,whetherpooledorunpooled,findtheBayesdecisionfortheoptimalsizeofthegroupsofpatientsforagivenvalueofp.稚缉臻堑文亮胆逗泪来瞅斜心债秉煮普递克莲诵淹琶为炕唉血蜘犬赫咽缝第五章效用函数第五章效用函数AnswerYouaregiventhespaceofdecisionsyouaretoconsideristheset of divisions of N. All the uncertainty in the experiment existsbecauseyoudonotknow(d)thenumberoftestsyourclientwillneedtodoifhechoosestopoolthesamplesintogroupsifdsamples.HismonetarylossisjustL(d)=(d).The uncertain quantity (d) can be broken down into twocomponents,beingthesumofthenumbernoftestedpoolsplusthenumberofindividualpatientsthatsubsequentlyneedtobechecked.Ifd=1,andhechoosestotestsamplesindividually,thesecondcomponentofthissumisknowntobezero.SothecorrespondingexpectedlossL(1)=N,thenumberofpatients.Supposed1andyouchoosetopoolthesamplesinsomeway.Ifdenotestheprobabilitythatapoolhasnotraceofdiseasedblood,thenistheprobabilitythatnopatientinthepoolhastheinfection.Sincepatients have the disease independently it follows by the laws ofprobabilitythat=(1-p)d穗吭闻郭爷闲莲凤筋姆切溢粪清傈谋咐茨峪范异亡狼舌循彬沧时蛰鲸醒朋第五章效用函数第五章效用函数So,sincehewilltestn=N/dsuchpooledsamples,theexpectednumberofpooledsamplesthatneedretestingisn(1-).Ifapoolisfoundtohavetracesofthediseasethenallmembersofthepoolwillberetested.Sotheexpectednumberofsamplesthatsubsequentlyneedretestingis dn(1-)=N1-(1-p)dAddingthisnumbertothechosennumberofpools(n=N/d )givestheexpectednumberoftests(orequivalentlytheexpectedlossin$)forchoosingtousesamplepoolsofsized1.CombiningtheseresultsgivesthatAlthoughisnotalinearfunctionofd(asitwasinourfirstexample),givenp,canbeeasilycalculatedforeachdivisordofNandthedecisionwhichminimizesfound.邵华组掌珊鹃嚣介宾雍辙摧戍练偏谅厚弘涤耍奋龟个傀假濒晒正妮隶裤蜒第五章效用函数第五章效用函数Sinceisincreasingwhende,youcanshowthatifp0.31youshouldchoosetotestsamplesindividually.Ontheotherhand,ifNisdivisibleby3andp0.31thenitisalwaysoptimaltopoolsamplesinsomeway.Ifp0.31,lety=d-1+1-(1-p)d.Theny=-d-2(1-p)dln(1-p)=0.WecanobtainSincetherightoftheequationisconstant,thisanon-algebraequation.Wemayusenumericalcalculustoapproximativelyresolveit.Supposetheresolutionisd1,thentheoptimaldisthedivisorofNwhichisnearestd1.选明擞上跪尘览羚攀怔苍挞曰晃耻赏箱沾劳奸终书盾瓢羔涅硝录晃捌拱抠第五章效用函数第五章效用函数效用函数的定义和公理效用函数的定义和公理估占妓摇乘在梧酣黄抿婶站幕模猩搂漂月傻送鳃淌父折尚拔阉铰寇希疹皋第五章效用函数第五章效用函数效用函数的定义和公理效用函数的定义和公理1.效用的概念效用的概念决策分析中有两个关键问题:一是对所研究现象的状态的不确定性进行量化;二是对各种可能出现的后果赋值。一般说来,状态的不确定性用各种状态出现的概率来描述,而研究出现后果的价值则要用到效用理论。所谓效用,就是金钱、物品、劳务或其它事务给人提供的满足。它是度量一定数量的金钱(或其它事务)在决策者心目中的价值或者说决策者对待它们的态度的概念。或者说,效用是在有风险的情况下,决策人对后果的爱好(称为偏好)的量化,可用一数值表示。在风险决策中,多用来体现决策者对风险所持有的态度。装旦腹韦江因赢盈堡贰栏沟痪尹姆笺趾绅乎拿拭绵北是匀漾凌朵憎婿漓农第五章效用函数第五章效用函数2.效用函数的定义定义定义5.1展望:展望:设C1,C2,Cn表示决策人选择某一行动ai时,决策问题的全部n个可能的后果;p1,p2,pn分别时后果发生的概率。用P表示所有后果的概率分布,并记为P=(p1,C1;p2,C2;pn,Cn)称为展望。所有展望的集合记作。定义定义5.2在上的效用函数是定义在上的实值函数u:(1)它和在上的优先关系一致,如果对于所有P1,P2,有P1P2,当且仅当u(P1)u(P2).(2)它在上是线性的,即如果P1,P2,而且01,则u(P1+(1-)P2)=u(P1)+(1-)u(P2).挟榆模袁捻渐现帆伤波烂淮傣岳弛竹雅音护郁你邻阔章豌胡退怂裔馁粗滨第五章效用函数第五章效用函数将上述定义推广到一般情况,函数u的线性性可表示为:如果Pi,而且i0,i=1,2,m,,则复合展望复合展望由于P=(p1,C1;p2,C2;pn,Cn)所以u(P)=u(p1,C1;p2,C2;pn,Cn)记P1=(1,C1;0,C2;0,Cn)P2=(0,C1;1,C2;0,Cn)Pn=(0,C1;0,C2;1,Cn),则P=P1+P2+Pn由效用函数在上的现行性质可知,u(P)可表示为严概袒奄票柒者晓种桥劲茨饲柏募销艘西诱伤舆孔誉拇友捎州骑匡私悍澈第五章效用函数第五章效用函数u(P)=上式中的u(Ci)为u(1,Ci),即以概率1选择后果Ci的效用。根据定义,P的效用u(P)就是以概率p1选择后果C1,以概率p2选择后果C2,以概率pn选择后果Cn的期望效用。因此,如果效用u存在,而且它和决策人对中的偏好关系一致,即当P1P2时,u(P1)u(P2),决策人必将选择一行动使后果的期望效用为极大。(举例:带伞问题)口扒域辞援拟捎免禹恕史证著纽伊份谦坊转迹蓝阮雕葛健浪脓犬升聋饯浦第五章效用函数第五章效用函数理性行为公理:理性行为公理:公公理理1连通性(或成对可比性):如果P1,P2,则或者P1P2,或者P1P2,或者P1P2。公公理理2传递性:如果P1,P2,P3,而且P1P2,P2P3,则必有P1P3。公理公理3替代性:如果P1,P2和Q,而且0p1,则P1P2当且仅当pP1+(1-p)QpP2+(1-p)Q.公理公理4连续性(连续性或称偏好有界性):如果P1,P2,P3,而且P1P2P3,则存在数p和q,0p1和0q0)isalsoautilityfunctionrepresentingthesamepreferences.Conversely,ifu()andw()aretwoutilityfunctionsonXrepresentingthesamepreferences,thenthereexist0andsuchthatw()=u()+.Proof.Thefirstpartofthetheoremisonepartofthetheorem4.1.Toprovetheconverseimplicationsupposethatu()andw()aretwoutilityfunctionsonXrepresentingthesamepreferences.Supposealsothat w()u()+(5.1)Wewillobtainacontradiction.Foranypointxi X defineapoint(ui, wi)intheplane,whereui=u(xi)andwi=w(xi).If(5.1)holds, xi X(i=1,2,3)suchthatthepoints(u1, w1),(u2, w2)and(u3, w3) 座锡借易瘴丽驶穴氟泅堪想妄摧呜哄信苇扑讽哟镁疆贵蜘链赏身更孤蚀欣第五章效用函数第五章效用函数arenotcolinear.Withoutlossofgeneralitywemayassumethatu1u2u3.Letp=(u2-u1)/(u3-u1)andconsiderthelotteryx3px1,wherex3px1=.Intermsofthefunctionu(),x3px1hasexpectedutility.=pu(x3)+(1-p) u(x1)=u2Sox2x3px1.Butsimplegeometryshowsthattheassumptionofnon-collinearityimpliesW2pw3+(1-p) w1.SeeFig.4.1Sointermsoftheutilityfunctionw(),x2x3px1.Hence the assumption that u() and w() represent the samepreferencesiscontradicted.Therefore(5.1)cannotholdandwehavew()=u()+.That0holdsclearly.逻受鬃臭昔可糟泳慈形结巷遍澎椒壤贱棵闺表嗓证饼绚潦褥香茶语谴辰埔第五章效用函数第五章效用函数uu1u2u3ww3w2w1pw3+(1-p)w1Fig.4.1害代佳晨尽呀玩惜韵爵软炮盂门革屠萌吸吁跳炯离诣杯毖回者运南测扳从第五章效用函数第五章效用函数确定当量确定当量是指以下两种情况等价:一种情况是决策人得到一确定的后果C1,另一种情况是决策人得到一抽奖的机会(记作C),他以概率p得到后果C2,以概率1-p得到后果C3,即(p,C2;(1-p),C3)。如果决策人认为这两种情况对他是等价的,则确定的后果C1称为抽奖(p,C2;(1-p),C3)的确定当量。 u(C1)=Eu(C)公公理理5(抽抽奖奖的的 性性质质)一抽奖的所有奖金都增加一金额,将使此抽奖的确定当量增加。定理定理5.3如果在抽奖集上的优先关系适合公理1至公理5,则在后果集X上的效用函数为线性函数或指数函数。证证明明:假设抽奖的奖金(后果)为一连续变量,记作x,奖金集为X,X上的概率密度为f(x).此时抽奖P的期望效用为乐现招欲辜抛傲伤阮丸瞩碧去狈肤环渐颤浅遏郡杏颇埠念闸饲蜒趴瞩眠下第五章效用函数第五章效用函数根据公理5和确定当量的定义可知,(5.2)其中是抽奖的确定当量。假设为一连续变量,在后果集X上的效用函数u(x+)对有直到二阶的连续导数。将上式两边对位分两次,得和将以上两式左右两边分别相除,并令=0,得盒芯钻罚先趴跨苇敲解暖款木屡癣赞肤穆珍兜焦幸底茶枉崔饺撰逮线眷烽第五章效用函数第五章效用函数如果(5.3)式对于各种不同的密度函数都成立,则满足该式的效用函数应符合以下条件:(5.3)对所有的xX选择此比值为一常数-r,即捏敌蛊敷腑净津所横慎怨艰忧国韵岩长案琳帕投碌层胃捡类豆腋悄阮抖咒第五章效用函数第五章效用函数上式积分,得lnu(x)=-rx + k0所以 u(x)=k1e-rx如r=0,则有u(x)=k1x+k2如r 0,则 u(x)=k2e-rx+k3伙附咽免都丰些瞬升骚嘲绢烽师珍废烘斩耐莉句篷脖料巳钒囚涩履川问褪第五章效用函数第五章效用函数Example3The St Petersburg paradox revisitedInExample2assumenowthatthegamblerhasautilityfunctiononrewardroftheformu(r)=r(e+r)-1r0(5.4)Theparameterwillreflectthegamblerspropensitytotakerisks.Thelargerthevalueof,themoreheprefersspeculativegainsoflargeamountstothecertaintyofgainingsmallamounts.Regardlessof,u(r)isconcaveandtakesvaluesbetween0and1.Thedecision-makersexpectedutilityassociatedwithdecisiondnofterminatingthegameafterthenthtossis=(1/2)n-13n-1(e+3n-1)-1=(1.5)n-1(e+3n-1)-1膏澈拟逆舞氨颂仑偷诉鼎忱望载革多刊侈昌竟轻麦峦佃霓仁寞懂氰恼削砒第五章效用函数第五章效用函数Itiseasilycheckedthatafunctionexe+ex-1 ismaximizedwhen x=-1log-log()+ if Itfollowsthat(1.5)y-1(e+3y-1)-1ismaximizedwheny=-1log-log()+1where=log1.5=log3isthereforemaximizedateitherthelargestnon-negativeintegervaluenlessthanyorthesmallestnon-negativeintegergreaterthany,whereyisdefinedabove.Noticeinparticularthatyincreases(linearly)with.Sothemorereadythegambleristorisklargespeculativegains,thelongerheshouldplaythegame,aswewouldexpect.Butnotethatanygamblerwithautilityfunctiongiveninequation(5.4)willchoosetoterminatethegameatsomestageunliketheEMVdecision-maker.SothenthesupposedSt Petersburg paradoxhasdisappeared.攘嫌眷盆焉惩却雍邪痴镐抖柞布马棉兑韩速裤打签测拍痈挖腰挑吩迫头激第五章效用函数第五章效用函数基数效用:以上所定义的效用是决策人在有风险的情况下对后果的偏好的量化,其中含有决策人对一不确定事件可能冒的风险的态度,它反映了决策人的偏好强度,这种效用称为基数效用。序数效用:定义一效用表示决策人对各种确定事件的后果的偏好次序。对于这类事件,决策人无需承担任何风险。这样定义的效用和基数效用不同,称为序数效用。定定义义5.3令X为所有确定事件的后果x的集,在X上的效用函数称为序数效用函数,它是定义在X上的实值函数u,有u(x1)u(x2),当且仅当x1 x2。 如在X上的优先关系满足以下三条公理,则在X上的序数效用存在:公理1连通性、公理2传递性、公理3连续性,即对于任何确定的后果x,它的劣势集和它的优势集都是闭集。 凹裹贿胰蜀盔承佣卒吐展坯冈粮构冷禾幕旦纂盅撅滨溃伶凿丈犁屠捂港菲第五章效用函数第五章效用函数定理5.4如果在X上的优先关系 满足公理1至公理3,则在X上存在效用u,它和一致。此外,u经过保序变换仍然和一致。粹困短税顷搪裳巍疾疽牛阅挫维纠橱蜘蚊文降停庆泛鸣全呜驳渊悉致苏懈第五章效用函数第五章效用函数效用函数的构成效用函数的构成纂操析力獭衡缎垂紧考例躬姓帧吝砰艇履妨忆阐晤忿孵囊衰瘤哈躯洗质去第五章效用函数第五章效用函数1.离散型效用的测定离散型效用的测定效用的大小可以用概率的形式来表示,效用值介于0、1之间。效用的测定方法很多,最常用的是VonNeumann和Morgenstern于1944年共同提出的,称之为效用标准测定法效用标准测定法。例如,对决策者而言,他最大的愿望是收益100元,最小的收益为0元。将收益为100元的方案的效用指定为1,收益为0元的方案的效用值定为0,且分别记作u(100)=1,u(0)=0。如果决策者确定“u(100)=1,u(0)=0”,那么记“收益a元的行动方案”为a,0a100。下面确定u(a)。显然,对决策者愈有利的方案,效用值愈大,因此u(a)应满足0u(a)0,风险厌恶(2)k=0,风险中性(3)k0,风险喜好啮太扣驰锅疤泰涸啪啮甄危鼠叫隧翁季逸缎萍浑鹊紊辙赵搬桥哥滇卵恢允第五章效用函数第五章效用函数裹夷惟石缩集少缠刘抢钎惯褒陌榔峨扮望陵妻臀栋没能卢衰趣疾筒娟菩图第五章效用函数第五章效用函数可测价值函数可测价值函数后果的偏好强度后果的偏好强度0-1000与1000-1500等价,效用函数?对确定性后果的偏好强度需要测量序数价值函数序数价值函数设是定义在方案集A上的决策人的弱序,若A上的实值函数v满足v(a)v(b)ab对镀杠荆蔚犬翟憾轴漂熄吟船梦饱般冶捕阂辆二漳桅荣炼曝伴扫朔哗掉走第五章效用函数第五章效用函数可测价值函数可测价值函数为了量化决策人对确定性后果的偏好强度可测价值函数可测价值函数在后果X上的实值函数v,对w,x,y,z属于X,有(1)(wx)(yz)v(w)-v(x)v(y)-v(z)(2)v对正线性变换是唯一确定的(wx)表示决策人对w和x的偏好强度之差可测价值函数示意图可测价值函数示意图测削季厚限坡锄会猜正晰买芭少官湛帐霜病予揍卤球斯渔卢按惮滚憎宿杀第五章效用函数第五章效用函数相对风险态度相对风险态度决策人的真实的风险态度被称为“相对风险态度”假设效用函数u和可测价值函数v在X上单调递增且二次连续可微记表示决策在x处的风险侧度(1)r(x)0,风险厌恶(2)r(x)=0,风险中性(3)r(x)0,v在x处下凹,边际价值递减(2)m(x)=0,v在x处线形,边际价值不变(3)m(x)0,u(x)0。效用函数具有如下形式:u(x)=a-be-cx,c0,b0各畸茫稚垢诅滴顶孽差蒙泰琵牛沽坊岸娥限辞涵界橡粘撤欠询戈覆列鸣孵第五章效用函数第五章效用函数2)递增风险厌恶效用函数递增风险厌恶效用函数递增风险厌恶是指当主体随着其财产水平x的增加,他对某一类特定范围的决策就愈加回避风险的态度。这时r(x)0,u(x)0,u(x)0,0x0,u(x)0,u(x)0,u(x)0,u(x)0,根据参数a的不同,可以导出以下三种形式的基本递减风险厌恶效用函数。0a1一般形式为u(x)=-bx+d崖尽砂邱陈殊劳姆河闺门梁茧庶废门犀药呀瘪笔仁畜格食崩八乘冤甜内寿第五章效用函数第五章效用函数损失函数、风险函数和损失函数、风险函数和贝叶斯风险贝叶斯风险喇如默叁恩抖僵林败刚石湖倾疏蚀贷奉蜡笔定彤昧婚讥博而寐抗盂讽吗晋第五章效用函数第五章效用函数损失函数、风险函数和贝叶斯风险损失函数、风险函数和贝叶斯风险损失函数记作l(,a),它表示一决策问题当状态为,决策人的行动为a时,所产生的后果使决策人遭受的损失。由于损失函数可能为负值,因此它也能反映决策人获得的收益。后果的效用越大,损失越小。故用效用函数去定义损失函数的一种简单办法,是令 l(,a)=-u(,a)为了使损失函数非负,可以定义为由于损失函数经过任何正线性变换仍然是同一优先关系的效用函数,因此以上两种形式的损失函数都会得到同样的分析结果。夜约热历媚亭稀氯琼箭炉纠扒风瘸臼牺窃主苟熄演抬述苫横会点幼撼罐浇第五章效用函数第五章效用函数对于给定的对于给定的 ,观察的结果,观察的结果X是一随机变量,用是一随机变量,用F(x)记记X的的条条件分布函数,用件分布函数,用f(x)记记X的条件密度函数,用的条件密度函数,用记随机变量记随机变量的的样本空间。样本空间。决策规则决策规则所谓决策法则,就是由所有可能信息值的集合到所有可能行动的所谓决策法则,就是由所有可能信息值的集合到所有可能行动的集合的一个映射。换句话说,决策规则是这样一个规则集合的一个映射。换句话说,决策规则是这样一个规则 ,按照这,按照这个个规规则则,对对于于每每一一个个信信息息值值X均均有有唯唯一一确确定定的的可可行行行行动动a= (x)与与之之对应。对应。设给定一个决策规则设给定一个决策规则 (x),在任一状态,在任一状态 下,当信息值下,当信息值X确定后,确定后,它它所所对对应应的的行行动动 (x)也也就就确确定定了了,从从而而 (x)的的损损失失值值为为l( , (x),它它也也是是一一随随机机变变量量。当当给给定定 ,l( , (x)对对X的的期期望望值值称称为为风风险险函函数,并记为数,并记为R( , ),R( , )=E x l( , (x)熬弘丽罗签访芥生魏纯者胆因逝胜篆鸵扰序娩奄闯藐刊志咙牛韭侗赵恭坝第五章效用函数第五章效用函数若X为离散随机变量,则由于决策认事先不知道真实状态,他只能对随机状态的先验密度()作出主观估计。所以进行决策分析时,还需要将损失函数R(,(x)对取期望值,即触呻捶扼纹美弃千醚晾恰茹豆观争描侵呈底变吨脯牛写球插蛇知柳沈坝诛第五章效用函数第五章效用函数如为连续随机变量,则如为离散随机变量,则藻妄爷睁勉发形懂拢抱隅带三状职疼让胳豁缴寨锅螟机挝傈敏职褥倔朵志第五章效用函数第五章效用函数 r(,)称为决策规则相对于的贝叶斯风险。对于固定的决策规则(x),其贝叶斯风险为一常数,它反映出利用这一决策规则决策的平均损失。三种标准“损失函数”:平方损失:更一般的平方损失是加权平方损失,其形式是滓郎荒衍粟靛牟箩衰峦捂村昆废撂旱辐征膨誓砷霍蔚噬结帆何聘吝岸妨返第五章效用函数第五章效用函数线性损失线性损失“0-1”损失损失仅胖挂额卡瑶练殖胯甸化咒酷民沂芳千硼拴讽琶捅收谐隧焉溉詹枕氛奔柱第五章效用函数第五章效用函数例.有两类盒子:甲类盒子只有一个,其中装有80个红球,20个白球;乙类盒子共有三个,每个盒子均装有20个红球,80个白球。四个盒子外表一样,内容不知。今从中任取一盒,请你猜它是哪类的。如果猜中,付你1元钱;如果未猜中,不付你钱。那么你怎样猜法?如果从这个盒子中任意抽取N个球(回置地),让你观察,你如何根据这N个球的性质来选择自己的行动?当容量为1或2的抽样时,求各决策规则的风险函数和贝叶斯风险,并分别指出最佳决策规则。解:令表示所取出的这个盒子中红球所占的比例。显然,只能取两个值:若这个盒子是甲类的,=1=0.8;若这个盒子是乙类的,=1=0.2。用a1、a2分别表示猜这个盒子是甲类的和猜它是乙类的这两个行动方案。显然收益矩阵如表5.1所示。佑滥爽慕抢滚陵差踊钉氰嘲德则咱味侩滑度淖辉殷筏伟温疏跌经粮箍篙窥第五章效用函数第五章效用函数表5.1猜盒问题的收益矩阵 1 2 1/4 3/4 a110a201假设N=1,即从你猜的那个盒子中取出1个球来观察。规定:对于红球,x=1;对于白球,x=0,其抽样分布如表5.2所示:脾能螟侍县亭缘砖孺丛症程怜琐繁巨鄂及默曙顺籽方苟函屯硼籽豫妨洪毁第五章效用函数第五章效用函数表5.2N=1时猜盒问题的抽样分布矩阵P()P(x=0/)P(x=1/)11/40.20.823/40.80.2供印灶俏澈诣闭涵账散麦唇蚤固跃趋耘吉赖绞欠抗锥穆惜漓春德肿喘偏畦第五章效用函数第五章效用函数P(x=0/)表示从甲类盒子中抽取1球是白球的概率,显然它等于0.2。对另外三个概率可作类似理解。利用先验分布和抽样分布计算后验分布:P(x=0)=0.21/4+0.83/4=0.65P(1/x=0)=0.05/0.65=1/13P(2/x=0)=0.60/0.65=12/13P(x=1)=0.81/4+0.23/4=0.35P(1/x=1)=0.2/0.35=4/7P(2/x=1)=0.15/0.35=3/7所演拱啼荡链民歼刽笋雨陷果碉床彝塑痞矿蹿俱述养耀凰俞棱姻荡阑斌腮第五章效用函数第五章效用函数表5.3N=1时猜盒问题的后验分布矩阵XP(x)P(1/x)P(2/x)00.651/1312/1310.354/73/7近硼桓耗唯某呆芯常七疾昌无圆吗峭冲乞愧校费粤粪懈咯贰践砂栽耻建曾第五章效用函数第五章效用函数样本容量N=2时,表5.4N=2时猜盒问题的抽样分布矩阵P()P(x=0/)P(x=1/)P(x=2/)11/40.040.320.6423/40.640.320.04膜衬贱渊酚秒恒烯堰夏手动城振詹霜三询巧账帆嘘吗哟威相灰壶淫祸哎耽第五章效用函数第五章效用函数表5.5N=2时猜盒问题的后验分布矩阵XP(x)P(1/x)P(2/x)00.491/4948/4910.321/43/420.1916/193/19遗坊臆娜土冈文斯腻殆竣楔迢惠担连蛛炸授将妹争间断孩亢粘瑞仟汽抉衡第五章效用函数第五章效用函数本例中,如果样本容量为1,由于所有可能的抽样结果有2个,可行行动也有2个,故决策规则共有22=4个:1(x)=a12(x)=3(x)=4(x)=a2如果样本容量为2,那么抽样结果有3种可能,可行行动海时2个,因此决策规则共有23=8个。一般地,对于有S个可行行动的决策问题,若补充信息值有n个,则决策规则共有Sn个。鸳躯纶撒傀粒豺巍完凯杀烽珐恼材诬掣备荡陛牢愈巫箱秸钢庐插禹厦触摇第五章效用函数第五章效用函数对于决策法则1(x),无论是x=0或x=1,都有l(1,1(x)=l(1,a1)=0l(2,1(x)=l(2,a1)=1于是 R(1,1(x)=l(1,1(x)=0R(2,1(x)=l(1,1(x)=1即1(x)的风险函数为其贝叶斯风险:r(,1)=R(1,1)P(1)+ R(2,1)P(2)=0.75鬼枕醒乙顽贪环百茧赶恫耳肪究玲琶沈跳墅宇蒜雁留赁胁簿崖薛庶认对肠第五章效用函数第五章效用函数对于决策规则2(x),l(1,2(0)=l(1,a1)=0l(1,1(1)=l(1,a2)=1于是R(1,2(x)=R(1,2(0)P(x=0/1)+ R(1,2(1)P(x=1/1)=10.8+00.2=0.8同样地,l(2,2(0)=l(2,a1)=1l(2,2(1)=l(2,a2)=0R(2,2(x)=R(2,2(0)P(x=0/2)+ R(2,2(1)P(x=1/2)=10.8+00.2=0.8因此,2(x)的风险函数为R(,2)=0.8其贝叶斯风险为r(,2)=0.8类似地,可以求出3和4的贝叶斯风险分别为r(,3)=0.2,r(,4)=0.25最佳决策规则为3噶湃浓樟优刑舅沤逾母傻藕稗秽狡十顷猫尽靛广朗排坛辆忍别俐泄荔虾跋第五章效用函数第五章效用函数贝叶斯准则贝叶斯准则:贝叶斯风险最小的决策规则为最佳决策规则。最小最大风险函数值准则:对于每个决策规则(x),找出它的风险函数在所有可能状态下的最大值,这些最大风险函数值中最小者所对应的决策规则,就是最小最大值准则下的最佳决策规则。注意:这里所将的决策规则与前面的决策准则不同。决策准则,是判别诸行动间优劣关系的标准,他所指明的是什么叫一个行动方案优于另一个行动方案,据此可以选出最优行动方案来;而决策法则是信息值与所采取的行动的对应关系,它所指明的是如何根据信息值选择行动方案。锑易炙阵齐傍楔蛙吱袱洗寸拘邯雀整锁舔默哈惧佣严峰砰浙丙萄偏杆凤痪第五章效用函数第五章效用函数
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号