發(fā)布時(shí)間:2023-10-07 15:37:19
序言:作為思想的載體和知識(shí)的探索者,寫作是一種獨(dú)特的藝術(shù),我們?yōu)槟鷾?zhǔn)備了不同風(fēng)格的5篇博弈論方法,期待它們能激發(fā)您的靈感。
關(guān)鍵詞:博彝論公選課;教學(xué)內(nèi)容與方法改革;措施
中圖分類號(hào):G420 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1002-0845(2012)01-0042-03
博弈論是當(dāng)代西方經(jīng)濟(jì)學(xué)體系中最重要的理論課之一,其應(yīng)用前景非常廣泛。幾乎所有社會(huì)科學(xué)領(lǐng)域中都活躍著與博弈論交叉的分支學(xué)科,為滿足當(dāng)代大學(xué)生對(duì)博弈論知識(shí)的需求,高校加強(qiáng)博弈論公選課建設(shè)迫在眉睫。鑒于此,筆者面向全校開設(shè)了“博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)”和“博弈問題及其啟示”兩門通識(shí)選修課程。
一、博弈論公選課教學(xué)中存在的問題
由于博弈論與經(jīng)濟(jì)學(xué)、管理學(xué)和數(shù)學(xué)等學(xué)科有著十分密切的關(guān)系,所以國內(nèi)本科院校的博弈論課程主要面向經(jīng)濟(jì)、金融、管理或數(shù)學(xué)專業(yè)開設(shè),教學(xué)的對(duì)象通常是本專業(yè)或本學(xué)科相關(guān)專業(yè)的學(xué)生,很少面向全校開設(shè)公選課,這主要緣于以下兩個(gè)方面的原因:第一,博弈理論的建立只有六七十年的歷史。國內(nèi)高校博弈論課程開設(shè)時(shí)間最長(zhǎng)的也不到十年,上述情況導(dǎo)致了課程建設(shè)的經(jīng)驗(yàn)不足、水平不一。第二,研究博弈理論往往需要借助數(shù)學(xué)的方法,所以,博弈論課程的講授與學(xué)習(xí)離不開數(shù)學(xué)工具和經(jīng)濟(jì)學(xué)知識(shí),課程內(nèi)容不得不受制于較高的知識(shí)門檻。因而,國內(nèi)博弈論公選課的建設(shè)尚處于起步階段。
筆者在連續(xù)四個(gè)學(xué)期開設(shè)博弈論公選課后發(fā)現(xiàn),該課程教學(xué)中存在的主要問題如下:
1 學(xué)生問的差異較大
由于博弈論公選課面對(duì)的本科生縱跨二、三、四三個(gè)年級(jí)。橫跨本校全部學(xué)科的所有專業(yè),導(dǎo)致學(xué)生的認(rèn)知平臺(tái)和知識(shí)面存在較大差異,學(xué)習(xí)目的和價(jià)值取向呈現(xiàn)出多元性,學(xué)生在學(xué)習(xí)態(tài)度、學(xué)習(xí)習(xí)慣和學(xué)習(xí)能力方也存在較大差別。
2 理論學(xué)習(xí)需要有一定的經(jīng)濟(jì)學(xué)基礎(chǔ)和數(shù)學(xué)基礎(chǔ)
博弈論是從經(jīng)濟(jì)學(xué)的角度提煉出個(gè)體最優(yōu)決策問題后,利用數(shù)學(xué)模型對(duì)其進(jìn)行描述,再運(yùn)用數(shù)學(xué)工具對(duì)其理論進(jìn)行研究。2007年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主羅杰?邁爾森(Roger B.Myerson)認(rèn)為,“博弈論是對(duì)理人或決策者之間相互沖突及合作的數(shù)學(xué)模型進(jìn)行的研究”。雖然博弈論具有廣泛的應(yīng)用范圍和較強(qiáng)的解釋能力。但它的標(biāo)準(zhǔn)表達(dá)是函數(shù)形式和集合論形式的,研究方法和分析過程依賴于數(shù)學(xué)工具。所以,學(xué)習(xí)博弈論既要有相關(guān)的經(jīng)濟(jì)學(xué)知識(shí),又要有一定的數(shù)學(xué)基礎(chǔ)。正因如此,學(xué)生在公選課中接觸博弈論時(shí)會(huì)覺得比較抽象。
3 課程的知識(shí)容量受限
為了照顧學(xué)生差異,筆者在教學(xué)過程中會(huì)盡可能詳細(xì)地為學(xué)生進(jìn)行講解,因而不得不壓縮知識(shí)的容量,這導(dǎo)致了一部分經(jīng)濟(jì)學(xué)和數(shù)學(xué)基礎(chǔ)較好的學(xué)生“吃不飽”的問題。筆者嘗試通過布置課后練習(xí)的辦法來解決這一問題,但效果不是很明顯?;蛟S一個(gè)不可回避的重要原因是,有限的課余時(shí)間和較快的學(xué)習(xí)節(jié)奏限制了多數(shù)學(xué)生對(duì)公選課知識(shí)的進(jìn)一步學(xué)習(xí)。
4 缺少合適的教材
缺少合適的教材也是博弈論公選課教學(xué)中存在的主要問題之一。筆者認(rèn)為,博弈理論的應(yīng)用性和公選課內(nèi)容的時(shí)效性是激發(fā)學(xué)生學(xué)習(xí)興趣的、切入點(diǎn),教材的編寫應(yīng)將二者有機(jī)結(jié)合起來,方能發(fā)揮最大的功效,然而目前的教材往往只能體現(xiàn)前者卻難以涵蓋后者。
二、課程內(nèi)容與教學(xué)方法改革的措施
1 抓住學(xué)生的共性
大學(xué)生具有強(qiáng)烈的關(guān)注現(xiàn)實(shí)問題的意愿,對(duì)社會(huì)熱點(diǎn)問題表現(xiàn)出極高的興趣,尤其在理解焦點(diǎn)問題時(shí)具有很強(qiáng)的可塑性和認(rèn)知共性。因而應(yīng)牢牢抓住這一共性,迎合學(xué)生在知識(shí)需求上的實(shí)用化和功利化的特點(diǎn),從當(dāng)前豐富的信息資源中尋找承載博弈論知識(shí)的現(xiàn)實(shí)問題,以期收到事半功倍的教學(xué)效果。在教學(xué)實(shí)踐中,筆者把豐田汽車賠償、西南五省大旱、相親類節(jié)目“非誠勿擾”、2008股市大跌等現(xiàn)實(shí)熱點(diǎn)都搬上了講臺(tái)。下面,筆者就通過教學(xué)實(shí)例進(jìn)行說明。
在講授2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主托馬斯?謝林(Thomas C.Schelling)的博弈承諾及其可信性概念時(shí),筆者以制定《反國家分裂法》為典型案例進(jìn)行分析。由于祖國統(tǒng)一問題是所有國人關(guān)心的國家大事,大學(xué)生也不例外,所以講授過程非常順利,以致學(xué)生在課后反饋中把這一案例列為講授最成功的部分。接著,為了講解如何應(yīng)用可信承諾處理現(xiàn)實(shí)問題,筆者選擇了電視連續(xù)劇《老大的幸福》第四集中的一個(gè)視頻片段,進(jìn)一步強(qiáng)化了知識(shí)點(diǎn)。實(shí)踐證明,人物生動(dòng)的形象在給課堂增添活躍氣氛的同時(shí),也很好地承載了傳遞知識(shí)的作用,以縮影的形式把可信承諾的概念和應(yīng)用可信承諾策略的方法植入了學(xué)生的頭腦中。最后,筆者以拆遷補(bǔ)償合同簽訂中的一種可信承諾策略為例,對(duì)本節(jié)課進(jìn)行了總結(jié),并請(qǐng)學(xué)生加以點(diǎn)評(píng)。由于拆遷問題是當(dāng)前社會(huì)的焦點(diǎn)問題,所以學(xué)生對(duì)點(diǎn)評(píng)表現(xiàn)出極大的興趣。這樣,通過抓住學(xué)生的認(rèn)知共性,展示了可信承諾策略在焦點(diǎn)問題上能夠?qū)⒘觿?shì)變?yōu)閮?yōu)勢(shì)的強(qiáng)大作用,成功地引導(dǎo)學(xué)生了解并掌握了博弈承諾及其可信性概念。
2 增強(qiáng)主題的典型性和知識(shí)模塊的簡(jiǎn)潔性
以經(jīng)典博弈問題為主題有利于組織素材、選擇教學(xué)內(nèi)容;簡(jiǎn)潔地安排知識(shí)模塊、弱化知識(shí)的層次性有利于照顧各類學(xué)生在知識(shí)面、綜合能力和認(rèn)知水平上的差異;少而精地選擇課程內(nèi)容有利于突出重點(diǎn);多角度地反復(fù)講解有利于降低知識(shí)門檻,提高學(xué)習(xí)的效果。
例如,在主題選擇上,筆者以多數(shù)學(xué)生熟知的“囚徒困境”作為第一主題;以試驗(yàn)性強(qiáng)、易于展開的“理性基礎(chǔ)和有限理性”作為第二主題;以現(xiàn)實(shí)性突出的“重復(fù)動(dòng)態(tài)博弈”作為第三主題。由于“囚徒困境”與經(jīng)濟(jì)學(xué)中的“理性人假設(shè)”密不可分,所以第一主題既能讓學(xué)生感受到博弈問題的趣味性和深刻性,又能激發(fā)他們對(duì)該主題的進(jìn)一步思考,使他們逐漸認(rèn)識(shí)到“理性人假設(shè)”所具有的超越現(xiàn)實(shí)、過于理想的特性,從而部分地為第二和第三主題做好鋪墊。另外,有大量關(guān)于“囚徒困境”和理性問題的課外資料易于獲得,這為學(xué)生在課程初期進(jìn)行興趣驅(qū)動(dòng)的導(dǎo)讀創(chuàng)造了條件。
在知識(shí)模塊設(shè)置上,筆者采取“自成模塊、減少關(guān)聯(lián)”的策略。例如,針對(duì)非常重要的“信息不對(duì)稱”主題,我們選擇了以二手車市場(chǎng)為核心,構(gòu)建了包含藥品市場(chǎng)、電腦市場(chǎng)和就業(yè)市場(chǎng)等典型主題的知識(shí)模塊。一方面,這些市場(chǎng)為學(xué)生所熟知,易于接受;另一方面,這些市場(chǎng)中包含著非常典型的“信息不對(duì)稱”因素,因而通過對(duì)市場(chǎng)現(xiàn)象的自然描述完全可以弱化學(xué)生對(duì)經(jīng)濟(jì)學(xué)市場(chǎng)知識(shí)的依賴。為了弱化知識(shí)的層次性,突出重點(diǎn)內(nèi)容,筆者舍棄了理論體系中的某些知識(shí)模塊,例如“海薩尼轉(zhuǎn)換”、“斯賓塞信號(hào)傳遞模型”和“斯蒂格利茨信息甄別模型”等。
3 重視案例應(yīng)用,尤其應(yīng)重視與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主有關(guān)的案例
博弈論有一個(gè)顯著特點(diǎn),那就是它“聲名顯赫”,并且與
諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的關(guān)系密切。許多諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主都曾涉足博弈論領(lǐng)域,在博弈論的建立和發(fā)展中直接或間接做出過貢獻(xiàn)?!懊曉谕狻睘椴┺恼摴x課的開設(shè)提供了有利條件,也為課程的講授提供了獨(dú)特的視角和豐富的素材。正因如此,筆者才面向全校開設(shè)了博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)公選課。下面,以1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主約翰?福布斯?納什(John Forbes Nash Jr.)為例,詳細(xì)說明如何應(yīng)用與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主有關(guān)的案例以及這樣做的優(yōu)點(diǎn)。
納什是博弈理論發(fā)展的劃時(shí)代人物,納什均衡是博弈論的核心概念,兩者都是公選課中必須包含的內(nèi)容。為此,筆者設(shè)計(jì)了以下三個(gè)環(huán)節(jié):1)借助“囚徒困境”和“情侶博弈”講授納什均衡及其不唯一性;2)播放電影《美麗心靈》,并進(jìn)行討論和點(diǎn)評(píng);3)布置以納什為主題的案例設(shè)計(jì)作業(yè),讓同學(xué)在課堂上演講。第一部分是講解的重點(diǎn),講好納什均衡意味著博弈論課程成功了一半。第二部分可以把人格培養(yǎng)和素質(zhì)教育有效融合起來?!睹利愋撵`》不僅能讓人體悟到學(xué)生心靈中因愛而生的溫暖,還能給出人生原本就是一場(chǎng)博弈的警示,體現(xiàn)出“大人物小故事”的精髓??v然納什這樣的天才也有無法擺脫的困境,何況他人?所以,在人生的博弈中,既要承認(rèn)能力的差異,又要找尋屬于自己的色彩。同時(shí)還應(yīng)看到,縱然如納什般為頑疾所纏都可以逐漸康復(fù),何況其他挫折?所以,要以積極、樂觀、健康的心態(tài)對(duì)待人生,要終身學(xué)習(xí)而不輕言放棄!第三部分是對(duì)學(xué)生的啟發(fā)環(huán)節(jié)。該環(huán)節(jié)不僅要培養(yǎng)學(xué)生對(duì)本課程的興趣,加深學(xué)生對(duì)知識(shí)的理解,還要通過為其提供上臺(tái)演講、展示成果的機(jī)會(huì),鍛煉他們的邏輯思維能力和表達(dá)能力。值得一提的是,很多學(xué)生在設(shè)計(jì)案例時(shí)自學(xué)了有名的“智豬博弈”和“戀愛博弈”等經(jīng)典模型,鞏固了納什均衡概念,還有學(xué)生甚至對(duì)納什曾經(jīng)設(shè)計(jì)過的一種“六連棋”博弈游戲(筆者對(duì)此也知之甚少)進(jìn)行了分析。
4 重視學(xué)科交叉,尤其應(yīng)重視學(xué)科交叉視闕下的學(xué)術(shù)前沿成果
博弈論已逐漸成為一門為諸多學(xué)科提供思維方法和分析技巧的學(xué)問,可以說,所有與生命有關(guān)的學(xué)科都蘊(yùn)藏著博弈論的應(yīng)用空間。在公選課中,應(yīng)重視從學(xué)科交叉的視角供給知識(shí),廣泛培養(yǎng)各專業(yè)學(xué)生對(duì)課程的興趣。例如,筆者選擇生物演化理論和博弈論交叉所產(chǎn)生的演化博弈論作為知識(shí)模塊,以人類社會(huì)的同性戀演化作為典型主題,挑選最前沿的學(xué)術(shù)研究案例作為教學(xué)的主要內(nèi)容為學(xué)生進(jìn)行講解,擴(kuò)展了學(xué)生的知識(shí)面。
在演化博弈論的開創(chuàng)性著作《演化與博弈論》一書中,作者約翰?梅納德?史密斯(JohnMaynardSmith)用精妙的語言、深入淺出的分析和豐富有趣的案例把博弈論的思想融入到生物演化中,推動(dòng)了對(duì)“動(dòng)物為什么如此”這一問題的深入研究,揭示了動(dòng)物群體行為演變的動(dòng)力學(xué)機(jī)制。筆者首先以“哺乳動(dòng)物一雄多雌”案例作為引導(dǎo),簡(jiǎn)單介紹演化博弈論在性選擇和性別比問題上的研究視角以及邏輯結(jié)構(gòu),然后立刻引出了人類面臨的一個(gè)有關(guān)性的問題――同性戀演化主題下的性問題:從進(jìn)化論的角度來看,男男同性戀的存在完全沒有任何意義,這是因?yàn)橥詰傧啾扔诋愋詰俣猿晒Ψ敝澈蟠目赡苄蕴?,那么為什么同性戀的基因沒有被淘汰?顯然,這一問題接近現(xiàn)實(shí)熱點(diǎn),對(duì)學(xué)生極具誘惑力,而且還具有很強(qiáng)的學(xué)術(shù)延伸性。為了講解同性戀基因延續(xù)的演化博弈機(jī)制,筆者借助2010年2月24日美國心理科學(xué)雜志上發(fā)表的關(guān)于薩摩亞島上男男同性戀的最新研究成果,利用最前沿的學(xué)術(shù)案例詳細(xì)分析了“親族選擇”假說下的演化博弈機(jī)制。教學(xué)實(shí)踐表明,通過這樣的內(nèi)容設(shè)計(jì),來自不同專業(yè)的學(xué)生的學(xué)習(xí)興趣都被調(diào)動(dòng)起來,加深了他們對(duì)博弈論的理解,順利實(shí)現(xiàn)了教學(xué)的目標(biāo)。
5 重視開放性,尤其應(yīng)重視教學(xué)信息交流反饋的開放性
信息交流有利于幫助學(xué)生鞏固所學(xué)內(nèi)容,讓有興趣的學(xué)生通過查閱相關(guān)資料,獲得知識(shí)上的感悟和能力上的提升,并逐步脫穎而出。信息反饋有助于教師突出教學(xué)的亮點(diǎn),發(fā)現(xiàn)教學(xué)中存在的不足,以便在今后的教學(xué)中加以改進(jìn)。
教學(xué)實(shí)踐中,筆者讓學(xué)生通過電予郵件的形式反饋“課堂心得”,并要求他們回答以下三個(gè)問題:
(1)這次課對(duì)你影響最深或最成功的是哪部分?
(2)最失敗或可有可無的又是哪部分?
(3)對(duì)本次課你有什么意見和建議?
這三個(gè)問題一方面可以督促學(xué)生對(duì)課堂內(nèi)容加以回顧、梳理,另一方面,又可以從中發(fā)現(xiàn)筆者在教學(xué)中存在的不足之處。事實(shí)上,在交流和反饋中,許多同學(xué)都針對(duì)課程的內(nèi)容、進(jìn)程和教師的教學(xué)習(xí)慣、技能等提出了中肯的批評(píng)和建議,幫助教師提高教學(xué)水平。這些批評(píng)和建議包括“講課的速度有點(diǎn)偏快”、“思考時(shí)間較少”、“有些理論過于深?yuàn)W”、“希望針對(duì)時(shí)事展開分析”、“希望多些互動(dòng)”、“理論是需要加強(qiáng)的”等,當(dāng)絕大多數(shù)學(xué)生贊成“少一點(diǎn)數(shù)學(xué)知識(shí)”并希望“講得詳細(xì)點(diǎn)”時(shí),筆者采納了這一建議,并列出了幾本偏重?cái)?shù)學(xué)工具的參考書讓那些“吃不飽”的學(xué)生自學(xué)。
學(xué)生給予的溫馨鼓勵(lì)也讓筆者感覺“很給力”。例如,“本節(jié)課內(nèi)容很充實(shí),希望老師保持下去”、“老師的努力我們都看到了,希望老師以后做得更好”等話語激勵(lì)著筆者,使筆者能夠維持濃厚的教學(xué)熱情使其永不衰減,并且有信心進(jìn)一步提高自身的專業(yè)能力,挑戰(zhàn)自我的職業(yè)水平。
教學(xué)探索與實(shí)踐的過程是循序漸進(jìn)的過程,學(xué)生在這一過程中所起到的作用是巨大的。只要教師能夠及時(shí)、充分地了解學(xué)生的需求,不斷總結(jié)、深化課程教學(xué)改革的經(jīng)驗(yàn),就一定能取得更大的成效。
三、下一步的設(shè)想
筆者秉承“以人為本,以學(xué)生的發(fā)展為中心”的教育理念,希望博弈論公選課能為學(xué)生打開“半”扇窗,培養(yǎng)他們對(duì)博弈理論的興趣,激發(fā)學(xué)生課后自主學(xué)習(xí)的潛能,做到既為學(xué)生提供基本知識(shí),又幫助學(xué)生脫穎而出。
教學(xué)實(shí)踐表明,的確有不少學(xué)生通過自主學(xué)習(xí)脫穎而出。以下是某學(xué)生的反饋:“最近看了一本《博弈三國》,該書用博弈論的方式對(duì)三國故事進(jìn)行解析,感覺博弈論有一種奇妙的功能,就是能把復(fù)雜問題簡(jiǎn)單化,而且解析后的過程、緣由都一清二楚了?!备袑W(xué)生覺得自己“在研究中發(fā)現(xiàn)了對(duì)自己有用的東西,受益匪淺”。也有在深入思考后對(duì)教學(xué)內(nèi)容提出反詰者:“從平常感知上來說,同性戀的基因遺傳與博弈基本無關(guān)……博弈是一種研究競(jìng)爭(zhēng)參加者為爭(zhēng)取最大利益應(yīng)當(dāng)如何做出決策的數(shù)學(xué)方法……無法說這樣一種與母系基因聯(lián)系較為緊密的基因遺傳行為可以用博弈的方式去解決,只能說同性戀的基因遺傳在某種程度上體現(xiàn)了社會(huì)的平衡態(tài)?!辈还苓@些反饋的具體情境如何,它們至少說明,應(yīng)從公選課的現(xiàn)實(shí)性、延伸性、前沿性和開放性出發(fā),強(qiáng)化學(xué)生的共性。弱化學(xué)生的差異性,充分利用教學(xué)內(nèi)容的充實(shí)性和教學(xué)方法的靈活性,謹(jǐn)慎且大膽地進(jìn)行教學(xué)改革,為滿足高等教育通識(shí)選修課的教學(xué)需求,進(jìn)一步提高教學(xué)的水平與質(zhì)量,提供一些思路和經(jīng)驗(yàn)。
[關(guān)鍵詞]博弈論;理性人假定;公共知識(shí);社會(huì)科學(xué)方法論
[中圖分類號(hào)]C3
[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)]1671-511X(2012)04-0020-03
博弈論是研究理性人的互動(dòng)的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)應(yīng)用于經(jīng)濟(jì)領(lǐng)域,奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950-1951年,約翰·納什利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)定的基礎(chǔ)。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動(dòng)了博弈論的發(fā)展。因此,盡管博弈論是一門新生的學(xué)科,但是它今天已經(jīng)發(fā)展成為有較完善的理論體系的科學(xué)。
今天,博弈論已經(jīng)成為社會(huì)科學(xué)的通用方法論。盡管它是演繹科學(xué),對(duì)社會(huì)現(xiàn)象有強(qiáng)大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實(shí)際博弈結(jié)果存在差異。許多實(shí)驗(yàn)經(jīng)濟(jì)學(xué)家通過博弈實(shí)驗(yàn)研究實(shí)際中人們的博弈過程,分析博弈論的演繹解與博弈實(shí)驗(yàn)結(jié)果之間的差異。如2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就頒發(fā)給了丹尼爾·卡尼曼和邁農(nóng)·史密斯,他們是實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的先驅(qū)。今天在西方學(xué)術(shù)界通過實(shí)驗(yàn)來驗(yàn)證博弈的理論結(jié)果已經(jīng)成為一種潮流。本文下面設(shè)計(jì)并進(jìn)行了一個(gè)博弈實(shí)驗(yàn),通過分析實(shí)驗(yàn)結(jié)果與理論解的差異,分析博弈論作為社會(huì)科學(xué)方法論的局限性,并提出改進(jìn)的可能路徑。
一、博弈實(shí)驗(yàn)及結(jié)果分析
1 實(shí)驗(yàn)描述
我們?cè)O(shè)計(jì)了如下的一個(gè)博弈實(shí)驗(yàn)。該實(shí)驗(yàn)的參與人是南京大學(xué)選修文化素質(zhì)課“邏輯與科學(xué)方法基礎(chǔ)”的大學(xué)生,他們是二三年級(jí)的學(xué)生,文理科學(xué)生均有。
該實(shí)驗(yàn)是以試題的形式進(jìn)行的,該試題作為期末試卷中的最后一道題。該題目為:
在0-100之間選擇一個(gè)數(shù)字,規(guī)則是:若你選擇的數(shù)字“是或最接近”在座同學(xué)所選擇的數(shù)字的平均數(shù)的2/3(即在座同學(xué)所選數(shù)的總和除以總?cè)藬?shù)之后所得數(shù)字的2/3,如:若平均數(shù)為90,你應(yīng)當(dāng)選2/3×90=60),你將獲勝。請(qǐng)給出你選擇的理由。
實(shí)驗(yàn)說明:
(1)實(shí)驗(yàn)參與者即參加考試的學(xué)生,事前不知道這是一個(gè)實(shí)驗(yàn);
(2)該課程教師以講座的形式給實(shí)驗(yàn)參與者傳授過博弈論知識(shí),但沒有提到所進(jìn)行的博弈;
(3)因?yàn)椋?),他們中的大多數(shù)掌握“博弈”、“公共知識(shí)”等概念;
(4)試卷是保密的,沒有任何學(xué)生預(yù)先知道考試內(nèi)容,考試過程中學(xué)生間無任何交流;
(5)該博弈的理論解(即納什均衡)為0或1。
2 實(shí)驗(yàn)結(jié)果
對(duì)于考試中的每個(gè)學(xué)生,在這個(gè)博弈實(shí)驗(yàn)中他能夠獲勝的關(guān)鍵是,他要準(zhǔn)確猜測(cè)他人是如何選擇的,一旦他猜測(cè)正確,他將他猜測(cè)的平均數(shù)乘以2/3便是獲勝答案。
共有176人參加了考試。排除掉5個(gè)不明確的選擇,供分析的實(shí)際選擇數(shù)為171個(gè)(其中3個(gè)選擇非整數(shù))。實(shí)驗(yàn)結(jié)果為(按照數(shù)字大小排序):
“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。
3 結(jié)果分析
在這些所選擇的數(shù)字中,最大的數(shù)字為75,最小的數(shù)字為0。171個(gè)數(shù)字相加后的平均數(shù)為21.91,本博弈勝出解:21.84×2/3=14.61。
這個(gè)博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實(shí)驗(yàn)中,0是所選最多的數(shù)字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。
從上述數(shù)據(jù)可以看出,在這場(chǎng)博弈中,“實(shí)驗(yàn)解”為14.61,最接近該數(shù)的是14或15,這和“理論解”的“0”或“1”不同。在本實(shí)驗(yàn)中,沒有人選擇14,而選擇15的有3人,這3人是該實(shí)驗(yàn)的勝出者。
若按照區(qū)間來統(tǒng)計(jì),實(shí)驗(yàn)結(jié)果的分布情況見表1。本博弈實(shí)驗(yàn)的“實(shí)驗(yàn)解”14.61落在11-20之間。若我們把11-20看成是勝出區(qū)間,則有7人勝出。
對(duì)于這些選擇,有以下值得注意的幾點(diǎn):
第一,67以上的選擇都是不理性的,因?yàn)閰⒓涌荚嚨膶W(xué)生數(shù)為150-200之間,這是公共知識(shí),即使所有的學(xué)生都選擇100,勝出的數(shù)字都不會(huì)超過67。但是還有3位學(xué)生選擇了大于67的數(shù)字,其中選擇的最大數(shù)為75。他們?cè)诮o出這些選擇時(shí)沒有給出理由。
第二,分析學(xué)生所給出這些選擇的理由,可以看出,絕大部分選擇者在進(jìn)行他們的選擇時(shí)考慮到了他人的選擇以及他人的推理。不同的人對(duì)他人的假定不同,所進(jìn)行推理的步驟也不同。如選擇67的學(xué)生假定了他人都選擇100,因而選擇67是最優(yōu)選擇;再比如選擇30-40之間的數(shù)字的同學(xué),其理由大體上有兩個(gè):或者認(rèn)為平均數(shù)集中在50-60之間,其2/3就集中在35-40之間;或者認(rèn)為都選100的話,66.7是最優(yōu)選擇,都選擇66.7的話,44是最優(yōu)選擇,而都選44的話,33是最優(yōu)選擇。
第三,有三個(gè)區(qū)間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區(qū)間的選擇者考慮群體的互動(dòng)推理的步驟存在差別,如0-10區(qū)間的選擇者考慮他人的推理步驟比31-40區(qū)間的選擇者多些。
第四,值得注意的是,11-20區(qū)間里的選擇較少(事實(shí)上是,在這個(gè)博弈中所選擇的數(shù)字落在這個(gè)區(qū)間是最有可能勝出的)。原因可能是,一旦選擇者進(jìn)行了多步的互動(dòng)推理,他們便能夠?qū)⑦@樣的推理進(jìn)行下去,從而將選擇向理論解0或1靠近。
第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個(gè)。一位選擇22的學(xué)生是這樣給出他所選擇的理由的:“作為理性人,我不會(huì)選擇大于2/3×100的數(shù),因?yàn)榧词顾腥硕歼x擇最大數(shù),平均數(shù)的2/3也不會(huì)超過2/3×100。如果大家和我一樣理智,那么大家都不會(huì)選擇大于2/3×100,那么我不會(huì)選擇大于100×2/3×2/3。因?yàn)樗麄冞x擇最大的他們可能會(huì)選的數(shù),平均數(shù)的2/3也不會(huì)超過2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會(huì)選擇1,然而我不認(rèn)為班里的人都是足夠理智,故平均數(shù)的2/3會(huì)大于1。根據(jù)兩次游戲,平均數(shù)的2/3在20~30。如果是我,我會(huì)選擇靠近20的數(shù),那我就22吧?!币粋€(gè)選擇10的學(xué)生的理由是:“如果其他人都是隨機(jī)選擇,那么平均數(shù)最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數(shù),那么33為平均數(shù),33×2/3≈22……如此推理應(yīng)該為1。但是并非所有人均是理性、均會(huì)如此計(jì)算。我對(duì)南大有信心,所以,我將數(shù)字選得接近1一點(diǎn),選10?!?/p>
第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認(rèn)為60是及格分,所以我選擇59”,“58是我的幸運(yùn)數(shù)字”,等等。
二、博弈的理論解分析
本實(shí)驗(yàn)是一個(gè)多人完全信息靜態(tài)博弈:參與者同時(shí)選擇行動(dòng),然后根據(jù)所有參與者的選擇,每個(gè)參與者得到各自的結(jié)果,每一參與者的收益函數(shù)在所有參與者之間是公共知識(shí)。
在這個(gè)實(shí)驗(yàn)中,參加考試的176位學(xué)生是參與者,每個(gè)考生同時(shí)對(duì)0-100之間的數(shù)字進(jìn)行選擇行動(dòng),即每個(gè)參與者的策略空間Si∈(0,100),即有101種可能的策略。根據(jù)所有考生的選擇,每個(gè)考生最后得出自己的結(jié)果,對(duì)每個(gè)考生來說,結(jié)果無非就是,自己的選擇是“大家所選數(shù)字的平均數(shù)的2/3”,勝出;要么與“大家所選數(shù)字的平均數(shù)的2/3”不一致,失敗。
我們假定該博弈的參與人都是絕對(duì)理性人(事實(shí)上,這個(gè)要求在實(shí)際中難以達(dá)到,這也是本文要得到的一個(gè)結(jié)論)。
我們來分析絕對(duì)理性人的推理過程。
在這個(gè)博弈中策略組合有176×101種,每種策略組合下,每個(gè)人的收益是公共知識(shí)。如:如所有人都選100,平均數(shù)為100,此時(shí)每人都失敗,勝出結(jié)果是100×2/3=67;如175人都選100,有一個(gè)人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識(shí)。
我們看到,任何人都不應(yīng)該選67或以上,或者選擇67或以上是非理性的,因?yàn)樗x擇的數(shù)字的最大平均數(shù)為100,此時(shí)勝出的數(shù)字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會(huì)選擇67或以上。
每個(gè)人都不會(huì)選擇67或以上,這本身也是公共知識(shí)。在這樣的公共知識(shí)的前提下,45以上的選擇都是不合理的,因?yàn)閷?duì)每個(gè)人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。
每個(gè)人都不會(huì)選擇45或以上,這本身也是公共知識(shí)。于是,每個(gè)人都認(rèn)為不應(yīng)該選擇30或以上。
……
結(jié)論是:每個(gè)人選擇0或1是合理的,它們是該博弈的理論解。
事實(shí)上,每個(gè)人選擇0或都選擇1是納什均衡:對(duì)每個(gè)人而言,在其他人不改變選擇的情況下,當(dāng)下的選擇是最優(yōu)的。
在所有人均選擇0的情況下,因?yàn)閷?duì)于每個(gè)人而言,若所有人都選擇0的話,0便成為平均數(shù),該數(shù)的2/3還是0。這樣,他選擇0是最優(yōu)選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點(diǎn)構(gòu)成納什均衡。
在所有人均選擇1的情況下,同樣,對(duì)于每個(gè)人而言,在其他人選擇1的情況下,平均數(shù)1的2/3為0.67,此時(shí)1最接近該數(shù)。因此,他選擇1是最優(yōu)選擇,并且若他改變了他的選擇他將失敗。因此,這點(diǎn)也構(gòu)成納什均衡。
當(dāng)然,面對(duì)多個(gè)納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個(gè)博弈中,每個(gè)人要考慮的是,他選擇0還是選擇1才能勝出呢?
他會(huì)這樣思考:沒有理由認(rèn)為其中一個(gè)比另外一個(gè)更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數(shù)應(yīng)該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優(yōu)選擇。
從上面的分析可見,盡管0和1是納什均衡點(diǎn),但選擇。是最優(yōu)選擇。
三、改進(jìn)博弈論的可能路徑
本文已經(jīng)表明,上述博弈是一個(gè)完全信息靜態(tài)博弈,然而,本實(shí)驗(yàn)的實(shí)驗(yàn)解(14.61)與理論解(0或1)之間發(fā)生偏離。本文認(rèn)為,有兩個(gè)主要原因:
第一,博弈論中所假定的理想主體與實(shí)際中的決策主體不相符合。理想的博弈參與人是絕對(duì)理性人;他們能夠進(jìn)行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時(shí)完成的,而實(shí)際博弈中人們是有界理性的。在我們的博弈實(shí)驗(yàn)中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應(yīng)當(dāng)知道0和1是均衡解,也能夠預(yù)測(cè)O是最有可能實(shí)現(xiàn)的結(jié)果。本實(shí)驗(yàn)表明,并不是所有人都能夠做出這樣分析的。并且,在實(shí)際中存在完全非理性的選擇,如本實(shí)驗(yàn)中選擇大于67的3人,這不是完全偶然現(xiàn)象。
關(guān)鍵詞:認(rèn)知無線電;功率控制;非合作博弈;納什均衡;效用函數(shù)
中圖分類號(hào):TN014文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-3198(2009)16-0265-02
0 前言
認(rèn)知無線電(cognitive radio,CR)是以軟件無線電(software radio)技術(shù)為基礎(chǔ)的能夠提高無線通信頻譜利用率的新技術(shù)。在很多國家,傳輸效率較高的頻段是以授權(quán)分配的方式分配給無線通信業(yè)務(wù)部門和運(yùn)營企業(yè)的,但這些頻段的授權(quán)用戶并不是在任何時(shí)刻都使用分配給他的頻段,因此不少傳輸效率很高的授權(quán)頻段會(huì)經(jīng)常處于空閑狀態(tài),這就浪費(fèi)了寶貴的頻譜資源。根據(jù)美國聯(lián)邦通信委員會(huì)(FCC)所進(jìn)行的大量研究表明,在大部分地區(qū),授權(quán)頻段的平均利用率在15%―85%之間,而一些傳輸效率較高的非授權(quán)頻段則過于擁擠。于是Joseph Mitola博士在1999年首先提出了認(rèn)知無線電概念,目的就是解決頻譜資源的有效利用問題。
博弈論(Game Theory)又被稱為對(duì)策論,是現(xiàn)代數(shù)學(xué)的一個(gè)分支,也是運(yùn)籌學(xué)的一個(gè)重要組成部分,是研究互動(dòng)決策的理論。John Nash博士在1950年提出了納什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。該理論指出,在一策略組合中,所有的參與者都面臨這樣一種情況,當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的,此時(shí)便達(dá)到了納什均衡。在納什均衡點(diǎn)上,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。這種參與者為了各自利益的最大化不斷改變策略的做法,與CR中各認(rèn)知用戶為爭(zhēng)得傳輸效率的最大化對(duì)頻譜和功率不斷進(jìn)行調(diào)整的自適應(yīng)算法策略相符。因此,可以引入非合作博弈論模型對(duì)CR的頻譜分配和功率控制算法進(jìn)行檢測(cè)和優(yōu)化。
本文以認(rèn)知用戶的滿意度為設(shè)計(jì)目標(biāo),引入代價(jià)函數(shù)得到一種新的基于非合作認(rèn)知無線電功率控制的博弈模型,并結(jié)合對(duì)該模型的分析介紹了非合作博弈論在CR中的一般分析方法。
1 認(rèn)知無線電體系結(jié)構(gòu)
認(rèn)知無線電是對(duì)軟件無線的擴(kuò)展,因此具備軟件無線可重新配置的特點(diǎn),并且能夠?qū)崿F(xiàn)基于環(huán)境認(rèn)知的自動(dòng)配置。S•Haykin根據(jù)CR所必需的頻譜掃描、信號(hào)分析、參數(shù)測(cè)量、頻譜決策、協(xié)議分析等功能,給出了CR系統(tǒng)構(gòu)成的基本功能結(jié)構(gòu),該結(jié)構(gòu)將CR系統(tǒng)分為三個(gè)功能模塊。
(1)無線頻譜分析模塊。
該模塊通過接收環(huán)境中的射頻激勵(lì),并利用自身算法對(duì)激勵(lì)信號(hào)進(jìn)行動(dòng)態(tài)分析,實(shí)時(shí)提供對(duì)環(huán)境中頻譜空穴的檢測(cè)情況,搜集可使用的頻譜空穴的信息。
(2)無線信道估計(jì)模塊。
該模塊根據(jù)無線頻譜分析模塊的分析結(jié)果,對(duì)無線信道狀態(tài)和容量進(jìn)行估計(jì),為系統(tǒng)通信信道的選擇提供依據(jù)。
(3)傳輸功率控制和動(dòng)態(tài)頻譜管理模塊。
該模塊根據(jù)頻譜分析模塊和信道估計(jì)模塊的分析結(jié)果,選擇最優(yōu)的頻譜空穴進(jìn)行通信。在通信過程中對(duì)傳輸功率進(jìn)行實(shí)時(shí)控制,使得首要用戶和次要用戶均能達(dá)到最優(yōu)的通信水平。
S•Haykin給出的三個(gè)功能模塊共同構(gòu)成了CR系統(tǒng)的物理層,從各個(gè)模塊所具備的功能可以看出認(rèn)知無線電是應(yīng)用了多種現(xiàn)代信號(hào)處理技術(shù)的綜合性通信平臺(tái)。
2 非合作博弈論在認(rèn)知無線電中的分析方法
認(rèn)知無線電中的策略選擇問題及相關(guān)算法的設(shè)計(jì)是該技術(shù)的研究核心。利用非合作博弈論,可以按以下方法及步驟對(duì)自適應(yīng)算法進(jìn)行分析:
(1)該算法是否能達(dá)到納什均衡。即驗(yàn)證算法是否能達(dá)到納什均衡,具體步驟為:先將所研究的問題抽象為相應(yīng)的非合作博弈算法模型,然后證明該模型中NE的存在性和唯一性。
(2)該算法達(dá)到納什均衡(NE)后的穩(wěn)定狀態(tài)是否符合帕累托最優(yōu)(Pareto Optimality)。即根據(jù)系統(tǒng)的目標(biāo)函數(shù)衡量這一穩(wěn)定狀態(tài)是否是實(shí)際應(yīng)用環(huán)境中的最優(yōu)情況。
(3)該算法達(dá)到納什均衡和帕累托最優(yōu)的約束條件。
3 基于非合作博弈論的認(rèn)知無線電功率控制模型
在認(rèn)知無線電中,非授權(quán)用戶接入處于空閑狀態(tài)的授權(quán)用戶頻段,可以提高系統(tǒng)的頻譜利用率,但是該接入過程必然會(huì)導(dǎo)致授權(quán)用戶和非授權(quán)用戶之間的干擾。這是由于在CR系統(tǒng)中通常采用動(dòng)態(tài)功率控制以擴(kuò)大通信系統(tǒng)的工作范圍,而每個(gè)用戶的發(fā)射功率都會(huì)對(duì)其他用戶造成干擾。2003年,為了規(guī)范移動(dòng)頻段的非授權(quán)操作,美國聯(lián)邦通信委員會(huì)(FCC)提出了新的量化和管理干擾的指標(biāo)――干擾溫度。在給定干擾溫度和頻譜空穴的限制下控制發(fā)射功率,可以看做為一組策略問題,而且在實(shí)際環(huán)境中很好的符合了非合作博弈的模型。在CR中,每個(gè)用戶都從自身的利益出發(fā),追求功率的最大化,而任何用戶發(fā)射功率的增大都會(huì)對(duì)其他用戶利益造成影響。因此需要提供一種有效的算法對(duì)各個(gè)用戶的發(fā)射功率進(jìn)行動(dòng)態(tài)控制,以達(dá)到所有用戶的總利益最大化。
在CR中可以用信道利用率、系統(tǒng)吞吐量、系統(tǒng)信干比等指標(biāo)來衡量用戶的利益。假設(shè)以系統(tǒng)信干比來衡量,設(shè)計(jì)算法時(shí)就應(yīng)當(dāng)以系統(tǒng)的總干擾水平最小化為設(shè)計(jì)目標(biāo)。
通常把授權(quán)用戶稱為主要用戶(Primary User),非授權(quán)用戶稱為次要用戶(Secondary User)。假設(shè)通信環(huán)境中多個(gè)主要用戶和次要用戶同時(shí)工作,次要用戶具有認(rèn)知能力,即把次要用戶看做認(rèn)知用戶。假設(shè)認(rèn)知用戶i的發(fā)射功率為pi,傳輸增益為gi,且認(rèn)知用戶與基站存在通信鏈路,基站接收到的該用戶的功率為pigi,第j個(gè)主要用戶對(duì)第i個(gè)次要用戶的干擾為Qij并有M個(gè)主要用戶,則相應(yīng)的次要用戶在基站處的信干比(SNIR)為:
ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)
其中σ2為基站處背景噪聲,Ri為傳輸速率,W為第i個(gè)用戶在的擴(kuò)頻帶寬。
文獻(xiàn)提出的非合作的認(rèn)知無線電網(wǎng)絡(luò)的功率控制純策略的博弈模型(NPCG)定義了:參與者I={1,2,…,N}為認(rèn)知網(wǎng)絡(luò)中非授權(quán)用戶的集合;策略空間pi,認(rèn)知用戶在一次博弈中選擇的策略構(gòu)成功率矢量P={p1,p2,…,pN};用 表示用戶i的效用,即用戶i對(duì)所選策略的滿意程度,其中p-i是除i外其他N-1個(gè)用戶的功率。
在該模型中,每個(gè)認(rèn)知用戶的策略都是盡量增大功率,以獲得更高的效用。但當(dāng)功率超過干擾溫度后,整個(gè)系統(tǒng)的性能會(huì)迅速惡化,進(jìn)而造成每個(gè)用戶的效用都會(huì)降低。因此,必須選定合適的代價(jià)函數(shù),使用戶獲得更高效用時(shí)付出相應(yīng)的代價(jià)??紤]到在低于干擾溫度時(shí),用戶只需付出較小的代價(jià),而當(dāng)超過干擾溫度時(shí),每增加一定的效用必須讓用戶付出更高昂的代價(jià),筆者選擇SINR的正切函數(shù)做為代價(jià)函數(shù):
Ci=tg(kri)(2)
其中k為干擾系數(shù),在認(rèn)知用戶發(fā)射功率接近干擾溫度時(shí),kri的取值接近π2 。
在非合作的認(rèn)知無線電網(wǎng)絡(luò)的功率控制純策略的博弈模型的基礎(chǔ)上,結(jié)合式(2)筆者提出基于非合作的功率控制算法的數(shù)學(xué)模型:
ui(pi,p-i)=Ripif(ri)-λpiritgri(3)
其中piri表示增加單位信干比所要增加的功率,λ為懲罰因子,代表代價(jià)函數(shù)有效性的量度。該模型通過引入代價(jià)函數(shù)增加了懲罰機(jī)制,以此來控制認(rèn)知用戶為追求信干比一味增大發(fā)射功率的行為。當(dāng)功率超過干擾溫度后的嚴(yán)厲懲罰,會(huì)使所有認(rèn)知用戶意識(shí)到,犧牲一定的信干比可以帶來效用的最優(yōu),從而將發(fā)射功率控制在干擾溫度以下,避免了超過干擾溫度后系統(tǒng)性能迅速下降的惡性情況出現(xiàn)。
按照上節(jié)介紹的分析步驟對(duì)式(3)給出的模型進(jìn)行分析,討論該模型是否存在納什均衡(NE)以及是否符合帕累托最優(yōu)。對(duì)式(3)求一階導(dǎo)數(shù)后可求得微分方程的駐點(diǎn),進(jìn)而再求出二階導(dǎo)數(shù),易證式(3)的二階導(dǎo)數(shù)小于零。因此可得出該非合作博弈過程中NE的存在性和唯一性,所求得的駐點(diǎn)為唯一的納什均衡點(diǎn),同時(shí)該駐點(diǎn)即為所應(yīng)滿足的約束條件。
4 結(jié)論
認(rèn)知無線電概念提出的20年以來,隨著相關(guān)技術(shù)的研究不斷深入、相關(guān)傳輸標(biāo)準(zhǔn)的確立以及計(jì)算機(jī)處理能力的提高,CR的應(yīng)用越來越廣泛。本文首先介紹了CR物理層的基本結(jié)構(gòu),然后結(jié)合一種新的基于NPCG的非合作非合作功率控制模型的構(gòu)建,介紹了非合作博弈論在認(rèn)知無線電中的分析方法。綜上所述,我們有理由相信,隨著相關(guān)理論和技術(shù)的不斷進(jìn)步,非合作博弈論必將在認(rèn)知無線電的功率分配、頻譜分配以及其他核心研究方向發(fā)揮更大的作用。
參考文獻(xiàn)
[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.
[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.
關(guān)鍵詞: 混合無線網(wǎng)絡(luò); 網(wǎng)絡(luò)選擇; 博弈論
中圖分類號(hào): TP391.41
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 2095-2163(2016)06-0141-03
0引言
近年來,隨著人們對(duì)無線網(wǎng)絡(luò)連接需要的日益增加,適用于不同工作情況與使用環(huán)境的無線網(wǎng)絡(luò)接入技術(shù)得到了飛速的發(fā)展。這些技術(shù)的提升進(jìn)步滿足了人們隨時(shí)隨地能夠接入到無線網(wǎng)絡(luò)中的理想訴求。人們使用的無線網(wǎng)絡(luò)連接設(shè)備,如筆記本電腦、平板電腦、手機(jī)等,往往同時(shí)配備了多種滿足不同通信需求的無線網(wǎng)絡(luò)接入技術(shù),如適用于近距離通信需要的Zigbee、Bluetooth,以及適用于中遠(yuǎn)距離通信需要的WiFi、WiMax、2G、LTE等。而且,同一地區(qū)被多種無線網(wǎng)絡(luò)覆蓋的情況也大大增加了,如辦公室、商場(chǎng)或者是家中,這些區(qū)域往往普遍配設(shè)有無限局域網(wǎng)絡(luò)與蜂窩網(wǎng)絡(luò),而蜂窩網(wǎng)絡(luò)常常也是由多家移動(dòng)網(wǎng)絡(luò)服務(wù)商各自優(yōu)化后、且分別提供的,如中國移動(dòng)、中國聯(lián)通等,如此這般的多種無線網(wǎng)絡(luò)接入技術(shù)共存的情況被稱為混合無線網(wǎng)絡(luò)。綜上可知,在此背景環(huán)境中,人們所能選擇的無線網(wǎng)絡(luò)的數(shù)量也必然增加。根據(jù)使用環(huán)境的各異以及用戶需求的不同,人們?cè)谶x擇移動(dòng)設(shè)備所要連接的無線網(wǎng)絡(luò)時(shí)將會(huì)綜合考慮多種因素,如網(wǎng)絡(luò)的穩(wěn)定性、網(wǎng)絡(luò)能提供的帶寬以及使用網(wǎng)絡(luò)需要付出的代價(jià)等。網(wǎng)絡(luò)選擇中的基本問題就是研究在多種無線網(wǎng)絡(luò)共存的情況下,人們(設(shè)備)如何根據(jù)自身的需要,選擇出最合適的無線網(wǎng)絡(luò),以及在選擇過程中設(shè)備更換無線網(wǎng)絡(luò)的行為趨勢(shì)。為了分析解決混合無線網(wǎng)絡(luò)中不同無線接入技術(shù)的選擇問題,目前已提出了多種方法,如文獻(xiàn)[1-2]提出的最大化用戶效用的選擇方法,文獻(xiàn)[3-5]提出的基于多種屬性滿足的決策制定方法等等。博弈論作為一種數(shù)學(xué)工具,常常用于研究分析在人們根據(jù)自己的情況選擇出最有利的策略時(shí),參與者的行為變化趨勢(shì)以及不同參與者之間相互影響的情況。在無線網(wǎng)絡(luò)的研究中,由于博弈論在分析無線網(wǎng)絡(luò)設(shè)備選擇不同通信策略時(shí)其所獲得的收益情況與各個(gè)設(shè)備行為特點(diǎn)上的優(yōu)勢(shì),越來越多的工作利用博弈理論來解決混合無線網(wǎng)絡(luò)中的網(wǎng)絡(luò)選擇問題[6-7]。本文總結(jié)了目前一些利用博弈理論來解決混合無線網(wǎng)絡(luò)中的網(wǎng)絡(luò)選擇問題的文章,給出了博弈理論在解決這類問題時(shí)的一般方法。
[JP3][BT4]1博弈論的基本概念以及網(wǎng)絡(luò)選擇問題的博弈模型[JP]
[BT5]1.1博弈論的基本元素
在博弈理論中,博弈是由博弈的參與者、參與者所能選擇的策略的集合、每個(gè)參與者選擇某種策略時(shí)所獲得的收益而構(gòu)成的優(yōu)選進(jìn)化過程,過程中包含著3個(gè)基本元素,現(xiàn)對(duì)其進(jìn)行如下定義描述。
1)參與者。博弈中能夠選擇自身策略的單位,可以是某一個(gè)體、也可以是某一群體,其目標(biāo)是通過選擇某種策略以使自己收益最大化,當(dāng)目標(biāo)為削減成本時(shí)為最小化。
2)策略集。策略集中包含了參與者能夠選擇的所有策略,每輪博弈時(shí)參與者將在其中選擇一個(gè)以指導(dǎo)自己的行為。
3)收益。參與者選擇某個(gè)策略時(shí)所能獲得的效用,該效用由參與者選擇的策略與其他參與者選擇的策略共同決定。
[BT5]1.2博弈結(jié)果描述方法
具體地,針對(duì)存在多個(gè)參與者的博弈描述中,每個(gè)參與者將根據(jù)收益的大小采取不同的策略,同時(shí)某個(gè)參與者采取的策略也將影響到其他參與者的收益。當(dāng)博弈重復(fù)進(jìn)行的時(shí)候,各參與者是否可以最終達(dá)到某一平衡狀態(tài),即參與者是否可以找到一種最合適的策略,使得博弈終止。博弈是否能夠終止,以及何時(shí)達(dá)到終止是博弈論中的重要研究部分。下面將調(diào)引最常用的描述博弈終止的狀態(tài)定義,即納什均衡狀態(tài)。
納什均衡狀態(tài)用于描述這樣一種情況,即在一個(gè)博弈中,所有的參與者都選擇好自己的策略后,如果任意一個(gè)參與者都不能在其他參與者保持所選策略也不變的前提下,通過改變自身采取的策略使得自己的收益增大。這時(shí),就可說系統(tǒng)達(dá)到了納什平衡狀態(tài)。
如果博弈的參與者用集合N={1,2,…,n}來表示,參與者可以選擇的策略用集合S來表示,參與者i所選擇的策略用si來表示si∈S,那么s*={s1*,s2*,…,sn*}為納什均衡,當(dāng)且僅當(dāng)對(duì)任意的i∈N,存在:
[HT5SS]ui(s*i,s*-i)≥ui(s'i,s*-i)[JY](1)
其中,s*-i表示除了參與者i以外其他參與者所選擇的策略,ui()為參與者的收益計(jì)算函數(shù)。并不是所有的博弈均存在納什均衡;同時(shí),有的博弈可能存在多個(gè)納什均衡。
[BT5]1.3網(wǎng)絡(luò)選擇問題的博弈模型
網(wǎng)絡(luò)選擇問題存在3種博弈情況。對(duì)于每種博弈情況,現(xiàn)做出分析概述如下。
1)用戶與用戶之間的博弈。這種情況下,博弈的參與者均為需要使用無線網(wǎng)絡(luò)的用戶,多個(gè)無線網(wǎng)絡(luò)用戶將分享若干個(gè)無線網(wǎng)絡(luò)接入服務(wù),每個(gè)用戶所能選擇的無線網(wǎng)絡(luò)接入點(diǎn)就是用戶所能采取的策略。用戶通過選擇不同的無線網(wǎng)絡(luò)接入點(diǎn)來最大化自己的收益或者最小化自己使用無線網(wǎng)絡(luò)服務(wù)所需支付的代價(jià)。
2)無線網(wǎng)絡(luò)服務(wù)商之間的博弈。這種情況下,博弈的參與者為能夠向用戶提供無線網(wǎng)絡(luò)服務(wù)的各個(gè)網(wǎng)絡(luò)服務(wù)商。各個(gè)無線網(wǎng)絡(luò)服務(wù)商通過采取不同的自費(fèi)策略來吸引更多的用戶選用自己的無線網(wǎng)絡(luò)服務(wù),從而達(dá)成最大化自己收益的目的。
3)無線網(wǎng)絡(luò)服務(wù)商與用戶之間的博弈。參與者分別為無線網(wǎng)絡(luò)服務(wù)商與用戶。服務(wù)商通過選擇不同服務(wù)資費(fèi)標(biāo)準(zhǔn)與服務(wù)對(duì)象來最大化自己的收益,而用戶則通過選擇不同的服務(wù)商來最大化自己可能獲得的網(wǎng)絡(luò)效用。
[BT4]2博弈論在網(wǎng)絡(luò)選擇問題上的主要研究情況
[BT5]2.1用戶與用戶之間的博弈
文獻(xiàn)[8]將網(wǎng)絡(luò)選擇問題描述為各個(gè)自利用戶之間的非合作博弈,并使用擁塞博弈模型來研究用戶的行為情況。在該博弈中,用戶可以在多個(gè)可用的無線網(wǎng)絡(luò)的不同頻段中選擇其中之一進(jìn)行連接,在選擇某個(gè)網(wǎng)絡(luò)后,該用戶將會(huì)造成一定程度的網(wǎng)絡(luò)擁塞,同時(shí)用戶需要為其造成的擁塞支付費(fèi)用,而費(fèi)用的高低將由網(wǎng)絡(luò)當(dāng)前的擁塞程度決定。作者形式化地給出了網(wǎng)絡(luò)擁塞程度的描述以及用戶所需支付的費(fèi)用。實(shí)現(xiàn)過程是將該用戶的網(wǎng)絡(luò)選擇情況用一組布爾值來設(shè)定其表示,如表示用戶u是否選擇了a網(wǎng)絡(luò)的布爾值bua。當(dāng)用戶u選擇了網(wǎng)絡(luò)a時(shí),bua=1,如果沒有選擇網(wǎng)絡(luò)a,bua=0。此后,研究利用整數(shù)規(guī)劃的方法求解了該博弈的納什均衡策略。
文獻(xiàn)[9]利用演化博弈模型來研究用戶的網(wǎng)絡(luò)選擇問題。演化博弈在傳統(tǒng)的博弈理論中加入了種群的概念,種群用于表示一組相同類型的用戶,種群中的用戶可以改變自己的策略以使種群的總體收益增加,或者使種群中其他用戶改變自己的行為,以達(dá)到收益均衡的目的。項(xiàng)研究利用了演化博弈中的復(fù)制動(dòng)態(tài)來研究一群同類用戶的行為變化情況。復(fù)制動(dòng)態(tài)用來表示種群中選擇不同策略的用戶的比例的變化情況,數(shù)學(xué)上是利用常微分方程來構(gòu)建表示, 其對(duì)應(yīng)公式為:
[HT5SS]x?i(t)=xi[fi(t)-(t)][JY](2)
其中,xi表示種群中采用策略i的個(gè)體占種群全體的比例,xi=ni/N,ni為選擇i策略的用戶的數(shù)量,N表示種群中用戶的總數(shù)量。fi(t)表示參與者選擇策略i所獲得的收益,(t)表示該種群中所有參與者獲得的平均收益。
文獻(xiàn)[10]描述了裝備有多種無線網(wǎng)絡(luò)通信技術(shù)的設(shè)備,在不同網(wǎng)絡(luò)之間切換服務(wù),以達(dá)到自身獲得的網(wǎng)絡(luò)吞吐量最大的目的。文章給出了2類不同的無線網(wǎng)絡(luò)技術(shù)的帶寬分配模型,全面分析在了每種無線網(wǎng)絡(luò)技術(shù)下用戶的行為變化情況,給出了用戶最大化自身收益的算法,并證明了在同種無線通信技術(shù)內(nèi)部切換無線網(wǎng)絡(luò)基站的情況下,系統(tǒng)存在納什均衡,即用戶在經(jīng)歷有限的基站選擇變化后,所有用戶均將達(dá)到穩(wěn)定狀態(tài),而無需繼續(xù)改變自身的選擇。
[BT5]2.2無線網(wǎng)絡(luò)服務(wù)商之間的博弈
文獻(xiàn)[11]提出了一個(gè)由4部分組成的用于分配管理無線傳輸資源系統(tǒng)框架,其中包括網(wǎng)絡(luò)層分配、容量預(yù)留機(jī)制、用戶接入控制以及連接層分配。作者將帶寬分配問題描述為不同接入網(wǎng)絡(luò)之間的博弈,同時(shí)在系統(tǒng)達(dá)到納什均衡時(shí),網(wǎng)絡(luò)總效益最大。
文獻(xiàn)[12]將2個(gè)獨(dú)立的無線局域網(wǎng)之間的接入控制問題描述為多階段的非合作博弈問題。該博弈中的參與者為2個(gè)無線局域網(wǎng),而策略集則為用戶發(fā)出的網(wǎng)絡(luò)接入請(qǐng)求。博弈的結(jié)果給出了2個(gè)網(wǎng)絡(luò)最大化自身收益時(shí),網(wǎng)絡(luò)接入請(qǐng)求在2個(gè)無線網(wǎng)絡(luò)中的分布情況,
文獻(xiàn)[13]描述了在多個(gè)無線網(wǎng)絡(luò)共存的環(huán)境中,存在一個(gè)移動(dòng)著的用戶。為了保證負(fù)載平衡以及減少用戶在各個(gè)網(wǎng)絡(luò)的交接,作者提出了一合作博弈的方法。參與者為區(qū)域中各個(gè)可以被用戶連接的無線網(wǎng)絡(luò),其策略集為用戶使用每個(gè)網(wǎng)絡(luò)的優(yōu)先級(jí)。每個(gè)候選網(wǎng)絡(luò)的收益為當(dāng)前網(wǎng)絡(luò)負(fù)載、預(yù)定負(fù)載界限與網(wǎng)絡(luò)懲罰權(quán)重的函數(shù)。博弈的目標(biāo)是使每個(gè)候選網(wǎng)絡(luò)的收益值最大。
2.3無線網(wǎng)絡(luò)服務(wù)商與用戶之間的博弈
文獻(xiàn)[14]利用將無線網(wǎng)絡(luò)服務(wù)商與用戶之間的競(jìng)爭(zhēng)描述為雙方博弈的方式,提出了一種防止擁塞的控制機(jī)制。作者提出框架包括2個(gè)博弈,其中一個(gè)為接入控制博弈,另一個(gè)為負(fù)載控制博弈。接入控制博弈利用了經(jīng)典的囚徒困境模型,參與者為各種用戶-服務(wù)商對(duì)。每一種服務(wù)請(qǐng)求代表了每個(gè)參與者具有2個(gè)策略選擇的博弈。服務(wù)商可以接受或者拒絕服務(wù)請(qǐng)求,而用戶可以選擇繼續(xù)接受服務(wù)或者停止接受當(dāng)前服務(wù)商的服務(wù)。作者討論了該博弈的純策略納什均衡的存在情況。在負(fù)載控制博弈中,用戶在不停止傳輸?shù)那闆r下選擇是否離開當(dāng)前服務(wù)商,而服務(wù)商也可以選擇是否終止提供服務(wù)。文章表明當(dāng)服務(wù)商同時(shí)運(yùn)用2種策略時(shí),得到的收益將會(huì)達(dá)至最大。
[BT4]3結(jié)束語
本文總結(jié)了當(dāng)前利用博弈理論分析解決混合無線網(wǎng)絡(luò)中網(wǎng)絡(luò)選擇問題的一些代表性工作。值得注意的是,在利用博弈論解決該問題時(shí),不能僅停留在判斷是否存在納什均衡的層面上,還需對(duì)如何達(dá)到納什均衡進(jìn)行研究。博弈論分析了混合無線網(wǎng)絡(luò)中的參與者在為了最大化收益時(shí)的行為情況,為提出更加有效的網(wǎng)絡(luò)選擇方案作出了有益、且實(shí)用的貢獻(xiàn)。
參考文獻(xiàn):
[1]
BARI F, LEUNG V. Use of nonmonotonic utility in multi-attribute network selection[C]//Processings of Wireless Telecommunications Symposium 2007. Pomona:IEEE, 2001:1C8.
[2] NGUYEN-VUONG Q T, GHAMRIDOUDANE Y, AGOULMINE N. On utility models for access network selection in wireless heterogeneous networks[C]//Processings of Network Operations and Management Symposium 2008. Salvador: IEEE, 2001:144-151.
[3] WANG L, BINET D. TRUST: a triggerbased automatic subjective weighting method for network selection[C]//Processings of Fifth Advanced International Conference On Telecommunications 2009. Venice:IEEE, 2009: 362-368.
[4] BAKMAZ B, BOJKOVIC Z, BAKMAZ M. Network selection algorithm for heterogeneous wireless environment[C]//Processings of IEEE 18th International Symposium on Personal, Indoor and Mobile Radio Communications 2007. Athens:IEEE, 2007: 1-4.
[5] BARI F, LEUNG V. Automated network selection in a heterogeneous wireless network environment[J]. Network, IEEE, 2007, 21(1): 34-40.
[6] STEVENSNAVARRO E, WONG V W S. Comparison between vertical handoff decision algorithms for heterogeneous wireless networks[C]//Processings of Vehicular technology conference 2006. Melbourne:IEEE, 2006: 947-951.
[7] ZHANG W. Handover decision using fuzzy MADM in heterogeneous networks[C]//Processings of Wireless Communications and Networking Conference 2004. Atlanta:IEEE, 2004: 653-658.
[8] MALANCHINI I, CESANA M, GATTI N. Network selection and resource allocation games for wireless access networks[J]. IEEE Transactions on Mobile Computing, 2013, 12(12): 2427-2440.
[9] NIYATO D, HOSSAIN E. Dynamics of network selection in heterogeneous wireless networks: an evolutionary game approach[J]. IEEE Transactions on Vehicular Technology, 2009, 58(4):2008-2017.
[10]ARYAFAR E, KESHAVARZ-HADDAD A, WANG M, et al. RAT selection games in HetNets[C]//Proceedings of INFOCOM 2013. Turin:IEEE, 2013:998-1006.
[11]NIYATO D, HOSSAIN E. A noncooperative gametheoretic framework for radio resource management in 4G heterogeneous wireless access networks[J]. Mobile Computing, IEEE Transactions on, 2008, 7(3):332-345.
[12]CHARILAS D E, MARKAKI O I, VLACHEAS P T. Admission control as a noncooperative multistage game between wireless networks[C]//Processings of Systems, International Conference on Signals and Image 2009. Chalkida:IEEE, 2009: 1-5.
引言
一、兩個(gè)簡(jiǎn)單的例子
1.1 老鷹(Hawk)與鴿子(Dove)博弈
1.2 系統(tǒng)選擇博弈
二、進(jìn)化博弈理論的產(chǎn)生及其發(fā)展
2.1 理性的由來及其缺陷
2.2 心理學(xué)研究成果及有限理性概念的提出
2.3 進(jìn)化博弈理論的產(chǎn)生及其發(fā)展
三、進(jìn)化博弈理論的基本內(nèi)容
3.1 進(jìn)化博弈理論基本模型分類
3.2 進(jìn)化博弈理論基本均衡概念-----進(jìn)化穩(wěn)定策略
3.3 進(jìn)化博弈理論基本動(dòng)態(tài)概念----模仿者動(dòng)態(tài)
四、進(jìn)化博弈理論的應(yīng)用
五、傳統(tǒng)方法的缺陷及進(jìn)化博弈理論研究方法的現(xiàn)實(shí)性
5.1 新古典經(jīng)濟(jì)學(xué)均衡分析法的缺陷
5.2 經(jīng)典博弈理論的策略互動(dòng)分析法及其缺陷
5.3 進(jìn)化博弈理論局部動(dòng)態(tài)分析方法的現(xiàn)實(shí)性
5.3.1 局部動(dòng)態(tài)分析法的均衡觀
5.3.2 局部動(dòng)態(tài)法的時(shí)間觀
5.3.3 局部動(dòng)態(tài)法的均衡選擇觀
5.3.4 局部動(dòng)態(tài)法的特殊性
六、結(jié)論
參考文獻(xiàn)
摘要
本文從兩個(gè)簡(jiǎn)單的博弈例子出發(fā),以通俗的語言全面介紹了進(jìn)化博弈理論的理性基礎(chǔ)及其形成、發(fā)展、基本內(nèi)容和部分應(yīng)用,在此基礎(chǔ)上文章進(jìn)一步比較了新古典經(jīng)濟(jì)學(xué)、經(jīng)典博弈理論 ①及進(jìn)化博弈理論在研究方法上的不同之處,并特別強(qiáng)調(diào)了進(jìn)化博弈理論局部動(dòng)態(tài)法的均衡觀、時(shí)間觀、均衡選擇觀及方法上的特殊性。進(jìn)化博弈理論的局部動(dòng)態(tài)分析方法既是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新又是經(jīng)濟(jì)學(xué)直面現(xiàn)實(shí)的有力武器。
關(guān)鍵詞:沉默互動(dòng);社會(huì)互動(dòng);進(jìn)化穩(wěn)定策略;模仿者動(dòng)態(tài);均衡分析法;局部動(dòng)態(tài)法
引言
為什么同樣一項(xiàng)經(jīng)濟(jì)制度在某個(gè)地方對(duì)經(jīng)濟(jì)發(fā)展有積極的推動(dòng)作用而在另一個(gè)地方對(duì)經(jīng)濟(jì)發(fā)展卻起著消極的阻礙作用?為什么能夠有效降低交易費(fèi)用的中介在一些地方會(huì)出現(xiàn)而在另一些地方卻不能出現(xiàn)?為什么同樣的管理方法在一個(gè)地方顯示出高效率而在另一地方卻不具有效率?諸如此類的問題,新古典經(jīng)濟(jì)學(xué)利用均衡分析法都無法給出令人滿意的答案。均衡分析法的最大缺陷是把經(jīng)濟(jì)系統(tǒng)中參與人看作是互不聯(lián)系的單個(gè)人(僅研究單個(gè)生產(chǎn)者或消費(fèi)者的行為),不能把其所考察的問題放在一定的環(huán)境中去,該方法完全忽略了制度環(huán)境、社會(huì)環(huán)境及人文環(huán)境等對(duì)參與人行為的影響,單純考察某個(gè)條件與結(jié)果之間的一一對(duì)應(yīng)關(guān)系。因而,無法對(duì)現(xiàn)實(shí)中出現(xiàn)的諸多現(xiàn)象給予合理的解釋。博弈理論盡管把參與人之間行為互動(dòng)關(guān)系納入到了模型之中,但依然沒能跳出新古典均衡分析法的基本框架,并且由于其對(duì)理性賦予更強(qiáng)的假定,使得該理論更加脫離現(xiàn)實(shí)。進(jìn)化博弈理論則一反常規(guī),從一種全新的視角來考察經(jīng)濟(jì)及社會(huì)問題,它所提供的局部動(dòng)態(tài)研究方法是從更現(xiàn)實(shí)的社會(huì)人出發(fā),把其所考察的問題都置于一定的環(huán)境中進(jìn)行更全面的分析,因而,其結(jié)論更接近于現(xiàn)實(shí)且具有較強(qiáng)的說服力。進(jìn)化博弈理論屬于經(jīng)濟(jì)學(xué)的前沿理論,該理論從其理論框架建立到現(xiàn)在僅僅只有近三十年的歷史,但其在經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、生態(tài)學(xué)等領(lǐng)域卻得到了廣泛的應(yīng)用,近年來已經(jīng)成為主流經(jīng)濟(jì)的研究方法之一。在我國由于歷史原因,對(duì)經(jīng)濟(jì)學(xué)的研究起步較晚,特別對(duì)進(jìn)化博弈這樣的前沿理論更是知者甚少,本文的主要目的是以通俗的語言介紹進(jìn)化博弈理論的相關(guān)內(nèi)容及其應(yīng)用,讓讀者對(duì)該理論有一個(gè)全面的了解。
本文的結(jié)構(gòu)如下:第一部分給出進(jìn)化博弈理論的兩個(gè)典型的例子;第二部分對(duì)進(jìn)化博弈理論的產(chǎn)生及其發(fā)展進(jìn)行闡述;第三部分對(duì)進(jìn)化博弈理論的基本內(nèi)容進(jìn)行簡(jiǎn)要的介紹;第四部分概述進(jìn)化博弈理論的有關(guān)應(yīng)用;第五部分論述傳統(tǒng)的經(jīng)濟(jì)學(xué)研究方法的缺陷及進(jìn)化博弈理論研究方法的現(xiàn)實(shí)性;第六部分對(duì)進(jìn)化博弈理論的發(fā)展及理論前景進(jìn)行簡(jiǎn)要的說明。
一、兩個(gè)簡(jiǎn)單的例子
為了下文說明的方便,本文先給出進(jìn)化博弈理論中兩個(gè)具有代表性的例子,在此基礎(chǔ)上再進(jìn)一步給出該理論的基本內(nèi)容及其研究方法的基本特點(diǎn)。
1.1 老鷹(Hawk)與鴿子(Dove)博弈
假定一個(gè)生態(tài)環(huán)境中有老鷹與鴿子兩種動(dòng)物,它們?yōu)榱松嫘枰獱?zhēng)奪有限的資源(如食物或生存空間等)而競(jìng)爭(zhēng)。老鷹一般比較兇悍,必要時(shí)在斗爭(zhēng)中直到重傷。鴿子一般比較溫馴,競(jìng)爭(zhēng)時(shí)在強(qiáng)敵面前常常退縮。競(jìng)爭(zhēng)中獲勝者得到了生存資源就可以更好地繁衍后代,重傷者則不利于其后代生長(zhǎng),即會(huì)減少其后代的數(shù)量。如果群體中老鷹與鴿子相遇并競(jìng)爭(zhēng)資源,那么老鷹就會(huì)輕而易舉地獲得全部資源,而鴿子由于害怕強(qiáng)敵退出爭(zhēng)奪,從而不能獲得任何資源(當(dāng)然不會(huì)受傷);如果群體中兩個(gè)鴿子相遇并競(jìng)爭(zhēng)生存資源,由于它們均膽小怕事不愿意戰(zhàn)斗,結(jié)果平分資源;如果群體中兩個(gè)老鷹相遇并競(jìng)爭(zhēng)有限的生存資源,由于它們都非常勇猛而相互殘殺,直到雙方受到重傷而精疲力竭,結(jié)果雖然雙方都獲得部分生存資源但損失慘重,入不敷出。假定競(jìng)爭(zhēng)中得到全部資源為50個(gè)單位(該數(shù)字也可以表示為生物的適應(yīng)度、繁殖成活率或后代數(shù)量);得不到資源則表示其適應(yīng)度為零;雙方重傷則用來表示。于是老鷹、鴿子兩種動(dòng)物進(jìn)行的資源競(jìng)爭(zhēng)可以用一個(gè)對(duì)稱博弈來描述,博弈的支付矩陣如下:
操作依賴于該群體的初始狀態(tài)。如果初始時(shí),該宿舍有多于4人使用操作系統(tǒng),那么該宿舍所有學(xué)生最終都會(huì)使用該操作系統(tǒng);否則所有學(xué)生最終會(huì)使用操作系統(tǒng)。
二、進(jìn)化博弈理論的產(chǎn)生及其發(fā)展
進(jìn)化博弈理論是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新,該理論從否定傳統(tǒng)理論賴以成立的基礎(chǔ)----理性人假定出發(fā)而建立起來一個(gè)新的分析框架,它結(jié)合了生態(tài)學(xué)、社會(huì)學(xué)、心理學(xué)及經(jīng)濟(jì)學(xué)的最新發(fā)展成果,從有限理性的社會(huì)人出發(fā)來分析參與人的資源配置行為。
2.1 理性的由來及其缺陷
經(jīng)濟(jì)學(xué)自從古希臘哲學(xué)中分離出來并成為一門系統(tǒng)的學(xué)問,是在亞當(dāng)•斯密1776年發(fā)表《國富論》之后。以斯密為代表的古典經(jīng)濟(jì)學(xué)關(guān)注的核心是資源的稀缺程度如何能被人類經(jīng)濟(jì)活動(dòng)所減少,他們關(guān)注的重點(diǎn)不是資源配置問題而是國民財(cái)富的增長(zhǎng)及國別差異的原因。1890年馬歇爾《經(jīng)濟(jì)學(xué)原理》的出版,標(biāo)志著新古典經(jīng)濟(jì)學(xué)的成形,馬歇爾之后,新古典經(jīng)濟(jì)學(xué)關(guān)注的核心逐漸轉(zhuǎn)向在給定稀缺程度下資源的最優(yōu)配置問題。稀缺資源的配置是需要人的參與,也就是說經(jīng)濟(jì)學(xué)研究的問題演變?yōu)殛P(guān)于經(jīng)濟(jì)中參與人如何把稀缺的資源配置到效率最高地方去的問題,強(qiáng)調(diào)個(gè)體行為在資源配置中的作用。經(jīng)濟(jì)中參與人的決策行為是通過高度復(fù)雜的思維活動(dòng)作出的,為了更好地從微觀個(gè)體行為來解釋資源配置問題,新古典經(jīng)濟(jì)學(xué)借用了哲學(xué)中“理性”概念對(duì)復(fù)雜的人類行為過程進(jìn)行了抽象的假定。然而,理性一詞用于經(jīng)濟(jì)學(xué)時(shí)卻對(duì)其含義的理解與哲學(xué)中對(duì)其含義的理解已經(jīng)有了明顯的區(qū)別。哲學(xué)中的理性是指人類所特有的用以探索自然和社會(huì)奧秘的認(rèn)知能力,當(dāng)代偉大的哲學(xué)家康德在其著作《純理性批判》一書中指出,人類理性即認(rèn)知能力并不是萬能的,而是有限的。經(jīng)濟(jì)學(xué)中的理性則是指一種行為方式,具體地說即是經(jīng)濟(jì)中參與人對(duì)其所處世界的各種狀態(tài)及不同狀態(tài)對(duì)自己支付的意義都具有完全信息,并且在既定的條件下每個(gè)參與人都具有選擇使自己獲得最大效用或最大利潤(rùn)的能力。
經(jīng)濟(jì)學(xué)家認(rèn)為理性是至高無上的,人們憑借理性就可以完全地認(rèn)識(shí)自然與社會(huì)。經(jīng)濟(jì)學(xué)中對(duì)理性的含義經(jīng)過這樣的處理以后,就使得經(jīng)濟(jì)學(xué)能夠充分運(yùn)用數(shù)學(xué)理論發(fā)展的成果來進(jìn)行分析。為了應(yīng)用數(shù)學(xué)工具并更好地處理經(jīng)濟(jì)問題,傳統(tǒng)經(jīng)濟(jì)學(xué)家們從偏好,信念及理性三個(gè)方面來界定經(jīng)濟(jì)主體的特征,其中信念就是個(gè)體認(rèn)為不同結(jié)果將會(huì)出現(xiàn)的基于個(gè)體所獲信息之上的條件概率。偏好則是基于不同結(jié)果的信念之上的序。理性是根據(jù)上述偏好及信念,個(gè)體獲得最優(yōu)決策的程度以及個(gè)體根據(jù)已經(jīng)獲得的信息來修正其信念的能力。這三個(gè)特征使得經(jīng)濟(jì)學(xué)研究的對(duì)象由現(xiàn)實(shí)人轉(zhuǎn)向了理想化的對(duì)象,經(jīng)濟(jì)學(xué)越來越偏離了現(xiàn)實(shí)。
由理性概念而引致的缺陷首先表現(xiàn)在理性人具有無限的信息收集及處理能力的均衡觀,認(rèn)為經(jīng)濟(jì)系統(tǒng)常常處于均衡狀態(tài),非均衡只是一種暫時(shí)的現(xiàn)象,當(dāng)受到外生因素?cái)_動(dòng)而使系統(tǒng)偏離均衡狀態(tài)時(shí),系統(tǒng)會(huì)以線性的方式回歸均衡,這種機(jī)械式線性反應(yīng)的均衡觀來源于牛頓力學(xué),由此而得出的比較靜態(tài)分析法完全忽視了系統(tǒng)受到非線性擾動(dòng)及連續(xù)因素的影響。其次表現(xiàn)在由全知全能的理性人而引致的均衡跳躍觀,認(rèn)為經(jīng)濟(jì)系統(tǒng)達(dá)到均衡或者從一個(gè)均衡到另一個(gè)均衡是不需要時(shí)間的,認(rèn)為時(shí)間是可逆的,即經(jīng)濟(jì)變量與物理學(xué)的變量一樣,只要條件相同系統(tǒng)的均衡也就相同,市場(chǎng)和經(jīng)濟(jì)對(duì)于過去的記憶是短暫的或者是沒有的。這種應(yīng)用經(jīng)典牛頓力學(xué)分析方法來分析高度復(fù)雜的參與人經(jīng)濟(jì)行為使得其預(yù)測(cè)效果大打折扣。最后表現(xiàn)在其比較靜態(tài)分析方法上,傳統(tǒng)經(jīng)濟(jì)學(xué)的最基本分析方法----比較靜態(tài)分析法賴以成立的基礎(chǔ)是假定經(jīng)濟(jì)系統(tǒng)只受到外界一個(gè)個(gè)相互獨(dú)立、互不重疊的沖擊的影響,或者當(dāng)一個(gè)因素的影響消除之后,下一因素才開始對(duì)經(jīng)濟(jì)系統(tǒng)產(chǎn)生影響。我們知道現(xiàn)實(shí)世界是普遍聯(lián)系的,各種因素之間不可能相互獨(dú)立,系統(tǒng)中任何一個(gè)因素的變動(dòng)都會(huì)引起其他因素的變動(dòng),這些因素之間相互作用的時(shí)間可能很短也可能很長(zhǎng),各因素對(duì)最終目標(biāo)會(huì)產(chǎn)生不同程度的影響。比較靜態(tài)法卻只見局部不見整體,企圖通過比較不同均衡來找出系統(tǒng)達(dá)到均衡的條件,因此得不出符合現(xiàn)實(shí)的結(jié)論,其研究方法上的局限性大大降低了其理論的現(xiàn)實(shí)意義。
2.2 心理學(xué)研究成果及有限理性概念的提出
隨著經(jīng)濟(jì)學(xué)家對(duì)理論研究的深入,特別近來實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的迅速發(fā)展,主流經(jīng)濟(jì)學(xué)賴以成立的基礎(chǔ)“理性人”假定及其基本的比較靜態(tài)均衡分析法越來越受到了人們的質(zhì)疑。相繼出現(xiàn)了許多其他的研究方法,其中在經(jīng)濟(jì)學(xué)中影響最大的就是心理學(xué)的研究方法。心理學(xué)應(yīng)用于經(jīng)濟(jì)分析有著非常曲折的歷史。事實(shí)上,斯密、馬歇爾、庇古、費(fèi)雪爾和凱恩斯等一批古典經(jīng)濟(jì)學(xué)家都仔細(xì)地分析了偏好和信念的心理學(xué)基礎(chǔ)。但從1940’s開始,一方面受到薩繆爾森及希克斯等新一派基于理性假定經(jīng)濟(jì)學(xué)家的影響,心理分析在經(jīng)濟(jì)學(xué)中的地位慢慢地被降低了;另一方面理性模型也遇到了許多如Allais(1952)悖論等難以給出合理解釋的經(jīng)濟(jì)現(xiàn)象。于是1960’s開始,許多微觀經(jīng)濟(jì)學(xué)家再次運(yùn)用心理學(xué)研究方法來解釋現(xiàn)實(shí)中的異常現(xiàn)象,宏觀經(jīng)濟(jì)學(xué)也把經(jīng)驗(yàn)法則和適應(yīng)性預(yù)期納入到其模型之中,正是在這一時(shí)期心理學(xué)家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初隨著Robert Lucas等人提出的理性預(yù)期理論、Selten、Kreps等倡導(dǎo)的強(qiáng)調(diào)正確信念及貝葉斯修正的博弈理論及Stiglitz、Spence等研究的信息經(jīng)濟(jì)學(xué)理論相繼成為主流經(jīng)濟(jì)學(xué)的一部分,經(jīng)濟(jì)學(xué)界再一次掀起了排除滲透在經(jīng)濟(jì)學(xué)領(lǐng)域中心理學(xué)研究方法的熱潮,心理的研究方法在經(jīng)濟(jì)學(xué)界幾乎無立足之地,嚴(yán)格理性假定席卷整個(gè)經(jīng)濟(jì)學(xué)界。行為經(jīng)濟(jì)學(xué)的發(fā)起者Amos Tversky在經(jīng)濟(jì)學(xué)界根本找不到志趣相投者。1970’s末期,隨著心理學(xué)家Amos Tversky與Kahneman合作發(fā)表了一系列應(yīng)用心理分析方法來研究經(jīng)濟(jì)學(xué)問題的原創(chuàng)性文章,如1974年他們?cè)赟cience發(fā)表的Judgment under uncertainty: Heuristics and biases,1979年他們合作在Econometrica發(fā)表Prospect theory: An analysis of decision under risk,慢慢消除了經(jīng)濟(jì)學(xué)界中存在的對(duì)心理學(xué)分析方法的偏見,此后應(yīng)用心理分析方法來解釋經(jīng)濟(jì)現(xiàn)象的文獻(xiàn)見諸于各種經(jīng)濟(jì)學(xué)期刊之中,心理分析方法也漸漸地成為了主流經(jīng)濟(jì)學(xué)的研究方法之一。
進(jìn)入1980’s,隨著經(jīng)典博弈理論、生態(tài)理論及心理學(xué)理論研究的深入發(fā)展,特別是心理學(xué)家西蒙把其在心理學(xué)領(lǐng)域研究的成果直接應(yīng)用經(jīng)濟(jì)分析并因此獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),極大地激勵(lì)著經(jīng)濟(jì)及社會(huì)學(xué)家從現(xiàn)實(shí)人行為出發(fā)來解釋經(jīng)濟(jì)及社會(huì)現(xiàn)象。心理學(xué)研究表明人類認(rèn)知過程首先表現(xiàn)為人們通過一種“感知秩序”進(jìn)行學(xué)習(xí)活動(dòng),并形成分散的非同質(zhì)的知識(shí),其中“感知秩序”是指人的理解力、知識(shí)和人類行動(dòng)之間的關(guān)系;其次表現(xiàn)為個(gè)體通過學(xué)習(xí)所達(dá)到的理性程度的有限性,組織學(xué)習(xí)個(gè)體學(xué)習(xí)行為的整合而形成的多層次“理性結(jié)構(gòu)”,個(gè)體理性便會(huì)在一個(gè)累積性的組織或制度環(huán)境中得到塑造和提高并發(fā)揮作用,在這個(gè)過程中,個(gè)體學(xué)習(xí)行為總會(huì)受到組織、習(xí)慣和文化等制度性的限制和影響。西蒙認(rèn)為人類并不是完全理性而是有限理性的,因?yàn)槿祟愓J(rèn)知能力有著心理的臨界極限,人類進(jìn)行推理活動(dòng)需要消耗大量的能量,推理也是一種相對(duì)稀缺的資源,另外決策者決策時(shí)需要大量的信息,而這些信息是不可能免費(fèi)獲得的,獲得決策所需要的信息是需要大量成本的??紤]到參與人有限的知識(shí)水平、有限的推理能力、有限的信息收集及處理能力,經(jīng)濟(jì)主體的決策行為并非總是最大化的結(jié)果,其決策受到參與人所處的社會(huì)環(huán)境、過去的經(jīng)驗(yàn)、日常慣例及其他人相似情形下的行為選擇等因素的影響。在有限理性條件下,由于參與人無法免費(fèi)獲得決策所需要的全部信息,并且參與人即使獲得了決策所需要的全部信息也可能由于有限的計(jì)算能力而無法得出最優(yōu)決策。因此,參與人只能采取模仿、學(xué)習(xí)等簡(jiǎn)單的直觀決策方法或一些固定的常規(guī)來進(jìn)行決策。人類的決策結(jié)果受到復(fù)雜的認(rèn)知過程的影響,不同的人或者同一個(gè)人在不同時(shí)間即使給出相同的條件也可能會(huì)得出不同的決策結(jié)果,即決策結(jié)果受到認(rèn)知過程的路徑影響。
2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主之一心理學(xué)家丹尼爾·卡內(nèi)曼(Daniel Kahneman)將源于心理學(xué)的綜合洞察力應(yīng)用于研究在不確定條件下參與人的決策過程及行為結(jié)果并展示了人為決策是如何異于標(biāo)準(zhǔn)經(jīng)濟(jì)理論預(yù)測(cè)的結(jié)果。在1979年,他與有著深厚數(shù)學(xué)及哲學(xué)背景的心理學(xué)家特韋爾斯基(Tversky)提出了震撼經(jīng)濟(jì)學(xué)界的“前景理論”(Prospect theory)。他們的發(fā)現(xiàn)激勵(lì)了新一代經(jīng)濟(jì)學(xué)研究人員運(yùn)用認(rèn)知心理學(xué)來研究經(jīng)濟(jì)學(xué),使經(jīng)濟(jì)學(xué)的理論更加豐富。一個(gè)理論獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)不僅是對(duì)獲獎(jiǎng)?wù)哌^去成就的肯定,更主要說明了獲獎(jiǎng)理論將會(huì)成為主流經(jīng)濟(jì)學(xué)未來的發(fā)展方向。2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予給丹尼爾·卡內(nèi)曼標(biāo)志著經(jīng)濟(jì)學(xué)的研究對(duì)象從傳統(tǒng)的“經(jīng)濟(jì)人”轉(zhuǎn)向現(xiàn)實(shí)的“社會(huì)人”,經(jīng)濟(jì)學(xué)直面現(xiàn)實(shí)。如何從有限理性出發(fā)來研究參與人的行為,許多經(jīng)濟(jì)學(xué)家對(duì)之進(jìn)行了廣泛而深入的研究并提出了許多理論,在這些理論之中影響最大且受到了經(jīng)濟(jì)學(xué)界普遍接受的理論即進(jìn)化博弈理論。
2.3 進(jìn)化博弈理論的產(chǎn)生及其發(fā)展
進(jìn)化博弈理論源于對(duì)生態(tài)現(xiàn)象的解釋,1960年代生態(tài)學(xué)家Lewontin就開始運(yùn)用進(jìn)化博弈理論的思想來研究生態(tài)問題。生態(tài)學(xué)家從動(dòng)植物進(jìn)化的研究中發(fā)現(xiàn),動(dòng)植物進(jìn)化結(jié)果在多數(shù)情況下都可以用博弈論的納什均衡概念來解釋。然而,博弈論是研究完全理性的人類互動(dòng)行為時(shí)提出來的,為什么能夠解釋根本無理性可言的動(dòng)植物的進(jìn)化現(xiàn)象呢?我們知道動(dòng)植物的進(jìn)化遵循達(dá)爾文“優(yōu)勝劣汰”生物進(jìn)化理論,生態(tài)演化的結(jié)果卻能夠利用博弈理論來給予合理的解釋,這種巧合意味著我們可以去掉經(jīng)典博弈理論中理性人假定的要求。另外,1960年代生態(tài)學(xué)理論研究取得突破性的進(jìn)展,非合作博弈理論研究成果也不斷涌現(xiàn)并日趨成熟,進(jìn)化博弈理論具備了產(chǎn)生的現(xiàn)實(shí)及理論基礎(chǔ)。
進(jìn)化博弈理論應(yīng)用于研究經(jīng)濟(jì)學(xué)問題在學(xué)術(shù)界曾經(jīng)引起極大的爭(zhēng)議,爭(zhēng)論的焦點(diǎn)在于理性假定。當(dāng)時(shí)由于理性概念在經(jīng)濟(jì)學(xué)界已經(jīng)根深蒂固。多數(shù)人認(rèn)為利用研究生態(tài)演化的進(jìn)化博弈理論來研究參與人的行為是不合適的。因?yàn)閯?dòng)植物行為是完全由其基因所決定的,而經(jīng)濟(jì)問題則涉及到具有邏輯思維及學(xué)習(xí)、模仿能力的理性參與人的行為,因此,借助于進(jìn)化博弈理論來研究遠(yuǎn)比動(dòng)植物復(fù)雜的人類行為顯然是行不通的。但隨著心理學(xué)研究的發(fā)展及有限理性概念的提出,越來越多的經(jīng)濟(jì)學(xué)家應(yīng)用進(jìn)化博弈理論來解釋經(jīng)濟(jì)現(xiàn)象并獲得了巨大的成功,利用進(jìn)化博弈理論來研究并解釋經(jīng)濟(jì)現(xiàn)象的文獻(xiàn)大量出現(xiàn)于各種經(jīng)濟(jì)學(xué)期刊了。盡管如此,利用進(jìn)化博弈理論來解釋經(jīng)濟(jì)現(xiàn)象還是需要對(duì)該理論的基本分析框架作出相應(yīng)的調(diào)整。如果去掉參與人偏好、信念及理性假定等條件,那么參與人是如何作出決策的呢?進(jìn)化博弈理論在處理有限理性參與人決策問題時(shí),常常假定參與人遵循某種比貝葉斯法則更簡(jiǎn)單的行為規(guī)則,這種行為規(guī)則應(yīng)該告訴如何采取行動(dòng)及如何根據(jù)經(jīng)驗(yàn)來改變行為選擇,這樣參與人只要知道什么會(huì)發(fā)生,而不必知道為什么會(huì)發(fā)生。
1970年代,生態(tài)學(xué)家Maynard Smith and Price(1973)結(jié)合生物進(jìn)化論與經(jīng)典博弈理論在研究生態(tài)演化現(xiàn)象的基礎(chǔ)上而提出了進(jìn)化博弈理論的基本均衡概念----進(jìn)化穩(wěn)定策略(Evolutionarily stable stragegy ESS),目前學(xué)術(shù)界普遍認(rèn)為進(jìn)化穩(wěn)定策略概念的提出標(biāo)志著進(jìn)化博弈理論的誕生。此后,生態(tài)學(xué)家Taylor and Jonker(1978)在考察生態(tài)演化現(xiàn)象時(shí)首次提出了進(jìn)化博弈理論的基本動(dòng)態(tài)概念----模仿者動(dòng)態(tài)(Replicator Dynamics)。至此,進(jìn)化博弈理論有了明確的研究目標(biāo)。
1980年代以后,隨著新古典經(jīng)濟(jì)學(xué)及博弈論固有的缺陷逐漸被人們所認(rèn)識(shí),有限理性概念得到了學(xué)術(shù)界的普遍認(rèn)可,加之進(jìn)化博弈理論在解釋生態(tài)現(xiàn)象時(shí)獲得的巨大成功,特別是經(jīng)濟(jì)學(xué)界于1992年在康奈爾大學(xué)召開的進(jìn)化博弈理論學(xué)術(shù)會(huì)議,正式確立了該理論的學(xué)術(shù)地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等經(jīng)濟(jì)學(xué)家從不同的角度對(duì)傳統(tǒng)的進(jìn)化博弈理論分析框架進(jìn)行拓展,并使之逐漸轉(zhuǎn)化為描述經(jīng)濟(jì)行為的理論。目前,進(jìn)化博弈理論的基本理論體系雖然已經(jīng)形成但還是相當(dāng)粗糙。因此,它仍然處于不斷發(fā)展和完善的階段,但該理論提供了比傳統(tǒng)理論更具現(xiàn)實(shí)性且能夠更準(zhǔn)確地解釋并預(yù)測(cè)參與人行為的研究方法,從而得到了越來越多的經(jīng)濟(jì)學(xué)家、社會(huì)學(xué)家、生態(tài)學(xué)家的重視,我們有理由相信該理論成為主流經(jīng)濟(jì)學(xué)的一部分已經(jīng)為時(shí)不遠(yuǎn)。
三、進(jìn)化博弈理論的基本內(nèi)容
進(jìn)化博弈理論結(jié)合經(jīng)典博弈理論及生態(tài)理論研究成果,并以有限理性的參與人群體為研究對(duì)象,利用動(dòng)態(tài)分析方法把影響參與人行為的各種因素納入其模型之中,并以系統(tǒng)論的觀點(diǎn)來考察群體行為的演化趨勢(shì)。
進(jìn)化生態(tài)學(xué)與博弈論的結(jié)合至少已有三十幾年的歷史,初看起來使人覺得奇怪,因?yàn)椴┺恼摮3<俣▍⑴c人是完全理性的,而基因和其他的演化載體常常被假定是以一種完全機(jī)械的方式運(yùn)動(dòng)。然而一旦用參與人群體來代替博弈論中的參與者個(gè)人,用群體中選擇不同純策略的個(gè)體占群體中個(gè)體總數(shù)的百分比來代替博弈論中的混合策略,那么這兩種理論就達(dá)到了形式上的統(tǒng)一。盡管這兩種理論在形式上達(dá)到了統(tǒng)一,但進(jìn)化博弈理論與經(jīng)典博弈理論還是存在本質(zhì)區(qū)別。在進(jìn)化博弈理論中每個(gè)參與人都是隨機(jī)地從群體中抽取并進(jìn)行重復(fù)、匿名博弈,他們沒有特定的博弈對(duì)手 ④。在這種情況下,參與人既可以通過自己的經(jīng)驗(yàn)直接獲得決策信息,也可以通過觀察在相似環(huán)境中其他參與人的決策并模仿而間接地獲得決策信息,還可以通過觀察博弈的歷史而從群體分布中獲得決策信息。對(duì)參與人來說,觀察群體行為的歷史即估算群體分布是非常重要的,首先,群體分布包含了對(duì)手如何選擇策略的信息。其次,通過觀察群體分布也有助于參與人知道什么是好的策略什么是不好的策略。參與人常常會(huì)模仿好的策略⑤ 而不好的策略則會(huì)在進(jìn)化過程中淘汰,模仿是學(xué)習(xí)過程中的一個(gè)重要組成部分,成功的行為不僅以說教的形式傳遞下來,而且也容易被模仿。參與人由于受到理性的約束而其行為是幼稚的(Naive),其決策不是通過迅速的最優(yōu)化計(jì)算得到,而是需要經(jīng)歷一個(gè)適應(yīng)性的調(diào)整過程,在此過程中參與人會(huì)受到其所處環(huán)境中各種確定性或隨機(jī)性因素影響。因此,系統(tǒng)均衡是達(dá)到均衡過程的函數(shù),要更準(zhǔn)確地描述參與人行為就必須考察經(jīng)濟(jì)系統(tǒng)的動(dòng)態(tài)調(diào)整過程,動(dòng)態(tài)均衡概念及動(dòng)態(tài)模型在進(jìn)化博弈理論中占有相當(dāng)重要的地位。
3.1 進(jìn)化博弈理論基本模型分類
進(jìn)化博弈理論的基本模型按其所考察的群體數(shù)目可分為單群體模型(Monomorphic Population Model)與多群體模型(Polymorphic Populations Model)。單群體模型直接來源生態(tài)學(xué)的研究,在研究生態(tài)現(xiàn)象時(shí),生態(tài)學(xué)家常常把同一個(gè)生態(tài)環(huán)境中所有種群看作一個(gè)大群體,由于生物的行為是由其基因唯一確定的,因而可以把生態(tài)環(huán)境中每一個(gè)種群都程式化為一個(gè)特定的純策略。經(jīng)過這樣處理以后,整個(gè)群體就相當(dāng)于一個(gè)選擇不同純策略(純策略集的數(shù)目就相當(dāng)于群體中的種群數(shù))的個(gè)體。群體中隨機(jī)抽取的個(gè)體兩兩進(jìn)行的都是對(duì)稱博弈,有些文獻(xiàn)中稱這類模型為對(duì)稱模型(Symmetry model)。嚴(yán)格地說,單群體時(shí)個(gè)體進(jìn)行的并不是真正意義上的博弈,博弈是在個(gè)體與群體分布所代表的虛擬參與人之間進(jìn)行。如第一部分的老鷹----鴿子博弈,該生態(tài)環(huán)境中有兩個(gè)種群老鷹與鴿子,它們代表兩個(gè)不同的純策略,用進(jìn)化方法進(jìn)行處理時(shí)認(rèn)為該生態(tài)群體中每個(gè)個(gè)體都有兩種可供選擇策略即老鷹策略與鴿子策略,此時(shí)的博弈并不是在隨機(jī)抽取的兩個(gè)個(gè)體之間進(jìn)行,而是每個(gè)個(gè)體都觀察群體狀態(tài)(選擇老鷹策略與鴿子策略個(gè)體數(shù)在群體中所占的比例),給定此狀態(tài)它就可以計(jì)算自己選擇不同策略所得的期望支付(嚴(yán)格地說這并不是期望支付,但為了說明的方便本文仍然借用該概念)進(jìn)而確定選擇哪一個(gè)策略不選擇哪一個(gè)策略,對(duì)物種而言這就意味著種群數(shù)量的增加或減少。
多群體模型是由Selten (1980)首次提出并進(jìn)行研究的,他在傳統(tǒng)單群體生態(tài)進(jìn)化模型中通過引入角色限制行為(Role Conditioned Behavior)而把對(duì)稱模型變?yōu)榱朔菍?duì)稱模型。在非對(duì)稱博弈個(gè)體之間有角色區(qū)分,此時(shí)可以從大群體中區(qū)分出不同的小群體,群體中隨機(jī)抽取的個(gè)體之間進(jìn)行真正意義上的兩兩配對(duì)重復(fù)、匿名非對(duì)稱博弈,有時(shí)又稱之為非對(duì)稱模型(Asymmetry model)。如果我們把系統(tǒng)選擇博弈中的宿舍變成學(xué)校(整個(gè)學(xué)校相當(dāng)于一個(gè)大群體)而把十個(gè)人變成十個(gè)班(每一個(gè)班看成是一個(gè)小群體,且同一班的同學(xué)無角色區(qū)分即與單群體情形一樣),每個(gè)班的學(xué)生都有多種選擇,此時(shí)該校學(xué)生所進(jìn)行的計(jì)算機(jī)系統(tǒng)選擇博弈就是非對(duì)稱博弈。非對(duì)稱博弈模型并不是對(duì)單群體博弈模型的簡(jiǎn)單改進(jìn),由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進(jìn)化穩(wěn)定均衡都是嚴(yán)格納什均衡⑥ ”的結(jié)論,這就說明在多群體博弈中,傳統(tǒng)的進(jìn)化穩(wěn)定均衡概念就顯示出其局限性了。同時(shí),在模仿者動(dòng)態(tài)下,同一博弈在單群體與多群體時(shí)也會(huì)有不同的進(jìn)化穩(wěn)定均衡。
按照群體在演化過程中所受到的影響因素是確定性的還是隨機(jī)性的,進(jìn)化博弈模型可分為確定性動(dòng)態(tài)模型和隨機(jī)性動(dòng)態(tài)模型。確定性模型一般比較簡(jiǎn)單并且能夠較好地描述系統(tǒng)的演化趨勢(shì),因而,理論界對(duì)之進(jìn)行較多的研究。隨機(jī)性模型需要考慮許多隨機(jī)因素對(duì)動(dòng)態(tài)系統(tǒng)的影響,一般比較復(fù)雜,但該類模型卻能夠更準(zhǔn)確地描述系統(tǒng)的行為,近年來理論界對(duì)之也進(jìn)行廣泛的探討[對(duì)隨機(jī)動(dòng)態(tài)的詳細(xì)討論可以參閱這方面的經(jīng)典文獻(xiàn)Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。
3.2 進(jìn)化博弈理論基本均衡概念-----進(jìn)化穩(wěn)定策略
進(jìn)化博弈理論的基本均衡概念---進(jìn)化穩(wěn)定策略⑦ [文獻(xiàn)2、5有詳細(xì)介紹]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生態(tài)演化問題時(shí)提出來的,其直觀思想是:如果一個(gè)群體(原群體)的行為模式能夠消除任何小的突變?nèi)后w,那么這種行為模式一定能夠獲得比突變?nèi)后w高的支付,隨著時(shí)間的演化突變者群體最后會(huì)從原群體中消失,原群體所選擇的策略就是進(jìn)化穩(wěn)定策略。系統(tǒng)選擇進(jìn)化穩(wěn)定策略時(shí)所處的狀態(tài)即是進(jìn)化穩(wěn)定狀態(tài),此時(shí)的均衡就是進(jìn)化穩(wěn)定均衡。下面給出Maynard Smith and Price(1973)對(duì)進(jìn)化穩(wěn)定策略的定義(此后本文稱之為原初定義),用符號(hào)表示如下:
說是進(jìn)化穩(wěn)定策略,如果,存在一個(gè)<,不等式對(duì)任意都成立。其中A是群體中個(gè)體博弈時(shí)的支付矩陣;y表示突變策略;是一個(gè)與突變策略y有關(guān)的常數(shù),稱之為侵入邊界(Invasion Barriers);表示選擇進(jìn)化穩(wěn)定策略群體與選擇突變策略群體所組成的混合群體。實(shí)際上相當(dāng)于該吸引子對(duì)應(yīng)吸引域的半徑,也就說進(jìn)化穩(wěn)定策略考察的是系統(tǒng)落于該均衡的吸引域范圍之內(nèi)的動(dòng)態(tài)性質(zhì),而落于吸引域范圍之外是不考慮的,所以說它只能夠描述系統(tǒng)的局部動(dòng)態(tài)性質(zhì)。至于系統(tǒng)是如何進(jìn)入吸引域的原初的進(jìn)化穩(wěn)定策略定義所沒有給予足夠的重視。
要準(zhǔn)確地理解進(jìn)化穩(wěn)定策略概念就必須正確理解突變者和侵入邊界的含義。我們可借助于前面的兩個(gè)例子來理解。在老鷹、鴿子博弈中,當(dāng)該生態(tài)環(huán)境中只有老鷹(或只有鴿子)時(shí),這時(shí)系統(tǒng)已經(jīng)處于均衡狀態(tài),但它們都是不穩(wěn)定的均衡,因?yàn)檫@兩個(gè)均衡都可以被突變者侵入。開始時(shí),假定該生態(tài)環(huán)境處于老鷹均衡,如果由于某種原因而進(jìn)入鴿子時(shí),那么隨著時(shí)間的演化,整個(gè)生態(tài)系統(tǒng)最終就會(huì)穩(wěn)定于一半為老鷹一半為鴿子的狀態(tài),即混合策略納什均衡是進(jìn)化穩(wěn)定的。這說明該博弈中兩個(gè)純策略納什均衡是不穩(wěn)定的。因?yàn)椋?dāng)系統(tǒng)處于純策略所表示的狀態(tài)時(shí),只要存在突變者系統(tǒng)就會(huì)離開這種狀態(tài),所以它們都不是進(jìn)化穩(wěn)定的。相反混合策略納什均衡卻不一樣,即當(dāng)系統(tǒng)處于一半是老鷹一半是鴿子時(shí),如果由于某種因素使得系統(tǒng)偏離該狀態(tài),那么系統(tǒng)會(huì)自動(dòng)恢復(fù)到原來狀態(tài)。另外,在系統(tǒng)選擇博弈中突變者、侵入邊界就更為明顯,所謂突變者即是指選擇進(jìn)化穩(wěn)定策略以外的策略者,且侵入邊界與不同的均衡有關(guān)。該博弈有兩個(gè)純策略納什均衡和一個(gè)混合策略納什均衡(),前一個(gè)均衡所對(duì)應(yīng)的侵入邊界就是,也就是說如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總數(shù)的比例大于(即學(xué)生數(shù)大于4),那么選擇操作系統(tǒng)的突變者就不可能侵入到該群體中,如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總的比例小于(即學(xué)生數(shù)小于4),那么選擇操作系統(tǒng)的突變者就會(huì)侵入到該群體中而原來選擇操作系統(tǒng)的學(xué)生會(huì)轉(zhuǎn)而學(xué)習(xí)操作系統(tǒng)。
最初進(jìn)化穩(wěn)定策略定義有比較苛刻的條件限制,如單群體、群體中個(gè)體數(shù)目無限大、系統(tǒng)只受到不連續(xù)且互不重疊沖擊的影響等。這些條件大大地限制該定義的應(yīng)用,隨著學(xué)術(shù)界對(duì)進(jìn)化博弈理論研究的深入,許多理論家們從不同的角度對(duì)最初定義進(jìn)行了拓展,如Selten 1980首次給出了適應(yīng)于描述多群體均衡的定義;Schaffer 1988首次給出了適應(yīng)于描述有限規(guī)模群體的均衡定義;Foster and Young(1990)首次給出了適應(yīng)于描述連續(xù)隨機(jī)系統(tǒng)的均衡定義等等(有關(guān)對(duì)進(jìn)化穩(wěn)定策略進(jìn)行拓展的討論見文獻(xiàn)[5])。最初定義是在解釋生態(tài)現(xiàn)象時(shí)提出來的,如果進(jìn)行經(jīng)濟(jì)分析,時(shí)需要進(jìn)行相應(yīng)的改變。在分析生態(tài)現(xiàn)象時(shí),把每一個(gè)種群的行為都程式化為一個(gè)策略,因此進(jìn)化的結(jié)果將會(huì)是突變種群的消失(消失的原因在于生物的行為是由其遺傳基因唯一確定的)。如果用于經(jīng)濟(jì)分析,那么進(jìn)化的結(jié)果將是那些選擇突變策略的個(gè)體最終會(huì)改變策略而選擇進(jìn)化穩(wěn)定策略(因?yàn)槿祟惪梢酝ㄟ^學(xué)習(xí)、模仿等來改變自己所選擇的策略)。
經(jīng)典博弈理論中的核心概念納什均衡即是指一種策略組合,在該策略組合下任何個(gè)人單獨(dú)偏離都不會(huì)變得比不偏離好。納什均衡是一個(gè)靜態(tài)概念,不能描述系統(tǒng)的動(dòng)態(tài)性質(zhì),用數(shù)學(xué)語言來說它是動(dòng)態(tài)系統(tǒng)的不動(dòng)點(diǎn),納什的成功就是在于他應(yīng)用拓?fù)鋵W(xué)的不動(dòng)點(diǎn)定理證明了納什均衡的存在性。進(jìn)化穩(wěn)定策略必定是納什均衡策略,它是納什均衡的精練,文獻(xiàn)[3]對(duì)此有詳細(xì)的介紹。在進(jìn)化穩(wěn)定策略的定義中引入突變者及侵入邊界使之能夠更好地描述系統(tǒng)的局部動(dòng)態(tài)性質(zhì)。第一部分的兩個(gè)例子中,按照納什均衡的概念是無法得知兩個(gè)系統(tǒng)最終會(huì)選擇哪一個(gè)均衡,但利用進(jìn)化穩(wěn)定策略卻可以說明系統(tǒng)最終會(huì)穩(wěn)定哪一個(gè)均衡并可以分析系統(tǒng)達(dá)到不同均衡的條件,在某種程度上,較好地解決了多重均衡選擇問題。
3.3 進(jìn)化博弈理論基本動(dòng)態(tài)概念----模仿者動(dòng)態(tài)
進(jìn)化博弈理論來源于生態(tài)學(xué)的研究,該理論基本上從“優(yōu)勝劣汰”的進(jìn)化論觀點(diǎn)來看待群體行為的調(diào)整過程。一般的進(jìn)化過程都包括兩個(gè)可能的行為演化機(jī)制:選擇機(jī)制(Selection Mechanism)和突變機(jī)制(Mutation mechanism)。選擇機(jī)制是指本期中能夠獲得較高支付的策略,在下期被更多參與者選擇;突變是指參與者以隨機(jī)(無目的性)的方式選擇策略,因此突變策略可能獲得較高支付也可能獲得較低支付,突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇,并且只有獲得較高支付的策略才能生存(Survive)下來。進(jìn)化博弈理論需要解決的關(guān)鍵問題就是如何描述群體行為的這種選擇機(jī)制和突變機(jī)制。博弈理論家對(duì)群體行為調(diào)整過程進(jìn)行了廣泛而深入的研究,由于他們考慮問題的角度不同,對(duì)群體行為調(diào)整過程的研究重點(diǎn)也就不同,因而提出了不同的動(dòng)態(tài)模型,如Weibull(1995) 提出的模仿動(dòng)態(tài)(Imitation Dynamics)模型,認(rèn)為人們常常模仿其他人的行為尤其是能夠產(chǎn)生較高支付的行為;Börgers and Sarin(1995,1997)等提出并應(yīng)用強(qiáng)化動(dòng)態(tài)(Reinforcement Dynamics)來研究現(xiàn)實(shí)中參與人的學(xué)習(xí)過程;Skyrms (1986) 引入了意向動(dòng)態(tài)(Deliberational Dynamics)模型對(duì)哲學(xué)中的理性問題進(jìn)行了討論;Swinkels(1993)提出了近似調(diào)整動(dòng)態(tài)(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反應(yīng)動(dòng)態(tài)(Stimulus-Response Dynamics)等等。到目前為止,在進(jìn)化博弈理論中應(yīng)用得最多的還是由Taylor and Jonker(1978)在對(duì)生態(tài)現(xiàn)象進(jìn)行解釋時(shí)首次提出描述單群體動(dòng)態(tài)調(diào)整過程的模仿者動(dòng)態(tài)(Replicator Dynamics)。所謂模仿者動(dòng)態(tài)是指使用某一策略人數(shù)的增長(zhǎng)率等于使用該策略時(shí)所得的支付與平均支付之差。下面就給出Taylor and Jonker(1978)提出的模仿者動(dòng)態(tài)的微分形式:
化的而且因素之間的互動(dòng)作用也是需要時(shí)間的。因此,均衡只是一種暫時(shí)現(xiàn)象或者在多數(shù)情況下,系統(tǒng)根本不可能達(dá)到的現(xiàn)象,要更準(zhǔn)確地考察參與人的行為就必須運(yùn)用系統(tǒng)論的觀點(diǎn),把行為互動(dòng)性、因素互動(dòng)性及時(shí)間因素納入到其模型之中。
5.2 經(jīng)典博弈理論的策略互動(dòng)分析法及其缺陷
考慮到新古典經(jīng)濟(jì)學(xué)沒有把參與人行為之間的互動(dòng)關(guān)系納入到其模型之中,經(jīng)典博弈理論則在理性人假定的基礎(chǔ)上把參與人行為的互動(dòng)關(guān)系納入到其模型之中進(jìn)一步考察了參與人的決策問題。在我國,對(duì)人類互動(dòng)行為的研究至少可以追溯到三國時(shí)期田賽馬的故事,但作為一種正式理論提出來,一般認(rèn)為是始于馮·諾意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈論與經(jīng)濟(jì)行為》一書,直到納什(Nash 1950)在研究非合作博弈的基礎(chǔ)上提出著名的納什均衡(Nash Equilibrium)概念才使得博弈論成為一門完整的理論。經(jīng)過近五十年的發(fā)展,終于在1994年,三位杰出的博弈論大師:納什(John F. Nash)、澤爾藤(Rechard Selten)和海薩尼(John C. Harsanyi)獲得了經(jīng)濟(jì)學(xué)的最高榮譽(yù)——諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),在全球經(jīng)濟(jì)學(xué)界再次掀起了對(duì)博弈論的研究熱潮。經(jīng)典博弈論為社會(huì)科學(xué)提供了一個(gè)新的研究視角,使我們能夠以全新的方法來處理各種沖突與合作的問題。博弈論作為一種理論工具,其應(yīng)用相當(dāng)廣泛。在信息經(jīng)濟(jì)學(xué)中得到了充分的應(yīng)用,1996年諾獎(jiǎng)得主Mirrlees等、2001年諾獎(jiǎng)得主Akerlof等都對(duì)信息經(jīng)濟(jì)學(xué)研究作出了卓越的貢獻(xiàn)。這充分說明了博弈論在經(jīng)濟(jì)學(xué)的地位可見一斑。
經(jīng)典博弈理論的核心概念----納什均衡就是由普林斯頓大學(xué)數(shù)學(xué)家納什在研究非合作博弈時(shí)提出來的。納什均衡即是指給定其他參與人選擇的情況下,每一個(gè)人單獨(dú)偏離均衡都不會(huì)變得比不偏離好,顯然納什均衡是一個(gè)靜態(tài)均衡概念。經(jīng)典博弈理論盡管把參與人的互動(dòng)行為引入到其模型之中,并認(rèn)為現(xiàn)實(shí)中參與人不是孤立地作出自己的決策,每一個(gè)參與人的決策不僅依賴于其自身所面臨的條件及其所擁有的信息,而且也依賴于其他參與人的決策選擇。但該理論卻面臨著其自身無法克服的缺點(diǎn)。首先,博弈論中的互動(dòng)是一種“沉默互動(dòng)⑨ ”,這種互動(dòng)不允許參與人之間存在任何形式的交流,即假定參與人都是一個(gè)個(gè)只會(huì)理性計(jì)算的孤立經(jīng)濟(jì)人而非社會(huì)人,一旦引入社會(huì)互動(dòng),許多博弈都無法進(jìn)行分析,也就是說經(jīng)典博弈理論中的互動(dòng)并不“社會(huì)互動(dòng)”而是孤立的“沉默互動(dòng)”。其次,博弈論的基本均衡概念納什均衡要求博弈各方都是理性的,并且理性是共同知識(shí),博弈時(shí)如果某一方選擇了非理,那么博弈就無法進(jìn)行下去。特別地該理論在利用后向歸納法(Backward Induction)對(duì)納什均衡進(jìn)行精練時(shí),不但要求參與人完全理性,而且還要求參與人的行為滿足序貫理性(Sequential Rationality)要求。這一比理性更強(qiáng)的要求使得博弈論更加遠(yuǎn)離現(xiàn)實(shí)人。再次,在處理參與人所面臨的不確定性時(shí),不僅要求各參與人知道世界的各種狀態(tài),而且要求參與人知道每一種狀態(tài)所出現(xiàn)的概率,并且給定一個(gè)先念信念,當(dāng)出現(xiàn)任何新信息時(shí),每個(gè)參與人都能夠應(yīng)用貝葉斯法則修正自己的先念信念,也就是說參與人不但具有很強(qiáng)的計(jì)算、推理能力,而且能夠在一個(gè)大的狀態(tài)空間上應(yīng)用貝葉斯法則解決相當(dāng)復(fù)雜的問題?,F(xiàn)實(shí)中多數(shù)情況下,參與人并不都具有這種計(jì)算、推理能力。最后,博弈論碰到了其最棘手的問題就是多重均衡的處理,當(dāng)博弈出現(xiàn)多重均衡特別是多重嚴(yán)格納什均衡時(shí),盡管許多理論家提出了一些方法(Selten(1965)提出的子博弈精煉納什均衡概念,Selten(1975)提出的顫抖手精練納什均衡,Kerps—wilson(1982)提出的序貫均衡,Schelling(1960)提出的聚點(diǎn)均衡等)來處理多重均衡問題,但始終沒能獲得一致認(rèn)可的結(jié)論。
與新古典經(jīng)濟(jì)學(xué)相比,經(jīng)典博弈理論雖然在其模型中納入了行為的“沉默互動(dòng)”關(guān)系,但該理論給出的研究方法仍然沒能跳出新古典經(jīng)濟(jì)學(xué)的均衡分析框架,這種只注重結(jié)果而忽略達(dá)到結(jié)果的過程的分析方法依然把對(duì)經(jīng)濟(jì)系統(tǒng)的影響因素都看作為一個(gè)個(gè)孤立因素,依然認(rèn)為影響因素與決策結(jié)果是一一對(duì)應(yīng)的關(guān)系,依然沒能把參與人所處社會(huì)環(huán)境等因素納入到其模型之中,因而不能準(zhǔn)確地描述現(xiàn)實(shí)中人的決策行為,其結(jié)論也僅僅具有理論意義而缺乏政策含義。
5.3 進(jìn)化博弈理論局部動(dòng)態(tài)分析方法的現(xiàn)實(shí)性
進(jìn)化博弈理論利用達(dá)爾文“優(yōu)勝劣汰”的生物進(jìn)化論、經(jīng)典博弈理論并結(jié)合心理學(xué)的研究成果,從西蒙提出有限理性(Bounded Rationality)的參與人群體出發(fā),通過對(duì)群體行為的研究進(jìn)一步得出參與人個(gè)體的行為。進(jìn)化博弈理論跨越了完全理性的“經(jīng)濟(jì)人”與有限理性的“社會(huì)人”的鴻溝,實(shí)現(xiàn)了經(jīng)濟(jì)學(xué)研究方法革命性的突破。與傳統(tǒng)均衡分析法相比,進(jìn)化博弈理論的局部動(dòng)態(tài)分析方法在以下幾個(gè)方面獨(dú)具特色。
5.3.1 局部動(dòng)態(tài)分析法的均衡觀
傳統(tǒng)的均衡分析方法認(rèn)為完全理性參與人能夠?qū)Νh(huán)境的任何變化作出迅速的最優(yōu)反應(yīng),因而,經(jīng)濟(jì)系統(tǒng)是常常處于均衡狀態(tài)的,分析參與人的行為只需要研究均衡結(jié)果,并以此來預(yù)測(cè)經(jīng)濟(jì)人的行為,通過比較不同均衡結(jié)果來尋找系統(tǒng)達(dá)到均衡的條件。這種處理方法為了數(shù)學(xué)上處理的方便而撇開現(xiàn)實(shí)中“因素互動(dòng)”而分別考察單個(gè)因素對(duì)均衡的影響,使得理論更加缺乏現(xiàn)實(shí)基礎(chǔ)。進(jìn)化博弈理論則完全摒棄傳統(tǒng)理論中非現(xiàn)實(shí)的“理性人”假定,直接從有限理性參與人群體出發(fā)而提出的一種全新的研究方法----局部動(dòng)態(tài)法。局部動(dòng)態(tài)法把經(jīng)濟(jì)系統(tǒng)達(dá)到均衡結(jié)果的過程納入到其模型之中,認(rèn)為經(jīng)濟(jì)系統(tǒng)達(dá)到均衡需要一個(gè)長(zhǎng)期的漸進(jìn)過程,均衡結(jié)果依賴于達(dá)到均衡的過程,也就是說任何一個(gè)結(jié)果都是路徑依賴的,它與混沌經(jīng)濟(jì)學(xué)完全動(dòng)態(tài)的研究方法具有某種程度的相似之處。
5.3.2 局部動(dòng)態(tài)法的時(shí)間觀
傳統(tǒng)的均衡分析法并沒有納入因素互動(dòng)關(guān)系并且理性計(jì)算是不需要時(shí)間的,所以得出經(jīng)濟(jì)系統(tǒng)常常是均衡的結(jié)論。進(jìn)化博弈理論的局部動(dòng)態(tài)法一個(gè)顯著特征就是把參與人的決策過程時(shí)間及因素互動(dòng)的時(shí)間納入到其基本模型之中,強(qiáng)調(diào)系統(tǒng)達(dá)到均衡的過程,并認(rèn)為經(jīng)濟(jì)系統(tǒng)由于受到各種互動(dòng)行為及互動(dòng)因素的影響,有些系統(tǒng)達(dá)到均衡可能只需要很短的時(shí)間,有些系統(tǒng)達(dá)到均衡可能需要很長(zhǎng)的時(shí)間,有些系統(tǒng)可能無法達(dá)到均衡。時(shí)間因素對(duì)經(jīng)濟(jì)學(xué)研究有著非常重要的意義,如均衡分析法無法考慮宏觀經(jīng)濟(jì)政策中“時(shí)滯”使得許多實(shí)施時(shí)有效的政策在發(fā)生作用時(shí)卻出現(xiàn)了與原意相反的結(jié)果。時(shí)間是度量政策效率的一個(gè)很重要的因素,如果不考慮時(shí)間因素有些政策可能很有效率,但納入時(shí)間因素,一些需要太長(zhǎng)時(shí)間才能使系統(tǒng)達(dá)到意愿均衡的政策可能根本就沒有效率。進(jìn)化博弈理論把時(shí)間納入到模型分析中并充分應(yīng)用數(shù)學(xué)中的相圖來描述經(jīng)濟(jì)系統(tǒng)達(dá)到均衡的路徑,這樣有利于決策者控制經(jīng)濟(jì)系統(tǒng)使之朝向既定的目標(biāo)前進(jìn),也有利于決策者尋找能夠最大限度地促進(jìn)系統(tǒng)向意愿均衡轉(zhuǎn)化的因素,使系統(tǒng)盡快達(dá)到有效率的均衡。
5.3.3 局部動(dòng)態(tài)法的均衡選擇觀
新古典經(jīng)濟(jì)學(xué)研究的邏輯有理性就有均衡,然后在既定均衡下通過對(duì)不同均衡的比較來尋找系統(tǒng)達(dá)到不同均衡的條件,即比較靜態(tài)法,最后結(jié)合條件找出希望達(dá)到的均衡,因此,該理論不存在真正意義的均衡選擇問題。經(jīng)典博弈理論提供的分析方法在多數(shù)情況下都存在其自身所無法處理的多重均衡問題。如老鷹與鴿子博弈及系統(tǒng)選擇博弈中多重均衡問題。進(jìn)化博弈理論的局部動(dòng)態(tài)法引入突變因素就能夠較好地解決了多重均衡的選擇問題,在老鷹與鴿子博弈中,盡管全是老鷹(全是鴿子)都是均衡的,但這兩個(gè)均衡都極不穩(wěn)定即都不是進(jìn)化穩(wěn)定均衡,一旦有鴿子(老鷹)突變者進(jìn)入該系統(tǒng)就會(huì)使系統(tǒng)偏離,隨著時(shí)間的推移而使得系統(tǒng)趨向于混合策略進(jìn)化穩(wěn)定均衡即一半鴿子一半老鷹(該均衡是一個(gè)全局吸引子);在系統(tǒng)選擇博弈中經(jīng)典博弈理論無法解釋系統(tǒng)最終會(huì)趨于哪一個(gè)均衡,局部動(dòng)態(tài)法引入了突變因素就能夠很好地解決了均衡選擇問題,即系統(tǒng)最終會(huì)趨于哪一個(gè)均衡依賴于系統(tǒng)的初始狀態(tài)即路徑依賴。進(jìn)化博弈理論的基本均衡概念----進(jìn)化穩(wěn)定均衡描述的是當(dāng)經(jīng)濟(jì)系統(tǒng)一旦進(jìn)入到某一均衡的吸引域內(nèi)時(shí),系統(tǒng)就會(huì)對(duì)其他的突變策略具有一定程度(即在突變邊界內(nèi))的抵抗力。
5.3.4 局部動(dòng)態(tài)法的特殊性
新古典經(jīng)濟(jì)學(xué)與經(jīng)典博弈理論均衡分析法都是以單個(gè)消費(fèi)者、單個(gè)生產(chǎn)者、單個(gè)市場(chǎng)為研究對(duì)象來考察參與人的最優(yōu)決策行為,并由此研究整個(gè)社會(huì)的資源配置問題。然而它們卻碰到了如何由個(gè)體行為轉(zhuǎn)化到群體行為的困難,因?yàn)檫@種轉(zhuǎn)化過程涉及到各種互動(dòng)因素的影響。一個(gè)明顯的例子是經(jīng)典博弈理論中囚徒困境博弈,在該博弈中兩個(gè)囚徒都從個(gè)體理性出發(fā),但得到了集體非理性均衡的結(jié)論。也就是說,均衡分析法根本無法實(shí)現(xiàn)從個(gè)體行為向集體行為的過渡,在此框架內(nèi)尋找宏觀經(jīng)濟(jì)的微觀基礎(chǔ)的困難是非常大的。進(jìn)化博弈理論的局部動(dòng)態(tài)法則從人的社會(huì)性出發(fā),利用系統(tǒng)論的處理方法來看待參與人的決策行為。該理論直接以參與人的群體為其研究的邏輯起點(diǎn),在考慮到影響參與人行為的社會(huì)因素、文化因素、民族習(xí)俗及個(gè)體生活習(xí)慣等因素的基礎(chǔ)上進(jìn)一步考察群體中有限理性個(gè)體的行為互動(dòng)關(guān)系,很巧妙地避開由個(gè)體行為向集體行為轉(zhuǎn)化問題,因而能夠更加真實(shí)地反應(yīng)現(xiàn)實(shí)人的決策過程及其決策結(jié)果。
六、結(jié)論
進(jìn)化博弈理論是經(jīng)濟(jì)學(xué)領(lǐng)域的前沿理論,它來源于對(duì)生態(tài)現(xiàn)象的研究,雖然該理論應(yīng)用于經(jīng)濟(jì)分析的時(shí)間不長(zhǎng),但它為經(jīng)濟(jì)學(xué)研究提供了一個(gè)全新的分析方法,較好地克服了新古典經(jīng)濟(jì)學(xué)及經(jīng)典博弈理論中理性假定及多重均衡的困難。并且,應(yīng)用進(jìn)化博弈理論來研究經(jīng)濟(jì)系統(tǒng)能夠獲得比傳統(tǒng)理論更準(zhǔn)確的結(jié)果,能夠更加現(xiàn)實(shí)地解釋經(jīng)濟(jì)現(xiàn)象,因而在短期內(nèi)為多數(shù)經(jīng)濟(jì)學(xué)家所接受。從某種意義上說引入進(jìn)化博弈理論局部動(dòng)態(tài)法來分析經(jīng)濟(jì)中參與人的行為是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新。
注釋: ①本文把源于馮·諾意曼和摩根斯藤經(jīng)納什發(fā)展而成的博弈理論稱之為經(jīng)典博弈理論。 ②即無性生殖,這樣假定的意思就是說后代繼承其母體的策略,并且永遠(yuǎn)不改變,當(dāng)然用于研究人類的行為時(shí),需要作相應(yīng)的調(diào)整。 ③所謂近視調(diào)整即是指參與人不管未來怎么樣,只知道使當(dāng)前的支付最大化 ④ 經(jīng)典博弈理論中每一個(gè)參與人都有特定的博弈對(duì)象,并且,在重復(fù)動(dòng)態(tài)博弈中,后行動(dòng)者通過觀察先行動(dòng)者的理而利用貝葉斯法則來修正自己的先念信念,然后,在此信念下選擇使自己獲得最大支付的策略。 ⑤好的策略即是指能夠獲得較高支付的策略。 ⑥所謂嚴(yán)格納什均衡即是嚴(yán)格占優(yōu)納什均衡。給定對(duì)手選擇的情況下,每個(gè)人都通過選擇嚴(yán)占優(yōu)的策略而組成的納什均衡。 ⑦事實(shí)上,這與Selten提出的顫抖手均衡概念具有相似性,所謂顫抖手均衡是指一個(gè)戰(zhàn)略組合,只有當(dāng)它在允許所有參與人都可能犯錯(cuò)誤時(shí)仍是每一個(gè)參與人的最優(yōu)戰(zhàn)略的組合時(shí)才是一個(gè)均衡,其嚴(yán)格定義可以參閱張維迎的《博弈論與信息經(jīng)濟(jì)學(xué)》。其中的顫抖或者犯錯(cuò)誤與進(jìn)化穩(wěn)定策略中的突變因素有差不多的含義,但它們之間存在本質(zhì)上的不同。 ⑧由模仿者動(dòng)態(tài)方程進(jìn)行支付變換,可得。 ⑨這一點(diǎn)我們可以從博弈論一個(gè)著名的捐款----回贈(zèng)實(shí)驗(yàn)中看出,募捐者要求每一個(gè)人都自愿捐款,最終募捐者以3倍于捐款總額的錢平均分派給每個(gè)捐款者,為了使得博弈能夠分析下去,募捐者要求自愿捐款時(shí)每個(gè)人都不得與其他人討論,否則該博弈就無法進(jìn)行下去,因此,本文稱博弈論中的互動(dòng)是一種沉默互動(dòng)而非社會(huì)互動(dòng)。這個(gè)實(shí)驗(yàn)充分體現(xiàn)了古典經(jīng)濟(jì)學(xué)及博弈論研究對(duì)象上的一致性,即它們都是研究單個(gè)個(gè)體的行為而排除了人的一個(gè)重要特征----社會(huì)性。參考文獻(xiàn)
[1] 王則柯(1999):《博弈論平話》,中國經(jīng)濟(jì)出版社。
[2] 張維迎(1999):《博弈論與信息經(jīng)濟(jì)學(xué)》,上海三聯(lián)出版社。
[3] 張良橋,馮從文(2001):《進(jìn)化穩(wěn)定均衡與納什均衡:兼談進(jìn)化博弈理論的發(fā)展》,《經(jīng)濟(jì)科學(xué)》,3,103-111。
[4] 張良橋(2001):《理性與有限理性:論經(jīng)典博弈理論與進(jìn)化博弈理論之關(guān)系》,《世界經(jīng)濟(jì)》,8,74-78。
[5] 張良橋(2003):《論進(jìn)化穩(wěn)定策略》,《經(jīng)濟(jì)評(píng)論》,2,70-74。
[6] 張良橋,郭立國(2003):《論模仿者動(dòng)態(tài)》,《中山大學(xué)學(xué)報(bào)自然科學(xué)版》,3。
[7] 楊小凱(2000):《新興古典經(jīng)濟(jì)學(xué)和超邊際分析》,中國人民大學(xué)出版社。
[8] 青木昌彥, 奧野正寬(1999):《經(jīng)濟(jì)體制的比較制度分析》, 魏加寧等譯, 北京: 中國發(fā)展出版社.
[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.
[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.
[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.
[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.
[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.
[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.
[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.
[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.
[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.
[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.
[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.
[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.
[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.
[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.
[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.
[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.
[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.
[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.
[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.
[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.
[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.
[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.
[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.
[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.
[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.
[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.
[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.
[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.
[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.
[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.
[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.
[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.