Agent在城市交通系統中的應用
該結構的協(xié)調控制策略在TRYS 基礎上進(jìn)一步下放到了路口級,建立了路口Agent,每個(gè)路口成了一個(gè)智能的知識系統,可及時(shí)根據路口交通狀況進(jìn)行控制策略的實(shí)時(shí)部署與調整,更好地適應了交通系統動(dòng)態(tài)性、實(shí)時(shí)性強的特點(diǎn),對突發(fā)性交通流的變化有很好的適應和調節能力。
2.2 完全分布式結構
在完全分布式結構的系統中,Agent 憑借自身的知識和智能與相鄰區域Agent 協(xié)調共同完成路口的管制。最初的應用就是西班牙的TRYSA2 系統,如圖3 所示。TRYSA2 Agent 有一個(gè)控制計劃集,每個(gè)計劃都被賦予了能夠減輕交通壓力的效用值。系統可通過(guò)評估相關(guān)Agent 的計劃效用值合成系統最優(yōu)的解決方案。Oliveira 、承向軍、楊兆升等學(xué)者也先后提出了以路口A(yíng)gent 為基本控制單元的完全分布式控制結構,系統中的Agent 都具備了一定的存儲、匹配和智能計算功能,可依靠良好的協(xié)調算法實(shí)現多Agent 之間的協(xié)調與合作以達到整體優(yōu)化和控制的目的。

圖 3 TRYSA2 架構圖。
2.3 兩種架構的性能比較
分層遞階式充分體現了集中和分散控制的有機結合,考慮到了全局利益,可使協(xié)調有目的地進(jìn)行,但是區域Agent 和主控Agent 的實(shí)現稍顯復雜。完全分布式具有反應快速、靈活性強等特點(diǎn),可充分發(fā)揮Agent 的自治性、協(xié)調性,但由于A(yíng)gent 自身能力有限、系統的知識又過(guò)于分散,解決全局問(wèn)題的能力略顯不足,Agent 間的協(xié)調機制會(huì )對系統性能產(chǎn)生較大影響。在擴展性上,完全分布式只需把新Agent 注冊到其他Agent 中并修改相應的方案和知識庫即可將新Agent 擴充到當前的Agent 群體中,而分層遞階式需要整合區域控制中心和主控中心,重新賦予各Agent優(yōu)先權關(guān)系。在協(xié)作復雜度上,分層遞階式從每一個(gè)Agent 控制方案中選擇一個(gè)本地最優(yōu)的方案,完全分布式在所有的Agent 中通過(guò)搜索策略來(lái)查找最佳方案,因此后者工作量較大。
2.4 多Agent 的協(xié)調控制與優(yōu)化
多Agent 通過(guò)協(xié)調實(shí)現系統的分布式并行運行,提高任務(wù)的執行效率。在基于多Agent 的ATMS 中,有三種協(xié)調方式:①建立專(zhuān)門(mén)的協(xié)調Agent;②將協(xié)調行為分散至各Agent 中,由Agent 自主地完成;③集中與分布相結合的方法,Agent 自身即可以完成某些協(xié)調行為,又可以接受高層Agent 制定的規劃。當前常用的協(xié)調方法有黑板模型、博弈模型、協(xié)調器、交換意見(jiàn)等。
黑板模型信息傳輸量大,對信息傳輸的穩定性也有一定的要求,適用于簡(jiǎn)單的分布式多路口控制。博弈論模型適用于分層遞階結構的上下級Agent 間和完全分布結構的同級Agent 間的協(xié)調,但由于重復博弈過(guò)程中需要進(jìn)行復雜的均衡點(diǎn)收斂控制,所以基于交通信息博弈的計算量較大。協(xié)調器可基于一定的目標將同級和下級Agent 產(chǎn)生的提案合成全局的提案。協(xié)調器降低了系統的通信量和其他Agent 的實(shí)現復雜度,但卻增加了協(xié)調器Agent 自身的設計復雜度和計算量。交換意見(jiàn)法對系統通信的穩定性有很大的要求,當單個(gè)Agent 節點(diǎn)出現通信故障時(shí),系統將無(wú)法正常工作。
從上述幾種方法的分析中可以看到,協(xié)調過(guò)程需要傳輸大量數據,因此容易造成傳輸網(wǎng)絡(luò )的擁塞。目前,很多學(xué)者都采用強化學(xué)習的方法來(lái)優(yōu)化本地的交通信息。強化學(xué)習方法是以環(huán)境提供的加強信號作為性能評價(jià)的反饋,完成從狀態(tài)到行為的映射的學(xué)習,特別適合處理不斷變化的路網(wǎng)環(huán)境。Baher、歐海濤等都基于強化學(xué)習研究了實(shí)時(shí)自適應的交通信號控制,減少路口節點(diǎn)間的大量通訊需求,增強了決策的可靠性。
2.5 相關(guān)應用研究
Ronald通過(guò)將分離獨立的交通設施建模成能互相協(xié)作的Agent,研究了動(dòng)態(tài)交通管理設備互相協(xié)作的可能性。Filippo實(shí)現了一種基于多Agent 架構的交通管理系統CARTESIUS,在分析偶發(fā)性阻塞和在線(xiàn)制定集成控制方案過(guò)程中展示了良好的協(xié)作推理和解決沖突的能力,可為交通管理人員協(xié)調多區域間的快車(chē)道和地面街道的路網(wǎng)阻塞提供實(shí)時(shí)決策支持。
Bo Chen等人將移動(dòng)Agent 技術(shù)融入到交通管理系統中,增強了處理不確定事件和環(huán)境動(dòng)態(tài)變化的能力,提出了一種基于柔性Agent 的實(shí)時(shí)交通檢測和管理系統。
3 多Agent在A(yíng)TIS中的應用
ATIS 可以影響出行行為,增強路網(wǎng)性能。當前采用Agent 技術(shù)研究ATIS 主要是針對不同的出行需求構建各式智能的出行信息系統,為出行者提供高質(zhì)量的出行信息和導航服務(wù);另外是研究ATIS 條件下的出行者行為以及ATIS 對城市交通的影響。
3.1 基于A(yíng)gent 的典型出行信息系統框架
為實(shí)現路網(wǎng)管理者和出行者之間的有效協(xié)調,需要在不嚴重影響個(gè)體出行者的使用偏好(出行類(lèi)型、路徑選擇、離開(kāi)/到達時(shí)間等)基礎上有效地基于時(shí)空二維分配路網(wǎng)?;诖?,Adler 和Blue 研究了智能出行信息系統(IT IS),專(zhuān)為出行者提供出行計劃和導航輔助信息,提出一種代表出行者的車(chē)載智能導航Agent,可以學(xué)習、定義并校準路徑和出行計劃偏好。在此基礎上,他們又提出基于多Agent 的交通管理和路徑導航協(xié)作系統(CTMRGS)的概念框架,使路網(wǎng)管理者、信息提供者和出行者之間能有效的協(xié)調和溝通。系統采用原則協(xié)商指導出行者Agent 和信息提供者Agent 之間的交互,找到一個(gè)時(shí)最優(yōu)的出行方案,最后指出更多的智能將會(huì )被用來(lái)捕捉和呈現出行者的真實(shí)意圖和行為。
3.2 ATIS 影響下的基于多Agent 仿真的出行者行為研究
ATIS 的有效性取決于系統提供信息的能力以及出行者對出行信息的反應。因此,了解出行者的行為及其在出行信息下的決策過(guò)程便顯得尤為重要,這將有助于設計出高效的ATIS.目前,國內外很多學(xué)者都采用Agent 仿真方法研究ATIS 環(huán)境下的出行者行為。
Dia首先提出利用多Agent 仿真來(lái)研究實(shí)時(shí)交通信息影響下的駕駛員行為。通過(guò)對駕駛員行為(特性、心理、知識、偏好等)的調查采用BDI(信念-渴望-意圖)結構建模,配合交通仿真組件評價(jià)交通實(shí)時(shí)信息對駕駛員行為的影響。Rossetti基于BDI 架構提出了基于DRACULA(一種結合用戶(hù)學(xué)習和微觀(guān)模擬的動(dòng)態(tài)路徑分配模型)的多Agent 擴展模型對出行者進(jìn)行建模,允許出行者對出行路徑和離開(kāi)時(shí)間做出理性選擇。
駕駛員的行為會(huì )影響到ATIS 系統收益和系統的整體性能。Rossetti 基于謂詞邏輯表達方式對出行者Agent 建模,使決策過(guò)程中呈現了更多的出行者心理因素。仿真結果表明,系統的整體性能會(huì )受到出行信息需求和交通網(wǎng)絡(luò )拓撲結構的影響,當出行信息單獨向個(gè)體提供的時(shí)候,總體影響可以得到很大改善。
評論