015 關於時間的機率推理

Post date: 2013/1/22 下午 01:02:48

本章中,我們將試圖即使在極少情況是清晰明瞭下,去解釋現在,理解過去,或者還預測未來。

時間與不確定性

我們已在靜態世界之文脈中發展了用於機率推理的技術,在靜態世界裡每一個隨機變數都有一個單一的固定值。

狀態與觀察

將世界視為一連串的快照或為時間片段(time slices),個別包含了隨機變數的集合,部分為可觀察的,但部分則否。

轉移模型和感測模型

再給定問題中確定了狀態的集合與證據變數,下一步便是要指定世界是如何發展(轉移模型)與證據變數是如何得到他們的值(感測模型)。

時序模型中的推理

建立了一般時序模型的結構之後,我們可以對要解決的基本推理任務進行公式化:

● 濾波:

這個任務是計算信度狀態─即在到目前為止所有已知的證據下,當前狀態的是後機率分佈。

濾波也稱為狀態估計。

● 預測:

這個任務是在到目前為止所有給定的證據下,計算未來某個狀態的事後機率分佈。

● 平滑:

這個任務是在到目前為止所有給定的證據下,計算過去某一狀態的事後機率。

● 最可能解釋:

給定了一系列觀察結果,我們希望找到最可能產生這些觀察結果的狀態序列。

除了這些推論任務,也還有

● 學習:

轉移模型和感測模型若仍然未知,可由觀測中學習。

濾波和預測

如同我們於7.7.3節指出的,有用的濾波演算法必須維護與更新當前狀態估計,而非對於各個更新透過整個認知的過去回溯。

(否則,隨著時間會增加各個更新的代價)。

平滑

平滑計算 P(Xk | e1:t),即在給定從時刻 1 到 t 的完整觀察序列後,在過去某個時刻 k 的狀態其事後機率分佈

如前面已經提到的,平滑是根據直到現在的已知證據來計算過去的狀態分布的過程

尋找最可能序列

假設警衛在上班的前 5 天觀測到的雨傘序列為 [ true,true,false,true,true]。那麼哪種天氣序列能

最好地解釋這個雨傘序列呢?第 3 天沒出現雨傘意味著當天沒有下雨還是主管忘了帶?如果第 3 天

沒有下雨,可能第 4 天也不會下雨(因為天氣有保持的趨勢),而主管帶傘只是為了以防萬一。

癮馬可夫模型

簡化的矩陣演算法

透過單個離散狀態變數 Xt,我們能夠給出表示轉移模型、感測器模型以及前向、後向訊息的具體形式。

隱馬爾克夫模型範例:定位

在第 4.4.4 節,我們介紹一個對於真空世界定位問題的簡單形式。在這個版本,機器人有個單一

不確定性 Move 動作,且其感測器報告完美,不論障礙物立即北、南、東和西,機器人的信度狀態是在於它所處的可能位置的集合。

卡爾曼濾波器

更新高斯分布

在第14章中,我們曾間接提到過線性高斯分佈族的一個關鍵性質:在標準貝氏網路操作下這個分佈族保持封閉。

這裡,我們在時序機率模型上的濾波上下文中使這個斷言更精確。

一個簡單的一維例子

我們在前面已經提到過,卡爾曼濾波器中的 FORWARD 運算元將一個高斯分佈映對成另一個新的高斯分佈。

這轉變成從一個原有的均值與協變異數矩陣計算新的均值與協變異數矩陣的過程。

一般情況

前面的推導描述了做為卡爾曼濾波器工作基礎的高斯分佈的關鍵性質:指數是二次多項式形式。

卡爾曼濾波的適用性

卡爾曼濾波器及其具體形式得到了大量應用。其「經典」應用是對飛行器及導彈的雷達跟蹤。

相關的應用包括對潛艇及地面車輛的聲學跟蹤、車輛和人的視覺追蹤等。

動態貝氏網路

動態貝氏網路(dynamic bayesian network),或縮寫為DBN

建構動態貝氏網路

要建構一個動態貝氏網路,我們必須指定 3 類資訊:狀態變數的是前機率分佈 P(X0);轉移模型 P(Xt+1 | Xt);

以及感測器模型 P(Et | Xt)。 為了指定轉移模型和感測器模型,必須還要指定相繼時間片之間、狀態變數與證據變數之間的連接

關係的拓樸結構。

動態貝氏網路中的精確推理

已經概略說明了一些將複雜過程表示為動態貝氏網路的想法現在我們轉到推理問題上從某種意義上來說這個問題已經得到解答動態貝氏網路仍然是貝氏網路而我們已經瞭解了貝氏網路中的推理演算法。

動態貝氏網路中的近似推理

第14.5節描述了兩種近似演算法:可能性加權(圖14.15)和馬可夫鏈蒙特卡洛演算法(MCMC,圖14.16)。

這兩種方法中,前者能夠很容易應用於動態貝氏網路背景中(MCMC 濾波演算法簡短地敘述於本章最末的註釋)。

多重目標的追蹤

在先前章節已考量的──但未提及到──包含單一目標的狀態估計問題。

總結

本章所強調的主要是關於機率時序過程的表示與推理的一般問題。要點如下:

● 世界中不斷發生變化的狀態是用一個隨機變數集表示每個時間點的狀態來處理的。

● 可以把表示方法設計成滿足馬可夫特性,這樣只要給定了現在的狀態,未來就不在依賴於過去。

再結合隱態過程假設──也就是說,過程的動態特性不隨時間發生改變──通常能夠簡化對問題的表示。

● 可以認為時序機率模型包含了描述演化資訊的轉移模型和描述觀察過程的感測器模型。

● 時序模型中的主要推理任務包括:濾波、預測、平滑以及計算最可能解釋。這些任務的每一個

都可以透過簡單的遞迴演算法實作,並且其執行時間與序列長度呈線性關係。

● 本章更深入地研究了 3 個時序模型族:隱馬可夫模型、卡爾曼濾波器以及動態貝氏網路(前兩者是後者的特殊情況)。

● 除非像在卡爾曼路波器中採用特殊假設,否則多狀態變數上的精確推理是相當困難。事實上,

粒子濾波演算法看來是一種有效的近似演算法。

● 當試著追蹤數個目標的時候,不確定性則提高(根據哪個觀測屬於哪個目標)──這種資料關聯問

題。數種關聯假設是典型第龐大難以處理的,但 MCMC 與粒子演算法對於資料關聯在實際上運作良好。