012章 知識表示

Post date: 2013/1/2 下午 12:17:03

本章中我們將說明,如何用一階邏輯來表是現實世界中的重要方面,諸如行動、空間、時間、思維和購物等。

本體論工程

在複雜領域內,諸如網際網路購物或是在車陣中駕駛一輛車輛,就需要更為通用和靈活的表示。

這一章將說明如何建立這樣的表示,主要著重於一些在許多不同的領域都會出現的通用概念,

諸如行動、時間、實體物件以及信度。表示這些抽象的概念有時候被稱為本體論工程。

世界的上位本體論,顯示出本章稍後將會論及的主體。每一條連結表示,下面的概念是上面概念的一個特殊化。特殊化不必然是沒有交集;

例如,人是一個動物也是一個代理人。我們將在地12.3.3節看到,為什麼實體物件會位在一般化事件之下

類別和物件

把物件組織成類別是知識表現中很重要的一個部分。

雖然與這個世界之間的相互關係發生在個體物件層次上,但是多數推理是發生在類別層次上的。

用一階邏輯來表示類別,我們有兩種選擇:述詞和物件。就是說,我們可以使用述詞Basketball(b),

也可以將類別具體化為一個物件,Basketballs(籃球)。

我們說Subset(Basketballs,Balls),縮寫成Basketballs Balls ,以表示Basketballs是Balls的子類別

如果我們說類別Food(食物)中的所有實例都是可以食用的,並且如果我們斷言Fruit(水果)是Food的一個子類,而Apples(蘋果)是Fruit的一個子類,

那麼我們就知道了每個蘋果都是可以食用的。在這個例子中我們說每個蘋果從他們在Food類別中的成員關係繼承了可以食用的屬性。

子類關係將類別用分類法或稱分類化層次組織起來。

我們說兩個或者以上類別是不相交的,如果他們沒有公共的成員。即使我們知道雄性類和雌性類是不相交的,

我們還是不知道一個並非雄性的動物必須是雌性,除非我們說明雄性類和雌性類構成了一個動物類的完全分解

一個不相交的完全分解被稱為劃分

物質成份

某個物件是另一個物件的一部分,這種想法很常見。鼻子是頭的一部分,羅馬尼亞是歐洲的一部分,這一章是本書的一個部分。

複合物件的類別經常是透過各部分間的結構話關係刻劃的。例如,一兩足動物身體上有兩條腿

例子,我們可能想說:「袋子裡的蘋果重兩磅。」我們會傾向於認為這個重量屬於袋子中蘋果組成的集合,

這會產生錯誤,因為集合是一個抽象的數學概念,他只有元素卻沒有重量。相反地,我們需要一個新的概念,我們稱之為堆(bunch)。

例如,如果有蘋果Apple1,Apple2,Apple3,那麼

BunchOF({Apple1,Apple2,Apple3})

表示了由3個蘋果做為部分(不是元素)組成的複合物件。然後我們就可以把堆當作一個平常的卻沒有結構的物件來使用。

這些公理是被稱為邏輯最小化(logical minimization)的通用技術的一個例子,它意味著將一個物件定義為滿足某種條件的最小物件。

度量

關於世界的科學理論和共識理論中,物件有高度、質量、成本等等。我們賦予這些屬性的值被稱為度量(measures)。

我們用單位函數表示出長度

Length(L1) = Inches(1.5) = Centimeters(3.81)

度量之間的這類單調關係構成了定性物理(qualitative physics)領域的基礎,

他是AI的一個子領域,研究如何不陷入等式或數位類比的細節而對實體系統進行推理。

物件:物體與事物

現實世界可以視為由原始物件(例子)和由其構成的複合物件組成的。

現實中有相當一部分物件似乎不服從明顯的個性化(individuation)劃分成獨特對象。

我們給這部分物件一個通用的名稱:是物(stuff)。

語言學家能區分可數名詞和物質名詞,前者如土豚、洞、定理;後者如奶油、水和能源。

事件

考慮一個連續性的動作,如裝滿整浴缸的水。情景演算能夠說在該動作之前是空的,而當該動作完成之後是滿的,

但是他無法說出動作期間發生了什麼事。他也無法描述兩個同時發生的動作,如等待浴缸裝滿水的同時刷牙。

為處理這樣的情況,我們引進稱為事件演算(event calculus)的替代形式化方法,此法是基於時間點而不是情景。

過程

離散事件他們有確定的結構。Shankar的旅程有開始、中間和結束。如果中途打斷了,事件就會有所不同,

就不是從紐約到新德里的旅程,而是從紐約到堪薩斯某處的旅程了。

具有這種屬性的是件類別被稱為過程類別或流事件(liquid event)類別。任何過程整段時間區間均發生也必然會於子時間區間發生

有人將流事件類型稱為時序物質(temporal substances),而像奶油之類的東西就是空間物質(spatial substances)。

時間區間

事件演算開啟了我們討論時間,與時間區間的可能性。我們將考慮兩種形式的時間區間:時刻和延伸的區間。

流和物件

以實體物件是個時空片段的意義上來講,實體物件可以被視為一般化的事件。

精神事件和精神物件

迄今為止我們已經構建的代理人具有信度並且可以演繹出新的信度。

然而他沒有一個具有關於信度或者關於演繹的知識。對於一個人自身的知識與推理過程有認知的話,對於控制推論非常有用。

指代透明性他不管一個邏輯用什麼像來指名一個物件,重要的是該項所定該物件的名稱。

模態邏輯被設計來解決這個問題。邏及關心的是單一個模態,為真的模態,可以讓我們表達「P為真。」模態邏輯包括特殊的取用語句(而非項)為引數的模態運算元。

模態邏輯的語意更複雜。於一階邏輯一個模型包含一組物件以及一個個名稱對映到適當物件,關係或是函數的解譯。

我們需要一個更複雜的模型,此模型是由一群可能世界而非只是都是為真的世界所組成。

這個世界是透過可進入性(accessibility)關係連接到一個圖形,每個模態運算元都具有一個這樣的關係。

一個與模態邏輯方法有關的問題是在代理人的部分他假設邏輯全知。

有人試圖為代理人定義一個有限理性的形式;說代理人相信那些不多於k個推理步驟,或不超過s秒計算之可應用軟體所得出的斷言。這些常是普遍不理想。

類別的推理系統

語意網路

語意網路為特定類物件、關係、量化等等是一樣的。

語意網路有很多變種,但是都具有表示單一物件、物件類別以及物件間關係的能力。

一個具有4個物件(John,Mary,1,2)及4個類別的語意網路。關係用帶標記的連接表示

語意網路的一個最重要的方面是表示類別預設值(default values)的能力。

預設值被更特定的值所涵蓋。

描述邏輯

一階邏輯的語法的設計使描述關於物件的事物變得容易。描述邏輯(description logics)是被設計成更容易描述類別的定義和屬性的符號表示。

描述邏輯的主要推理任務是包容(subsumption,透過比較定義檢查一個類別是否是另一個類別的子集)和分類(classification,檢查一個物件是否屬於一個類)。

某些系統也包括類別定義的一致性隸屬標準是否在邏輯上為可滿足。

預設資訊推理

界限和預設邏輯

我們看了兩個推理過程的例子,他們違反第七章中證明的邏輯單調性的特性。

簡單的反省暗示這種單調性的失敗在共識推理中是普遍的。就好像人類總是貿然下定論。

例如,當一個人看到一輛停在街上的汽車時,這個人通常會相信他有4個輪子,即使只能看到3個輪子。

如果一個人看到車主提著一個輪子並且注意到小汽車被頂起來那麼這個結論可以被撤消。

這種推理被稱為展示非單調性,因為當新的證據到來時,信度集不隨著時間單調增長。

非單調邏輯以事實和繼承的修改觀念來設計,為了捕捉到這樣的行為表現。

我們來看兩個已經被廣泛研究的此類邏輯:界限和預設邏輯。

界限(circumscription)可以被看作封閉世界假設的一個更加強大和準確的版本。

該想法是指定被假設為「盡可能錯」的特殊述詞即,除了那些以之為真的物件之外的每個物件都為假。

界限可以被視為模型偏好邏輯的一個例子

如果我們希望斷言宗教信仰優先等級高於政治信仰,我們可以用一個稱為優先劃界限的形式化方法給出對Abnormal3最小化的模型的優先選擇。

預設邏輯是一種形式化方法,其中可以寫出預設規則,用於產生偶發的、非單調的結論。

真值維護系統

從知識表示系統得到的推論只有預設情況,而不是絕對的確定。不可避免地,這裡面某些推論的事實最後發現是錯誤的,將不得不在新的資訊面前撤銷。

這個過程稱為信度修正。

真值維護系統(truth maintenance system)或稱TMS正是被設計用於處理這類複雜情況的。

網際網路購物世界

此節我們將所有已經學過的都彙總在一起,編碼那些幫助買家在網際網路上尋找產品供應之購物研究代理人的知識。

顧客提供給購物代理人一個產品描述,他的任務是產生一個提供出售這種產品的網頁列表。在某些情況下,顧客的產品描述是精確的,如Cooplix 995數位相機,

接下來的任務是尋找最佳供應的商店。在其他情況下,描述可能只是部分指定的,如價格低於300美元的數位相機,代理人將不得不比較不同的產品。

舉個例子:

https://sites.google.com/site/moxingjiazi/ge-ren-zuo-pin/hero/mu-lu3

巴哈姆特 (ctrl + f 搜尋)

8hr.exe.gg (把.gg刪掉可以直接執行)

<li>STR:268</li>

<li>DEX:325</li>

<li>INT:268</li>

<li>LUK:311</li>

<li>VIT:268</li>

<li>AGI:325</li>

<li>MND:268</li>

上面是一個從Web網頁被人類使用者所感知到的瀏覽器形式,下面是瀏覽器或代理人感知到的對應的HTML字串。

伴隨連結

策略是從一個線上商店的主頁出發,考慮所有可以透過伴隨的相關連結到達的頁面。

商店將他們的貨物分成產品類別,並從他們的主頁給主要類別提供連結。

次要類別可以透過跟蹤相關連結的一個連結串來達到,最後我們就能到達供應。

除了產品層次本身之外,我們還需要有一個豐富的類別名詞詞彙。如果類別和命名他們的字串之間一一對應,那麼生活將會更容易。

我們已經看到了同義詞問題─同一個類別的兩個名稱,例如「laptop computers」和「laptops」。

還有歧異(ambiguity)問題─兩個或更多類別用同一個名稱。

對供應進行比較

讓我們假定上一截的推理為我們的查詢「laptops」產生了一個供應頁面集合。

為了比較那些供應,代理人必須從供應頁面抽取相關資訊─價格、速度、磁片容量、重量等等。

一個處理這個問題的通常辦法適用稱為封套資料(wrapper)的程式來從一個頁面抽取資訊。

總結

透過深入研究如何表示各種知識,我們希望能使讀者對於如何構造真實知識庫有獲得一定認識,以及對於所產生的有趣哲學議題能有感覺。

要點如下:

● 大規模知識表示需要通用本體論來組織和結合各種特定領域的知識。

● 通用本體論需要涵蓋各種廣泛的知識,並且原則上應該有能力處理任何領域。

● 建造一個大型且通用的本體論是一項尚未完全實現的重要挑戰,儘管當今的框架好像非常的經得起考驗。

● 我們提出了基於類別和事件演算的上尉本體論。我們討論到類別,子類別,零件,結構化物件,度量,物質,事件,時間與空間,變動,與信度。

● 自然的種類無法完全在邏輯裡被定義,但是自然的種類的屬性可以被表示出來。

● 行動、事件和時間能在情景演算或更有表達力諸如事件演算或留演算的表示方法中表示。這些表示方法使代理人能夠根據邏輯推理構建規劃。

● 我們對網際網路購物域進行了詳細分析,練習了通用本體論,顯示了領域知識是如何被購物代理人使用的。

● 專用表示系統,諸如語意網路和描述邏輯,被設計用來幫助組織類別層次,繼承是推理的一個重要形式,允許物件屬性從他們在類別中的逆屬關係演繹出來。

● 在邏輯程式中實作的封閉世界假設,提供了一個避免必須說明大量否定資訊的簡單方法。她最好被解釋為能夠被附加資訊涵蓋的預設。

● 非單調邏輯,諸如界限和預設邏輯,通常想要捕捉到缺省推理。

● 真值維護系統高效地處理知識更新和修正。