Prof. Mu's talk, 10/01

在聽穆老師的課前,我們看了一篇講LSI (Latent Semantic Indexing) 的英文文章,啃得很辛苦對LSI卻仍一知半解。大概只記得文章提到LSI對檢索中的同義字 (synonymy) 比較有功效。

一開始老師親切地以中文介紹了Milwaukee的風光以及他居住的湖畔別墅,真是令人羨慕呀!進入正題後開始以英文講解。老實說,坐在中後方的我聽得不是很清楚也不是很懂,真是對遠道而來的老師不好意思呀!所以上網找了一個介紹LSI的網頁 http://knowledgesearch.org/lsi/lsa_explanation.htm,再結合穆老師的課堂中提到的東西,才讓我對LSI有個較清楚的畫面,同時也讓我聯想起了權威控制。

權威控制的目的,就是在改進檢索的結果,使能一次找全、找準。但一般使用者使用或是接受程度似乎總是不那麼顯著。穆老師投影片的副標題:No blames on Users,我們可以善用科技為我們達到改善檢索結果的目的。記得以前看電視某個藝人提到林青霞,說她在化妝室化了兩個多小時的妝,一出來卻看起來好像沒化妝一樣,這是化妝師技術高明之處。我們的檢索系統,也可以此為目標,讓讀者不知不覺、只需直覺地點選就能找到符合所需的資料,這背後就可以由像LSI這樣高明的技術來完成。所以,以使用者的觀點來說,我們到底需不需要建立權威控制呢?

如果把龐大的網路資源當成一個超大型的語料庫 (corpus),利用LSI可以找出相關的網頁或文章,及也許可以蒙資訊爆炸之利,而不受其害。

沒有留言: