自從計算機誕生以來,人們一直希望用自然語言同計算機交流。從人工智能的觀點看,自然語言理解的任務是建立一種計算機模型,這種計算機模型能夠給出像人那樣理解、分析并回答自然語言(即人們日常使用的各種人類語言)的結果?,F在計算機的智能還遠遠沒有達到能夠像人一樣理解自然語言的水平,而且在可預見的將來也達不到這樣的水平。因此,關于計算機對自然語言的理解一般是從實用的角度進行評判的。如果計算機實現了人機會話,或機器翻譯,或自動文摘等語言信息處理功能,則認為計算機具備了自然語言理解的能力。
以自然語言理解技術為基礎的新一代搜索引擎,稱智能搜索引擎。由于它將信息檢索從目前基于關鍵詞層面提高到基于知識(或概念)層面,對知識有一定的理解與處理能力,能夠實現分詞技術、同義詞技術、概念搜索、短語識別以及機器翻譯技術等。因而這種搜索引擎具有信息服務的智能化、人性化特征,允許用戶采用自然語言進行信息的檢索,為他們提供更方便、更準確的搜索服務。與傳統的網站目錄、關鍵詞查詢模式相比,自然語言查詢的優勢體現在:使網絡交流更加人性化,使信息查詢變得更加方便、快速和準確?,F在,已經有越來越多的搜索引擎宣布支持自然語言搜索特性,但是要建立真正的基于自然語言理解的智能查詢系統,還存在很多的技術難點。如:如何理解自然語言及所代表的實際含義,如何根據問題找出用戶實際想要的答案,如何建立大規模知識庫等。
目前智能搜索引擎的研發主要有兩大方向:一是基于機器翻譯技術,如Google等,二是基于語義理解技術,如AskJeeves等又稱機譯(MT),是利用計算機把一種自然語言轉變成另一種自然語言的過程。智能搜索引擎在這一領域的研究將使得用戶可以使用母語搜索非母語的網頁,并以母語瀏覽搜索結果。語義理解通過將語言學的研究成果和搜索引擎技術結合在一起,實現了搜索引擎對搜索詞在語義層次上的理解,為用戶提供最確切的搜索服務。 |