Google開發出新索引系統領先業界

Facebook

【新唐人2010年6月10日訊】Google公司的軟件工程師格里梅斯(Carrie Grimes)週二(6月8日)在Google的官方博客中宣佈,Google已經開發出速度更快、檢索結果更準確的新型網絡內容索引系統Caffeine。

格里梅斯在博客中寫道,當前Google使用的索引技術相比,Caffeine檢索結果時效性會提高50%。無論是網絡新聞,還是博客文章以及論壇發帖內容,一旦這些內容發佈,Caffeine將能馬上收錄這些內容的相應鏈接。

Google的老式索引系統採用了多層技術,那種情況下部份索引層的內容更新快於其它層面;主索引層通常是每隔數週更新一次。如果要更新其中的某個索引層,就是必須對整個互聯網進行分析。如此一來,網民所搜索到的結果,與互聯網的實際內容之間會有一個時間差。

Caffeine技術將互聯網劃分為不同的部份,然後對不同部份內容在全球範圍內進行持續的升級。一旦發現了新內容,就將其添加到當前索引當中。這就是說,你在使用Google搜索過程中,所獲得的結果與互聯網實際內容的時間差已經非常小。

Caffeine技術也可以實現對網絡內容索引的規模化。格裡梅斯稱,Caffeine每秒鐘可同時處理數十萬個網頁。如果這些網頁是現實生活中的紙張,則這些紙張每秒鐘將堆成3英里高。Caffeine在一個數據庫中可處理近1億GB的存儲信息,且每天存儲信息量都在大幅增長。你需要使用62.5萬部容量最大的iPod音樂播放器,才能存儲這些信息,如果將這些iPod並排放置,則可長達40英里。

去年8月期間,Google首次對外公佈了Caffeine的部份技術細節。Google開發Caffeine的主要原因是:應對來自微軟必應(Bing)、「知識引擎」Wolfram Alpha等競爭對手的挑戰,以保持Google在搜索引擎技術產業的領先地位。

Caffeine不僅僅提高了網絡索引的時效性,而且使組建性能更強大的搜索引擎成為可能,籍此向網民提供質量更好的搜索服務。

相關文章