百度是全球最優秀的中文信息檢索與傳遞技術供給商,公司號稱“全球最大的中文搜索技術提供商”。中國所有提供搜索引擎的門戶網站中,超過90%以上都由百度提供搜索引擎技術支持,現有客戶包括新浪、搜狐(chinaren)、Tom(163.net)、騰訊、263、21cn、上海熱線、廣州視窗、新華網、北方時空、西部時空、重慶熱線、吉林信息港、大慶信息港、東方熱線、湖南信息港、南陽信息港、順德信息網。

  百度搜索引擎使用了高性能的“網絡蜘蛛”程序自動的在互聯網中搜索信息,可定制、高擴展性的調度算法使得搜索器能在極短的時間內收集到最大數量的互聯網信息。百度在中國各地和美國均設有伺服器,搜索范圍涵蓋了中國大陸、香港、臺灣、澳門、新加坡等華語地區以及北美、歐洲的部分站點。百度搜索引擎擁有目前世界上最大的中文信息庫,總量達到6000萬頁以上,并且還在以天天幾十萬頁的速度快速增長。由于后臺應用了高效的信息索引算法,大大提高了檢索時的響應速度和承受大訪問量時的穩定性,百度搜索引擎對超過6000萬網頁檢索一次的本地平均響應時間小于0.5秒。

  百度公司(Baidu.com,Inc)于1999年底成立于美國硅谷,它的創建者是資深信息檢索技術專家、超鏈分析專利唯一持有人──百度總裁李彥宏,及其好友──在硅谷有多年商界成功經驗的百度執行副總裁徐勇博士。

  百度搜索引擎的特點

  1. 基于字詞結合的信息處理方式。巧妙解決了中文信息的理解問題,極大地提高了搜索的準確性和查全率。

  2. 支持主流的中文編碼標準。包括GBK(漢字內碼擴展規范)、GB2312(簡體)、BIG5(繁體),并且能夠在不同的編碼之間轉換。

  3. 智能相關度算法。采用了基于內容和基于超鏈分析相結合的方法進行相關度評價,能夠客觀分析網頁所包含的信息,從而最大限度保證了檢索結果相關性。

  4. 檢索結果能標示豐富的網頁屬性(如標題、網址、時間、大小、編碼、摘要等),并突出用戶的查詢串,便于用戶判定是否閱讀原文。

  5. 百度搜索支持二次檢索(又稱漸進檢索或逼進檢索)。可在上次檢索結果中繼續檢索,逐步縮小查找范圍,直至達到最小、最準確的結果集。利于用戶更加方便地在海量信息中找到自己真正感愛好的內容。

  6. 相關檢索詞智能推薦技術。在用戶第一次檢索后,會提示相關的檢索詞,幫助用戶查找更相關的結果,統計表明可以促進檢索量提升10-20%。

  7. 運用多線程技術、高效的搜索算法、穩定的UNIX平臺、和本地化的伺服器,保證了最快的響應速度。百度搜索引擎在中國境內提供搜索服務,可大大縮短檢索的響應時間(一個檢索的平均響應時間小于0.5秒)

  8. 可以提供一周、二周、四面等多種服務方式。可以在7天之內完成網頁的更新,是目前更新時間最快、數據量最大的中文搜索引擎。

  9. 檢索結果輸出支持內容類聚、網站類聚、內容類聚 網站類聚等多種方式。支持用戶選擇時間范圍,提高用戶檢索效率。

  10. 智能性、可擴展的搜索技術保證最快最多的收集互聯網信息。擁有目前世界上最大的中文信息庫,為用戶提供最準確、最廣泛、最具時效性的信息提供了堅實基礎。

  11. 分布式結構、精心設計的優化算法、容錯設計保證系統在大訪問量下的高可用性、高擴展性、高性能和高穩定性。

  12. 高可配置性使得搜索服務能夠滿足不同用戶的需求。

  13. 先進的網頁動態摘要顯示技術。

  14. 獨有百度快照,

  15. 支持多種高級檢索語法,使用戶查詢效率更高、結果更準。已支持“ ”(AND)、“-”(NOT)、“|”(OR)、“site:”、“link:”,還將繼續增加其它高效的搜索語法。

arrow
arrow
    創作者介紹
    創作者 EMBA的小眼睛 的頭像
    EMBA的小眼睛

    EMBA的小眼睛

    EMBA的小眼睛 發表在 痞客邦 留言(0) 人氣()