-
當前位置:首頁 > 創(chuàng)意學院 > 技術 > 專題列表 > 正文
搜索引擎的兩大核心技術是(搜索引擎的兩大核心技術是)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于搜索引擎的兩大核心技術是的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關鍵詞,就能返回你想要的內容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com
本文目錄:
一、全文搜索引擎與目標索引類搜索引擎有什么區(qū)別?
一、指代不同
1、全文搜索引擎:通過從互聯(lián)網(wǎng)上提取的各個網(wǎng)站的信息(以網(wǎng)頁文字為主)而建立的數(shù)據(jù)庫中,檢索與用戶查詢條件匹配的相關記錄,然后按一定的排列順序將結果返回給用戶。
2、目標索引類搜索引擎:是以網(wǎng)頁形式提供查找網(wǎng)絡資源的一種網(wǎng)絡信息檢索工具。
二、特點不同
1、全文搜索引擎:以各類數(shù)據(jù)如文本、聲音、圖像等為對象,提供按數(shù)據(jù)的內容而不是外在特征來進行的信息檢索,其特點是能對海量的數(shù)據(jù)進行有效管理和快速檢索。
2、目標索引類搜索引擎:使用自動索引軟件來搜集和標記網(wǎng)頁資源,并將這些資源存入數(shù)據(jù)庫。當用戶輸入檢索的關鍵詞后,它在數(shù)據(jù)庫中找出與該詞匹配的記錄,并按相關程序排序后顯示輸出。
三、影響不同
1、全文搜索引擎:是搜索引擎的核心技術,同時也是電子商務網(wǎng)站的支撐技術。全文檢索技術可應用于企業(yè)信息網(wǎng)站、媒體網(wǎng)站、政府站點、商業(yè)網(wǎng)站、數(shù)字圖書館和搜索引擎中。
2、目標索引類搜索引擎:由自動索引軟件生成數(shù)據(jù)庫,所收錄的網(wǎng)絡資源范圍廣、速度快、更新及時,但因缺乏人工干預,準確性較差。這類檢索工具適用于查找特定的信息以及專指性強或不易明確分類的具體問題,例如百度搜索引擎。
參考資料來源:百度百科-索引型搜索引擎
參考資料來源:百度百科-全文搜索引擎
二、什么是搜索引擎
1、所謂搜索引擎,就是根據(jù)用戶需求與一定算法,運用特定策略從互聯(lián)網(wǎng)檢索出制定信息反饋給用戶的一門檢索技術。搜索引擎依托于多種技術,如網(wǎng)絡爬蟲技術、檢索排序技術、網(wǎng)頁處理技術、大數(shù)據(jù)處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。搜索引擎技術的核心模塊一般包括爬蟲、索引、檢索和排序等,同時可添加其他一系列輔助模塊,以為用戶創(chuàng)造更好的網(wǎng)絡使用環(huán)境。
2、搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上采集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將檢索的相關信息展示給用戶的系統(tǒng)。搜索引擎是工作于互聯(lián)網(wǎng)上的一門檢索技術,它旨在提高人們獲取搜集信息的速度,為人們提供更好的網(wǎng)絡使用環(huán)境。從功能和原理上搜索引擎大致被分為全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎等四大類。
3、搜索引擎發(fā)展到今天,基礎架構和算法在技術上都已經(jīng)基本成型和成熟。搜索引擎已經(jīng)發(fā)展成為根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統(tǒng)。
三、《這就是搜索引擎核心技術詳解》pdf下載在線閱讀,求百度網(wǎng)盤云資源
《這就是搜索引擎核心技術詳解》張俊林電子書網(wǎng)盤下載免費在線閱讀
鏈接:https://pan.baidu.com/s/1XfGxqz7ATbGJydW6YGqhqA
提取碼:0764
書名:這就是搜索引擎核心技術詳解
作者名: 張俊林
豆瓣評分:8.0
出版社:電子工業(yè)出版社
出版年份: 2012-1-1
頁數(shù):300
內容介紹:
本書的最大特點是內容新穎全面而又通俗易懂。對于實際搜索引擎所涉及的各種核心技術都有全面細致的介紹,除了作為搜索系統(tǒng)核心的網(wǎng)絡爬蟲、索引系統(tǒng)、排序系統(tǒng)、鏈接分析及用戶分析外,還包括網(wǎng)頁反作弊、緩存管理、網(wǎng)頁去重技術等實際搜索引擎必須關注的技術,同時用相當大的篇幅講解了云計算與云存儲的核心技術原理。另外,本書也密切關注搜索引擎發(fā)展的前沿技術:Google的咖啡因系統(tǒng)及Megastore等云計算新技術、百度的暗網(wǎng)抓取技術阿拉丁計劃、內容農(nóng)場作弊、機器學習排序等。諸多新技術在相關章節(jié)都有詳細講解,同時對于社會化搜索、實時搜索及情境搜索等搜索引擎的未來發(fā)展方向做了技術展望。為了增進讀者的理解,全書大量引入形象的圖片來講解算法原理,相信讀者會發(fā)現(xiàn)原來搜索引擎的核心技術理解起來比原先想象的要簡單得多。
作者介紹:
張俊林:本科畢業(yè)于天津大學管理學院,2004年于中科院軟件所直接獲得博士學位并留所從事科研工作,研究方向為搜索引擎與自然語言處理。2005年在CSDN博客發(fā)布系列博文“搜索引擎設計實用教程:以百度為例”,在網(wǎng)絡上獲得了廣泛轉載與良好口碑。2006年作為聯(lián)合創(chuàng)始人建立了智能信息聚合網(wǎng)站“玩聚網(wǎng)”,曾先后于阿里巴巴搜索技術中心任資深搜索技術研究員、房價網(wǎng)首席研究員,現(xiàn)任職于新浪微博,從事微博搜索與語義分析及推薦方面的研發(fā)工作。
四、什么是YST核心搜索技術?
YST是雅虎搜索技術(Yahoo!Search Technology)的簡稱,是雅虎公司2003年斥資近20億美金收購Inktomi,Overture,Alta Vista,F(xiàn)ast四家國際知名搜索服務商后,經(jīng)過數(shù)百名工程師一年的開發(fā)打磨,于2004年2月正式推出的國際領先的搜索引擎。雅虎2004年2月宣布中斷與Google的合作,在全球范圍內轉而采用YST,并在之后的使用中發(fā)現(xiàn),各項搜索主要指標(流量、用戶數(shù)、點擊率)表現(xiàn)優(yōu)秀。
YST有哪些技術特色?
◆頂尖國際資金與技術支持
◆全球領先的海量數(shù)據(jù)庫(45億網(wǎng)頁):Google40億,百度2億
◆全球領先的數(shù)據(jù)庫更新速度:數(shù)據(jù)庫整體更新時間為兩周,Google為三周
◆支持多語種搜索:36種語言
◆個性化搜索功能:站內搜索,按文件類型搜索,按時間搜索,按語言類型搜索等
◆即將落戶中國的服務器群:向本地提供穩(wěn)定快速的搜索服務。
◆強有力的本地開發(fā)團隊:進行中文搜索的研究及其它本地化開發(fā)
◆最完善的敏感詞過濾系統(tǒng):保證向中國市場提供搜索服務的穩(wěn)定性
YST在目前全球的使用狀況如何?
YST與Google已成為在全球范圍內使用量最大的搜索引擎。
Nielsen/NetRatings發(fā)布的數(shù)據(jù)顯示,在2004年1月份,使用 Google進行搜索的用戶約占全部網(wǎng)民的39%。各有30%的互聯(lián)網(wǎng)用戶使用了雅虎、MSN(YST技術支持)的搜索工具。Google、雅虎、MSN (YST技術支持)的市場份額分別為36%、25%和14%。美國互聯(lián)網(wǎng)調查三月份的最新數(shù)據(jù)顯示,Google與雅虎的市場份額已升為45%與43%。
YST如何在中國落戶的?
早在2003年底,雅國中國就已悄然派出一支技術團隊前往美國進行YST的培訓和本地化開發(fā)工作。2004年2月至3月,雅虎中國及3721右?guī)捎昧薡ST技術,替換了原有的網(wǎng)頁搜索提供商百度與慧聰。據(jù)內部統(tǒng)計,在切換前后,網(wǎng)頁搜索的瀏覽量及搜索結果點擊率有了顯著的增長。
YST的團隊有多少人?
雅虎目前有數(shù)百名工程師,包括60多名博士專門從事YST的開發(fā),這個團隊還在不斷地壯大中。
國際搜索時常格局是如何分布的?
國際搜索市場雖然群雄林立,但市場份額主要集中在幾大擁有核心技術的搜索巨頭身上。經(jīng)過這兩年業(yè)界的整合,目前Google、雅虎和MSN等三大廠商就囊括約70%的全球搜索市場份額,其他的眾多廠商蠶食其他的市場份額。值得注意的是,目前MSN的網(wǎng)頁搜索技術還是采用雅虎最新推出的YST。目前全球搜索市場呈精確化、資本化、區(qū)域化、母語化和集中化等五大趨勢。
雅虎的技術優(yōu)勢
雅虎從創(chuàng)業(yè)之初,就以技術見長。雅虎創(chuàng)始人楊致遠和大衛(wèi)·費羅深厚的技術背景以及雅虎獨特的文化吸引了全球各地頂尖技術高手加盟雅虎。目前,雅虎公司是世界上擁有互聯(lián)網(wǎng)技術專利最多的公司之一,尤其是在防止垃圾郵件、精確搜索、點擊付費廣告和互聯(lián)網(wǎng)即時通信領域,具有絕對的技術競爭優(yōu)勢。
以上就是關于搜索引擎的兩大核心技術是相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內容。
推薦閱讀:
搜索引擎大全網(wǎng)址(搜索引擎大全網(wǎng)址下載)