-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
關(guān)于搜索引擎的描述,正確的是(關(guān)于搜索引擎的描述,正確的是什么)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于關(guān)于搜索引擎的描述,正確的是的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請(qǐng)撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、有關(guān)搜索引擎分詞說法正確的是( )。A、英文的分詞按字母進(jìn)行分割 B、按單漢字匹配的分詞有較高的查全率
B、按單漢字匹配的分詞有較高的查全率
二、計(jì)算機(jī)應(yīng)用基礎(chǔ)考試3 求助
36.下面(c )命令用于測(cè)試網(wǎng)絡(luò)是否連通。
A. telnet
B. nslookup
C. ping
D. ftp
37.下列關(guān)于搜索引擎的原理說法不正確的是(c )。
A. 全文搜索引擎一般都有個(gè)“網(wǎng)絡(luò)蜘蛛”,它掃描一定范圍內(nèi)的網(wǎng)站,并沿著網(wǎng)絡(luò)上的鏈接從一個(gè)網(wǎng)頁(yè)到另一個(gè)網(wǎng)頁(yè),采集網(wǎng)頁(yè)資料
B. 搜索引擎有一個(gè)索引數(shù)據(jù)庫(kù),網(wǎng)絡(luò)機(jī)器人或網(wǎng)絡(luò)蜘蛛采集的網(wǎng)頁(yè),經(jīng)過其他程序進(jìn)行分析,根據(jù)一定的相關(guān)算法進(jìn)行大量的計(jì)算機(jī)建立網(wǎng)頁(yè)索引,添加到這個(gè)索引數(shù)據(jù)庫(kù)中
C. 當(dāng)你輸入關(guān)鍵詞進(jìn)行查詢時(shí),搜索引擎會(huì)從龐大的數(shù)據(jù)庫(kù)中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁(yè)的索引呈現(xiàn)給我們。所以,當(dāng)我們以同一關(guān)鍵詞用不同的搜索引擎時(shí),搜索結(jié)果是相同的
D. 和全文搜索引擎一樣,分類目錄的整個(gè)工作過程也同樣分為收集信息、分析信息和查詢信息三部分,只不過分類目錄的收集、分信息兩部分主要依靠人工完成
38.當(dāng)在搜索引擎中輸入“computer book”(用引號(hào)括起來的computer book),檢索的結(jié)果最可能是(b )。
A. 結(jié)果滿足computer和book其中的一個(gè)條件
B. 結(jié)果滿足computer和book兩個(gè)條件
C. 結(jié)果中滿足computer book這個(gè)條件,而不是滿足computer或book任何一個(gè)條件
D. 結(jié)果中包含computer或book
39.YAHOO網(wǎng)站在萬維網(wǎng)上搜索的方法是(a )。
A. 能交替使用“分類目錄”和“關(guān)鍵字”搜索
B. 既不能使用“分類目錄”搜索,也不能使用“關(guān)鍵字”搜索
C. 只能使用“分類目錄”搜索
D. 只能使用“關(guān)鍵字”搜索
40.FTP是實(shí)現(xiàn)文件在網(wǎng)上的(c )。
A. 復(fù)制
B. 移動(dòng)
C. 查詢
D. 瀏覽
41.在Internet上收發(fā)E-mail的協(xié)議不包括(c )。
A. SMTP
B. POP3
C. ARP
D. IMAP
42.電子郵件從本質(zhì)上來說就是(d )。
A. 瀏覽
B. 電報(bào)
C. 傳真
D. 文件交換
43.計(jì)算機(jī)病毒主要破壞數(shù)據(jù)的(c )。
A. 可審性
B. 可靠性
C. 完整性
D. 可用性
44.下面不屬于網(wǎng)絡(luò)安全的基本屬性是( b)。
A. 機(jī)密性
B. 可用性
C. 完整性
D. 語(yǔ)義的正確性
45.計(jì)算機(jī)病毒是(a )。
A. 一種程序
B. 使用計(jì)算機(jī)時(shí)容易感染的一種疾病
C. 一種計(jì)算機(jī)硬件
D. 計(jì)算機(jī)系統(tǒng)軟件
46.下面不屬于計(jì)算機(jī)病毒特性的是( c)。
A. 傳染性
B. 欺騙性
C. 可預(yù)見性
D. 隱藏性
47.能夠同時(shí)在顯示屏幕上實(shí)現(xiàn)輸入輸出的設(shè)備是(d )。
A. 手寫筆
B. 掃描儀
C. 數(shù)碼相機(jī)
D. 觸摸屏
48.WinRAR不能實(shí)現(xiàn)的功能有(a )。
A. 對(duì)多個(gè)文件進(jìn)行分卷壓縮
B. 雙擊一個(gè)壓縮包文件將其自動(dòng)解壓到當(dāng)前文件夾
C. 使用右鍵快捷菜單中的命令在當(dāng)前目錄下快速創(chuàng)建一個(gè)RAR壓縮包
D. 給壓縮包設(shè)置密碼
49.以下文件格式中,屬于音頻文件的是( c)。
A. AVI
B. MPEG
C. MP3
D. MOV
50.以下軟件中,不屬于音頻播放軟件的是(c )。
A. Winamp
B. 錄音機(jī)
C. Premiere
D. RealPlayer
三、助理電子商務(wù)師理論考試題及答案
一、選擇題
1.新聞組的英文寫法為( )。
(A)USENET
(B)BBS
(C)NEWSGROUP
(D)TELNET
2.判斷新聞組主題的方法有哪些?( )
(A)討論組章程
(B)討論組的文章內(nèi)容
(C)新聞組名稱
(D)人員組成
3.網(wǎng)上問卷調(diào)查法屬于哪一種網(wǎng)上市場(chǎng)調(diào)查形式?( )
(A)網(wǎng)上間接調(diào)查
(B)網(wǎng)上直接調(diào)查
(C)間接調(diào)查法
(D)直接調(diào)查法
4.關(guān)于TCP/IP協(xié)議,說法正確的是( )。
(A)是Internet 使用的協(xié)議
(B)包括傳輸控制和互聯(lián)網(wǎng)雙層協(xié)議
(C)Telnet是TCP/IP的一部分
(D)TCP/IP規(guī)定了IP地址的組成部分
5.電子錢包中記錄的交易狀態(tài)處于以下哪些狀態(tài)時(shí),顧客的銀行卡上的用于交易的資金有可能沒有被扣除?( ).
(A)交易成功
(B)訂單接收
(C)訂單拒絕
(D)訂單未完成
6.通過( )方式可以登錄到BBS站點(diǎn)。
(A)瀏覽器運(yùn)行
(B)DOS狀態(tài)下FTP命令
(C)DOS狀態(tài)下Telnet命令
(D)Outlook
7.客戶利用上海中昊化工網(wǎng)上交易中心進(jìn)行的電子商務(wù)活動(dòng)屬于( )。
(A)B2C電子商務(wù)活動(dòng)
(B)B2G電子商務(wù)活動(dòng)
(C)B2B電子商務(wù)活動(dòng)
(D)C2C電子商務(wù)活動(dòng)
8.FTP和Telnet共同具備的功能包括( )。
(A)允許匿名登錄
(B)有兩種登錄方式
(C)在服務(wù)器和客戶機(jī)間上傳和下載文件
(D)可在窗口狀態(tài)下運(yùn)行
9.以下說法正確的是( )。
(A)網(wǎng)頁(yè)中圖像一般不與網(wǎng)頁(yè)保存在同一文件夾中
(B)文字超鏈接的表現(xiàn)形式是藍(lán)色加下劃線,不可改變
(C)可在與當(dāng)前窗口不同的新窗口打開鏈接目標(biāo)
(D)在FrontPage98中就可預(yù)覽網(wǎng)頁(yè)實(shí)際效果
10.巨型廣告的版面一般要占屏幕顯示空間的( )?
(A)1/2
(B)1/3
(C)1/4
(D)2/5
11.企業(yè)購(gòu)買通用的商店管理軟件系統(tǒng)來搭建企業(yè)的網(wǎng)上商店平臺(tái),優(yōu)點(diǎn)是( )。
(A)可以根據(jù)企業(yè)自己的特性搭建能滿足自己個(gè)性化需求的網(wǎng)上商店
(B)生成的商店具有規(guī)模效應(yīng)
(C)不需要大力推廣簡(jiǎn)單快捷
(D)比較適合于大中型企業(yè)
12.以下屬于C類IP地址的是( )。
(A)184.12.15.6
(B)140.117.11.2
(C)193.141.15.163
(D)23.34.23.1
13.關(guān)于URL描述正確的是( )。
(A)統(tǒng)一資源定位器
(B)定位信息資源所在位置
(C)定位某個(gè)主頁(yè)地址
(D)完整描述Internet上超文本地址
14.主頁(yè)中最基本的元素是( )。
(A)文本
(B)圖像
(C)表格
(D)超鏈接
15.在網(wǎng)絡(luò)商品直銷模式中,消費(fèi)者把貨款直接付給( )。
(A)網(wǎng)上商店
(B)消費(fèi)者開戶銀行
(C)消費(fèi)者信用卡公司
(D)認(rèn)證中心
16.電子商務(wù)法的調(diào)整對(duì)象是( )。
(A)電子商務(wù)的各參與方
(B)電子商務(wù)交易活動(dòng)中發(fā)生的各種社會(huì)關(guān)系
(C)認(rèn)證中心與被認(rèn)證者之間的關(guān)系
(D)虛擬銀行與參與交易者之間的關(guān)系
17.安全電子商務(wù)交易的核心機(jī)構(gòu)應(yīng)為( )。
(A)網(wǎng)上銀行
(B)CA機(jī)構(gòu)
(C)政府部門
(D)安全中心
18.電子商務(wù)商情分析報(bào)告中經(jīng)常采用的數(shù)據(jù)分析報(bào)表有哪些?( )
(A)圓餅圖
(B)柱形圖
(C)控制圖
(D)甘特圖
19.當(dāng)用戶在瀏覽器中輸入信用卡賬號(hào)和密碼進(jìn)行網(wǎng)上支付時(shí),以下說法不正確的`是( )。
(A)如果商家的網(wǎng)上商城服務(wù)器采用超文本傳輸協(xié)議,則這種協(xié)議對(duì)用戶的支付行為來講是不安全的協(xié)議
(B)信用卡的確認(rèn)工作由商家完成
(C)如果交易采用SET協(xié)議,則商家并不知道顧客所用的信用卡號(hào)碼
(D)SSL協(xié)議可在交易中對(duì)商家的身份進(jìn)行證實(shí)
20.SET協(xié)議工作在TCP/IP的那個(gè)層次?( )
(A)網(wǎng)絡(luò)層
(B)數(shù)據(jù)層
(C)應(yīng)用層
(D)會(huì)話層
21.以下關(guān)于搜索引擎說法正確的是( )。
(A)機(jī)器人搜索引擎將查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交
(B)目錄式搜索引擎是面向網(wǎng)頁(yè)的全文檢索,典型代表是Yahoo!
(C)中文檢索通配符與西文檢索通配符用戶不同
(D)天網(wǎng)是國(guó)內(nèi)開發(fā)的優(yōu)秀中文搜索引擎
22.ABC企業(yè)運(yùn)營(yíng)資源交易網(wǎng)本身并不直接參加銷售,而是提供優(yōu)秀的交易平臺(tái)和先進(jìn)的交易模式,讓買、賣雙方自由比較和選擇。使用互聯(lián)網(wǎng)平臺(tái),交易更加省時(shí)、省力、省錢;采用“買方先詢價(jià)、賣方后報(bào)價(jià)”的模式,交易目標(biāo)更明確,把傳統(tǒng)市場(chǎng)中只有大宗交易才可能使用的招、投標(biāo)機(jī)制引入電子商務(wù),通過網(wǎng)站,買、賣雙方拉拉手。根據(jù)上述短文下列說法較為正確的有( )
(A)ABC網(wǎng)站提供物流配送服務(wù)
(B)ABC網(wǎng)站提供CA認(rèn)證服務(wù)
(C)ABC網(wǎng)站沒有庫(kù)存
(D)ABC網(wǎng)站僅提供虛擬商品
23.以下哪些檢索符號(hào)和“and”意義相同( )。
(A)&
(B)-
(C)+
(D)~
24.SQL Server除了支持自身的身份驗(yàn)證,還支持( )身份驗(yàn)證模式。
(A)Windows98
(B)Windows2000
(C)Windows NT
(D)Windows XP
25.關(guān)于計(jì)算機(jī)病毒,說法正確的是( )。
(A)操作系統(tǒng)型病毒破壞力很強(qiáng),可導(dǎo)致整個(gè)系統(tǒng)癱瘓
(B)源碼病毒在源程序編譯后駐留程序
(C)外殼病毒不修改源程序,易于編寫和發(fā)現(xiàn)
(D)因不可傳染性入侵病毒比傳染性入侵病毒危險(xiǎn)性小,容易預(yù)防
26.以下( )屬于生產(chǎn)企業(yè)銷售物流研究的主要問題。
(A)供應(yīng)網(wǎng)絡(luò)
(B)送貨方式
(C)包裝形式
(D)零庫(kù)存
27.Winzip 可實(shí)現(xiàn)的功能不包括( )。
(A)壓縮
(B)解壓縮
(C)殺毒
(D)圖像處理
28.在認(rèn)證機(jī)構(gòu)介入的網(wǎng)絡(luò)商品直銷流轉(zhuǎn)程式中,認(rèn)證中心需要對(duì)參與網(wǎng)上交易的( )進(jìn)行身份認(rèn)證。
(A)消費(fèi)者
(B)商家
(C)信用卡公司
(D)銀行
29.以下選項(xiàng)中是電子合同與傳統(tǒng)的合同的區(qū)別的有( )。
(A)電子合同中雙方的談判往往面對(duì)面地協(xié)商
(B)電子合同往往有存有一個(gè)備份的復(fù)印件
(C)電子合同的支付和履行比較簡(jiǎn)單
(D)信息披露義務(wù)在電子合同中非常重要
30.公告欄廣告的發(fā)布技巧主要包括哪些?( )
(A)寫一個(gè)好標(biāo)題
(B)內(nèi)容簡(jiǎn)明扼要
(C)可靠快捷的聯(lián)系方式
(D)適當(dāng)?shù)陌l(fā)布頻率
31.時(shí)間序列分析的主要應(yīng)用有( )。
(A)系統(tǒng)描述
(B)系統(tǒng)分析
(C)預(yù)測(cè)未來
(D)決策和控制:
32.網(wǎng)絡(luò)商務(wù)信息對(duì)企業(yè)的哪些方面會(huì)起到重要的影響( )。
(A)網(wǎng)絡(luò)營(yíng)銷決策和計(jì)劃。
(B)企業(yè)的戰(zhàn)略管理
(C)市場(chǎng)研究
(D)新產(chǎn)品開發(fā)
33.電子錢包在啟動(dòng)時(shí)輸入的賬號(hào)和密碼應(yīng)是( )。
(A)銀行卡的賬號(hào)和密碼
(B)由用戶自定的賬號(hào)和密碼
(C)用戶在登錄操作系統(tǒng)時(shí)輸入的賬號(hào)和密碼
(D)用戶在網(wǎng)上銀行申請(qǐng)的個(gè)人賬號(hào)和PIN
34.關(guān)于匿名FTP服務(wù),說法正確的是( )。
(A)登錄用戶名為Anonymous
(B)登錄用戶名為Guest
(C)用戶有完全的上傳下載文件權(quán)限
(D)可利用Gopher軟件查找某FTP服務(wù)器上文件
35.網(wǎng)頁(yè)中使用最多的圖像格式是( )。
(A)BMP
(B)GIF
(C)JPEG
(D)PSX
36.電子交易中網(wǎng)絡(luò)安全不包括( )。
(A)信息的保密性
(B)數(shù)據(jù)交換的完整性
(C)發(fā)送信息的不可否認(rèn)性
(D)交易場(chǎng)所的安全性
37.網(wǎng)上商城的購(gòu)物車采用了Cookie技術(shù)來保存客戶的有關(guān)信息,那么此信息保存在( )。
(A)商廈的WEB服務(wù)器中
(B)客戶所用的計(jì)算機(jī)上
(C)CA的認(rèn)證計(jì)算機(jī)中
(D)商廈的結(jié)算計(jì)算機(jī)中
38.Oracle、Sybase數(shù)據(jù)庫(kù)都采用( )形式為其存儲(chǔ)結(jié)構(gòu)。
(A)記錄
(B)索引
(C)字段
(D)表格
39.HTML中,文件主體標(biāo)記用( )表示。
(A)HTML
(B)HEAD
(C)BODY
(D)TITLE
40.網(wǎng)上市場(chǎng)調(diào)研的主要內(nèi)容有( )。
(A)市場(chǎng)需求研究
(B)用戶及消費(fèi)者購(gòu)買行為的研究
(C)營(yíng)銷因素研究
(D)競(jìng)爭(zhēng)對(duì)手研究
41.網(wǎng)上調(diào)查要注意哪些主要問題?( )
(A)安全性
(B)信息的開放性
(C)數(shù)據(jù)的有效性
(D)無限制樣本
42.關(guān)于簽名電子郵件,以下說法正確的是( )。
(A)發(fā)信人發(fā)送加密郵件時(shí),必須擁有數(shù)字證書
(B)安全電子郵件證書一經(jīng)申請(qǐng),便不能廢除
(C)簽名電子郵件可以證明收件人的身份
(D)簽名電子郵件不能通過Outlook軟件直接接收
43.新聞組是互聯(lián)網(wǎng)上非常重要的資源,通常以何種方式向用戶開放?( )
(A)向部分用戶收費(fèi)
(B)向部分用戶免費(fèi)
(C)向所有用戶免費(fèi)
(D)向所有用戶收費(fèi)
44.ABC企業(yè)運(yùn)營(yíng)資源交易網(wǎng)本身并不直接參加銷售,而是提供優(yōu)秀的交易平臺(tái)和先進(jìn)的交易模式,讓買、賣雙方自由比較和選擇。使用互聯(lián)網(wǎng)平臺(tái),交易更加省時(shí)、省力、省錢;采用“買方先詢價(jià)、賣方后報(bào)價(jià)”的模式,交易目標(biāo)更明確,把傳統(tǒng)市場(chǎng)中只有大宗交易才可能使用的招、投標(biāo)機(jī)制引入電子商務(wù),通過網(wǎng)站,買、賣雙方拉拉手。根據(jù)上述短文下列說法較為正確的有( )
(A)“買方先詢價(jià)、賣方后報(bào)價(jià)”的交易模式一定在ABC網(wǎng)站上進(jìn)行
(B)“買方先詢價(jià)、賣方后報(bào)價(jià)”的交易模式采用傳統(tǒng)方式也能進(jìn)行
(C)“買方先詢價(jià)、賣方后報(bào)價(jià)”的交易模式采用電子商務(wù)的優(yōu)勢(shì)是降低交易成本
(D)“買方先詢價(jià)、賣方后報(bào)價(jià)”的交易模式采用傳統(tǒng)方式的缺點(diǎn)是僅適用大宗交易
45.以下說法正確的是( )
(A)設(shè)計(jì)網(wǎng)上商城單證時(shí)不容許在單證上加入廣告內(nèi)容
(B)用戶操作不熟練可能導(dǎo)致網(wǎng)上支付的操作失敗
(C)訂單合并會(huì)減少商城的收入
(D)商城的單證不具備網(wǎng)絡(luò)信息收集功能
46.數(shù)字證書中不包括( )
(A)公開密鑰
(B)數(shù)字簽名
(C)證書發(fā)行機(jī)構(gòu)的名稱
(D)證書的使用次數(shù)信息
47.關(guān)于FrontPage98說法不正確的是( )。
(A)所見即所得的網(wǎng)頁(yè)編輯工具
四、名詞解釋:什么是搜索引擎
搜索引擎(英語(yǔ):search engine)是一種信息檢索系統(tǒng),旨在協(xié)助搜索存儲(chǔ)在計(jì)算機(jī)系統(tǒng)中的信息。搜索結(jié)果一般被稱為“hits”,通常會(huì)以表單的形式列出。網(wǎng)絡(luò)搜索引擎是最常見、公開的一種搜索引擎,其功能為搜索萬維網(wǎng)上儲(chǔ)存的信息。
搜索引擎為一組項(xiàng)目提供了一個(gè)接口,使用戶能夠指定關(guān)于感興趣的項(xiàng)目的標(biāo)準(zhǔn),并讓引擎找到匹配的項(xiàng)目,這些標(biāo)準(zhǔn)稱為搜索查詢。在文本搜索引擎的情況下,搜索查詢通常表示為識(shí)別一個(gè)或多個(gè)文檔可能包含的期望概念的一組單詞。
有多種樣式的搜索查詢語(yǔ)法在嚴(yán)格性上有差異。它也可以在以前的站點(diǎn)中搜索搜索引擎中的名稱。而一些文本搜索引擎要求用戶輸入由白色空格分隔的兩個(gè)或三個(gè)字,其他搜索引擎可以使用戶能夠指定整個(gè)文檔,圖片,聲音和各種形式的自然語(yǔ)言。
一些搜索引擎對(duì)搜索查詢進(jìn)行改進(jìn),以增加通過稱為查詢擴(kuò)展的過程提供質(zhì)量集合的可能性。查詢理解方法可用于標(biāo)準(zhǔn)化查詢語(yǔ)言。
擴(kuò)展資料:
一個(gè)完整的搜索引擎需要有網(wǎng)頁(yè)爬取和收錄,建立索引,查詢?cè)~分析,搜索排序,推薦系統(tǒng)五個(gè)部分組成。
1、網(wǎng)頁(yè)爬取和收錄。
網(wǎng)絡(luò)爬蟲技術(shù)是網(wǎng)頁(yè)爬取的核心技術(shù),可以通過編寫一定的程序或者腳本來對(duì)互聯(lián)網(wǎng)的信息進(jìn)行抓取。在網(wǎng)頁(yè)抓取之后,要構(gòu)建相應(yīng)的數(shù)據(jù)庫(kù)來存儲(chǔ)我們爬取的網(wǎng)頁(yè)信息。
但是互聯(lián)網(wǎng)的信息具有冗余性,主要原因是各大網(wǎng)站也都會(huì)在后臺(tái)進(jìn)行爬蟲爬取,他們也會(huì)通過爬蟲來檢測(cè)一些熱點(diǎn)的內(nèi)容或者文章,然后爬取其信息并對(duì)格式進(jìn)行重新的組織,但其實(shí)網(wǎng)頁(yè)的內(nèi)容幾乎都是一致的。
所以在收錄爬蟲爬取的網(wǎng)頁(yè)信息之前,我們還要加入一個(gè)關(guān)鍵的環(huán)節(jié)——網(wǎng)頁(yè)去重,來確保我們數(shù)據(jù)庫(kù)中網(wǎng)頁(yè)的唯一性。
2、建立索引
在抓取了網(wǎng)頁(yè)的信息之后,需要對(duì)網(wǎng)頁(yè)的信息進(jìn)行解析,抽取到網(wǎng)頁(yè)的主題內(nèi)容和類別信息。其主要涉及的技術(shù)為文本識(shí)別和文本分類技術(shù)。
網(wǎng)頁(yè)解析后的輸出往往是一些結(jié)構(gòu)化的信息(每個(gè)網(wǎng)頁(yè)的信息完整度是不同的,需要統(tǒng)一對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化操作),一般的結(jié)構(gòu)化信息包括網(wǎng)頁(yè)的URL、網(wǎng)頁(yè)編碼、網(wǎng)頁(yè)標(biāo)題、作者、生成時(shí)間、類別信息、摘要等等。
在獲取了網(wǎng)頁(yè)結(jié)構(gòu)化信息后,就要構(gòu)建相應(yīng)的索引了。為了加快響應(yīng)用戶査詢的速度,網(wǎng)頁(yè)內(nèi)容通過"倒排索引"這種高效查詢數(shù)據(jù)結(jié)構(gòu)來保存,而網(wǎng)頁(yè)之間的鏈接關(guān)系也會(huì)予以保存。
之所以要保存鏈接關(guān)系,是因?yàn)檫@種關(guān)系 在網(wǎng)F相關(guān)性排序階段是可利用的,通過"鏈接分析"可以判斷頁(yè)面的相對(duì)重要性,對(duì)于為用 戶提供準(zhǔn)確的搜索結(jié)果幫助很大。
由于互聯(lián)網(wǎng)的網(wǎng)頁(yè)信息是海量的,所以搜索引擎的構(gòu)建離不開大數(shù)據(jù)處理平臺(tái)和云計(jì)算技術(shù),目前較為常用的大數(shù)據(jù)處理平臺(tái)為Hadoop生態(tài)架構(gòu)。
3、查詢?cè)~分析。
查詢?cè)~分析就是query分析或者query聚類。當(dāng)搜索引擎接收到用戶的査詢?cè)~后,首先需要對(duì)查詢?cè)~進(jìn)行分析,希望能夠結(jié)合查詢?cè)~和用戶信息來正確推導(dǎo)用戶的真正搜索意圖。
比如,一個(gè)用戶輸入的查詢?cè)~為“養(yǎng)水仙花”,那么除了基本的內(nèi)容匹配外,搜索引擎需要讀懂用戶,其實(shí)用戶的查詢?cè)~還可以這樣被理解“水仙花的養(yǎng)法”,“水仙花好養(yǎng)不” 等等近意的查詢?cè)~。
在此之后,首先在緩存中査找,搜索引擎的緩存系統(tǒng)存儲(chǔ)了不同的查詢意圖對(duì)應(yīng)的搜索結(jié)果,如果能夠在緩存系統(tǒng)找到滿足用戶需求的信息,則可以直接將搜索結(jié)果返回給用戶,這樣既省掉了重復(fù)計(jì)算對(duì)資源的消耗,又加快了響應(yīng)速度。
4、搜索排序
搜索引擎在分析了用戶的查詢?cè)~以后,如果緩存的信息無法滿足用戶的查詢需求,搜索引擎要根據(jù)索引來查詢數(shù)據(jù)庫(kù)的網(wǎng)頁(yè)內(nèi)容,并根據(jù)網(wǎng)頁(yè)內(nèi)容與用戶需求來進(jìn)行網(wǎng)頁(yè)排序。
網(wǎng)頁(yè)排序需要眾多的因素,其中最為主要的因素為網(wǎng)頁(yè)內(nèi)容與用戶查詢內(nèi)容的相似度(匹配度),這個(gè)不難理解,搜索引擎的基本功能就是查詢。
如果一個(gè)搜索引擎無法為用戶提供用戶需要查詢的內(nèi)容,那其也就不能稱為是一個(gè)搜索引擎,所以網(wǎng)頁(yè)內(nèi)容與用戶查詢內(nèi)容的相似度是網(wǎng)頁(yè)排序的一個(gè)首要依據(jù);
另外網(wǎng)頁(yè)的重要程度也是以關(guān)鍵元素,一個(gè)網(wǎng)頁(yè)的重要程度關(guān)乎了網(wǎng)頁(yè)內(nèi)容的質(zhì)量,在滿足用戶需求的基礎(chǔ)之上,用戶更加希望獲得高質(zhì)量的內(nèi)容,這是無可厚非的。
根據(jù)上述因素,搜索引擎對(duì)查詢到的結(jié)果進(jìn)行排序,然后展示給用戶。
5、推薦系統(tǒng)
其實(shí)從不嚴(yán)格的角度來說,整個(gè)網(wǎng)頁(yè)排序的過程就屬于一種推薦策略。從嚴(yán)格意義上來說,推薦系統(tǒng)并不屬于一個(gè)搜索引擎架構(gòu)的必要環(huán)節(jié),而且推薦系統(tǒng)在上述示意圖中并沒有顯示。
但是一個(gè)優(yōu)秀的搜索引擎不止要能分析出用戶查詢的基本需求,進(jìn)一步來講,要能了解到或者猜測(cè)用戶的可能的下一步需求。
目前隨著大數(shù)據(jù)的熱潮,各大互聯(lián)網(wǎng)公司和眾多專家認(rèn)為推薦系統(tǒng)是解決互聯(lián)網(wǎng)大數(shù)據(jù)的一種有效途徑。而且,最近越來越多個(gè)性化推薦知識(shí)受到了熱捧。其實(shí)推薦系統(tǒng)在搜索引擎中往往是以中間頁(yè)的形式展示的,它的主要作用就是為推薦系統(tǒng)進(jìn)行導(dǎo)流。
參考資料來源:百度百科——搜索引擎
以上就是關(guān)于關(guān)于搜索引擎的描述,正確的是相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
關(guān)于陰謀詭計(jì)的書(關(guān)于陰謀詭計(jì)的書籍)
關(guān)于女性成長(zhǎng)的30個(gè)關(guān)鍵詞(關(guān)于女性成長(zhǎng)的30個(gè)關(guān)鍵詞是什么)
關(guān)于旅行的昵稱大全(關(guān)于旅行的昵稱大全英文)
yy喊麥排行榜前十名(yy喊麥排行榜前十名是誰(shuí))
設(shè)計(jì)師都有哪些證書(設(shè)計(jì)師都有哪些證書)