HOME 首頁
SERVICE 服務(wù)產(chǎn)品
XINMEITI 新媒體代運(yùn)營
CASE 服務(wù)案例
NEWS 熱點(diǎn)資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    火車頭采集標(biāo)題(火車頭采集標(biāo)題時(shí),請求默認(rèn)頁面出錯)

    發(fā)布時(shí)間:2023-05-29 05:33:07     稿源: 創(chuàng)意嶺    閱讀: 111        

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于火車頭采集標(biāo)題的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對話答疑等等NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    問友Ai官網(wǎng):https://ai.de1919.comNIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    本文目錄:NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    火車頭采集標(biāo)題(火車頭采集標(biāo)題時(shí),請求默認(rèn)頁面出錯)NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    我用火車頭采集的時(shí)候?yàn)槭裁粗挥袠?biāo)題和內(nèi)容兩個標(biāo)簽?zāi)懿杉?,其他就是固定?1了 圖片NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    那么有多頁列表的采集就要用“[var:分頁]”來替換分頁頁碼,截圖如下文章網(wǎng)址需包含 網(wǎng)址不能包含 這兩個一般不用寫第四步、采集文章標(biāo)題,文章內(nèi)容,文章作者,文章來源等規(guī)則寫法,分頁采集等?!捌鹗糷tml”和“結(jié)束html”

    用火車頭采集器采集時(shí)如何去掉標(biāo)題中的標(biāo)點(diǎn)符號NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    把標(biāo)點(diǎn)符號替換成空就成了,記的給我分哈

    火車頭采集器怎么采集今日頭條文章?NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    第一步采集網(wǎng)址,下載好火車頭采集器后打開,新建一個任務(wù),任務(wù)名隨意。把需要采集的網(wǎng)站文章列表頁網(wǎng)址添加到起始網(wǎng)址。從圖中看出該列表頁有34頁,每頁有N篇文章。
    2
    列表頁會一級網(wǎng)址,添加多級網(wǎng)址獲取,從而獲取二級網(wǎng)址(文章頁網(wǎng)址)
    設(shè)置列表分頁獲取,3個地方分別是:分頁源代碼前面和后面還有中間位置。這一步用于獲取列表頁面鏈接,因?yàn)橛?4個列表頁面。設(shè)置完保存。
    網(wǎng)址獲取選項(xiàng),這一步用于獲取列表頁上面文章頁的鏈接,根據(jù)自己需要設(shè)置需要截取的部分和根據(jù)網(wǎng)址的結(jié)構(gòu)設(shè)置包含與不包含某些字符。為空即沒限制,設(shè)置完保存。
    設(shè)置好鏈接采集規(guī)則后,可以測試網(wǎng)址,看測試結(jié)果調(diào)整規(guī)則??磮D可以看到采集鏈接規(guī)則從起始鏈接到全面列表頁再到列表頁上的文章頁鏈接都已經(jīng)成功采集。
    第二步是采集內(nèi)容,首先修改標(biāo)題規(guī)則,在頁面源代碼里面找到標(biāo)題的代碼,把標(biāo)題前后代碼負(fù)責(zé)過去截取出標(biāo)題。保存。
    修改內(nèi)容采集規(guī)則,跟標(biāo)題規(guī)則差不多,也是源代碼里面找到內(nèi)容的前后代碼。這里內(nèi)容會有一些其他html標(biāo)簽,所以得添加一個html標(biāo)簽排除的規(guī)則。
    完成后,測試看一下結(jié)果,從測試結(jié)果來調(diào)試規(guī)則,直到測試結(jié)果是自己想要的內(nèi)容為止。
    第三步是采集導(dǎo)出。前面1、2兩步把規(guī)則設(shè)置好,最后就要把文章導(dǎo)出了。先做一個導(dǎo)出的模版。
    然后選擇方式二,把每一篇文章都分別記錄到一個txt文本,保存位置自己選擇,模板選擇剛剛做好的導(dǎo)出模版.保存的文件名用文章標(biāo)題為命名。其他默認(rèn),保存。
    把采集網(wǎng)址,采集內(nèi)容,發(fā)布3個選項(xiàng)框都勾選,然后開始采集。完成后文本就自動生成在剛剛保存的文件夾里面了。
    火車頭采集器采集文章教程到此就完成了,由于每個網(wǎng)站都是不一樣的,所以這里只能用一個網(wǎng)站演示,只是一個方法思路,自己采集文章還需要靈活變通。追問

    這樣復(fù)雜粘貼有意思嗎?NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    火車頭采集標(biāo)題(火車頭采集標(biāo)題時(shí),請求默認(rèn)頁面出錯)NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    火車頭采集器采集正常,發(fā)布失敗提示無標(biāo)題(實(shí)際上標(biāo)題采集正常)NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司

    1
    大家都知道php有個函數(shù)htmlspecialchars()是將預(yù)定義字符串做轉(zhuǎn)換的,而htmlspecialchars()這個函數(shù)在php5.4默認(rèn)為utf8編碼的
    2
    一般建站新手站長搭建織夢環(huán)境都是用的dedeampz織夢集成環(huán)境一鍵搭建的織夢環(huán)境,原因就在這里了,dedeampz搭建完成的CMS網(wǎng)站默認(rèn)的編碼格式是gbk的
    3
    如果你安裝的是織夢5.3或者5.6可能沒事,因?yàn)閐ede5.6之前的版本其中php的版本默認(rèn)配置的是5.3版本的php,但是織夢5.7開始集成其中的php是5.4版本的,而這時(shí)的php5.4默認(rèn)編碼格式跟環(huán)境的編碼格式?jīng)_突(格式不一致)
    4
    格式不一致的時(shí)候如果你輸入的標(biāo)題是純英文+數(shù)字,這沒問題,能正常使用,因?yàn)榫幋a格式utf-8跟gbk的區(qū)別在于中文字符
    5
    如果你輸入的是中文字符,那么htmlspecialchars()函數(shù)在轉(zhuǎn)換的時(shí)候因?yàn)榫幋a格式不同導(dǎo)致的亂碼是他不識別,所以就直接輸出空,因?yàn)樗裁匆矝]有轉(zhuǎn)過來,這也就是為什么你輸入漢語標(biāo)題提交,卻提示“標(biāo)題不能為空”的原因!
    6
    問題分析清楚了,解決方法也很明顯了,下面提供兩種解決方法
    第一種:將php的版本切換回5.3版本或者比5.3更早的版本的,這個問題自然就解決了
    7
    第二種:給htmlspecialchars(函數(shù))添加ENT_COMPAT ,'GB2312'
    就是給php的這個函數(shù)強(qiáng)制設(shè)定編碼格式,這樣也能解決這個問題,具體對應(yīng)的位置是
    ①:dede/article_add.php 這個php文件中查找
    $title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen));
    改成
    $title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen),ENT_COMPAT ,'GB2312');
    ②:然后再找到dede/article_edit.php這個php文件中查找
    $title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen));
    改成
    $title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen),ENT_COMPAT ,'GB2312');
    ③:include/ckeditor/ckeditor_php5.php 查找
    htmlspecialchars($value)
    改為htmlspecialchars($value, ENT_COMPAT ,'GB2312')
    這樣也能解決以上問題
    本文采用http://jingyan.baidu.com/article/11c17a2c60027df446e39d0c.html站點(diǎn)信息
    解決的請點(diǎn)贊

    以上就是關(guān)于火車頭采集標(biāo)題相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。NIs創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司


    推薦閱讀:

    天津火車站餐飲品牌設(shè)計(jì)(天津火車站美食)

    杭州火車東站去西湖怎么走(杭州火車東站去西湖怎么走地鐵)

    杭州東站離杭州站多遠(yuǎn)(杭州哪個火車站離西湖近)

    蘭州vi手冊設(shè)計(jì)公司(蘭州品牌設(shè)計(jì)公司)

    深圳vi深圳vi設(shè)計(jì)設(shè)計(jì)(深圳vi設(shè)計(jì)有限公司)