-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
爬蟲人民日報關(guān)鍵詞(人民日報 關(guān)鍵詞)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于爬蟲人民日報關(guān)鍵詞的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、關(guān)于java新聞網(wǎng)站的算法
(一) 算法倫理的研究
1.算法內(nèi)涵界定。算法源于數(shù)學(xué),但現(xiàn)代算法又遠遠不止于傳統(tǒng)數(shù)學(xué)的計算范疇。算法多被理解為是計算機用于解決問題的程序或步驟,是現(xiàn)代人工智能系統(tǒng)的運行支柱?!队嬎阒髁x:一種新的世界觀》(李建會等,2012)中將算法定義為能行的方法,在外界的常識性理解中所謂算法就是能感受到的一套運算規(guī)則,這個規(guī)則的特點在于運算時間的有限性、計算步驟的有窮性、輸入結(jié)果的確切性,它是機械步驟或能行可算計程序。該定義點明了算法應(yīng)具備的兩個基本屬性——有限性與有窮性?!队糜嬎愕挠^點看世界》( 酈全民,2016) 則從信息傳播的角度解讀算法,認(rèn)為算法實質(zhì)上是信息處理方法。
2.算法倫理研究
倫理關(guān)乎道德價值真理及其判斷。存在于自然界、社會中的人,其行為應(yīng)遵循一定的倫理道德規(guī)范。倫理的效應(yīng)要導(dǎo)向善。倫理道德關(guān)注對個體存在的尊重、個體的自由、公平正義以及組織團體的延續(xù)與發(fā)展等問題。在一定程度上可以說,當(dāng)今的人類社會已經(jīng)不能脫離智能算法系統(tǒng)而運行了。
算法無時無處不在對世界產(chǎn)生影響,因而算法也會必然的觸碰到倫理道德。和鴻鵬(2017)已指出,算法系統(tǒng)在人類社會生活中的廣泛應(yīng)用,會陷入諸多如人類面臨且無法回避的倫理兩難選擇困境之中。而當(dāng)算法與倫理發(fā)生關(guān)聯(lián)時,學(xué)界一般認(rèn)為會引出職業(yè)倫理和技術(shù)倫理兩種倫理問題。
職業(yè)倫理主要與算法系統(tǒng)的開發(fā)者有關(guān),指開發(fā)者是帶有個性價值觀、倫理道德觀去研發(fā)算法系統(tǒng)的行為體,因而算法系統(tǒng)一開始便會摻雜著設(shè)計人主觀性的倫理道德觀。設(shè)計者出于何種目的開發(fā)某算法系統(tǒng)、面對不同問題設(shè)計者持有的倫理道德態(tài)度,這些都會在算法系統(tǒng)的運行中得到體現(xiàn)。
技術(shù)倫理是算法系統(tǒng)在一定意義上可稱之為一種科學(xué)技術(shù),這種技術(shù)自身及其運作結(jié)果都會負(fù)載著倫理價值。其實在一些情況下,職業(yè)倫理與技術(shù)倫理之間并沒有很明確的界別,關(guān)于這一點,劉則淵跟王國豫已做過論述。
本文將主要從技術(shù)倫理的角度對算法關(guān)涉?zhèn)惱磉@一問題嘗試做深入研究。
(二)網(wǎng)絡(luò)新聞傳播的算法倫理研究
算法與技術(shù)的融合不斷英語于網(wǎng)絡(luò)新聞傳播領(lǐng)域中,從數(shù)據(jù)新聞到機器寫作,從算法推送到輿情到分析,國內(nèi)新聞傳媒領(lǐng)域的機器新聞和相關(guān)研究逐漸發(fā)展,金兼斌在《機器新聞寫作:一場正在發(fā)生的革命》(2014),作者較早的將眼光聚焦于基于算法的新聞內(nèi)容生產(chǎn)和編輯。認(rèn)為在自動化新聞生產(chǎn)大發(fā)展的前提下,諸如新聞生產(chǎn)或分發(fā)中勞動密集型的基礎(chǔ)性工作與環(huán)節(jié)都將被技術(shù)取代。張超、鐘新在《從比特到人工智能:數(shù)字新聞生產(chǎn)的算法轉(zhuǎn)向》(2017) 認(rèn)為算法正在從比特形式走向人工智能階段,這種轉(zhuǎn)向使得數(shù)字新聞與傳統(tǒng)新聞的邊界進一步明晰,促使數(shù)字新聞生產(chǎn)也產(chǎn)生了變革。胡萬鵬在《智能算法推薦的倫理風(fēng)險及防范策略》中總結(jié)了從算法推送方面:針對新聞的價值觀所受到的負(fù)面影響;以及新聞的公共性、客觀性和真實性受到的削弱進行分析;從受眾方面:將具體對信息繭房現(xiàn)象以及受眾的知情權(quán)和被遺忘權(quán)展開探討;從社會影響方面,則針對社會群體、社會公共領(lǐng)域和社會文化所受到的消極影響展開論述。
根據(jù)以上文獻的梳理可以看出,國內(nèi)目前對網(wǎng)絡(luò)新聞傳播的算法倫理研究主要集中在新聞業(yè)態(tài)算法倫理失范的相關(guān)問題,因為與其他失范問題相比,這是比較容易發(fā)現(xiàn)的。但目前關(guān)于網(wǎng)絡(luò)新聞傳播的算法倫理的國內(nèi)研究還存在不足:國內(nèi)算法倫理和網(wǎng)絡(luò)新聞傳播算法倫理的研究還是在起步階段,比較成熟的系統(tǒng)性研究還未出現(xiàn);關(guān)于算法開發(fā)人員和平臺的責(zé)任機制的研究都比較薄弱,總上所述,算法推送新聞的倫理問題研究是有必要繼續(xù)加強的。
2.新聞推薦算法的興起、發(fā)展與原理
2.1 新聞推薦算法的興起
隨著計算機技術(shù)的信息處理的維度越來越高,信息處理的能力不斷提升,算法技術(shù)可以從大數(shù)據(jù)中篩選出用戶最關(guān)心最感興趣的信息,改變了原有的新聞信息傳播方式,重塑了新的媒介生態(tài)和傳播格局。
但反過來看,在人人都能生產(chǎn)信息的背景下,信息的生產(chǎn)、傳播和反饋的速度都是呈幾何倍數(shù)增長,用戶面對的信息越來越多。由于設(shè)備的局限性和信息海量,用戶無法集中注意力看自己感興趣的內(nèi)容,也無法及時抓取對自己有用的信息,于是出現(xiàn)了“注意力經(jīng)濟”。美國經(jīng)濟學(xué)家邁克爾·戈德海伯(1997)認(rèn)為,當(dāng)今社會是一個信息極大豐富甚至泛濫的社會,而互聯(lián)網(wǎng)的出現(xiàn),加快了這一進程,信息非但不是稀缺資源,相反是過剩的。相對于過剩的信息,只有一種資源是稀缺的,那就是人們的注意力。換句話說,信息不能夠一味追求量,還要有價值,價值就在于用戶對信息的注意力,誰獲得了用戶的注意力就可以有市場的發(fā)展空間,通過“販賣”用戶的注意力能夠使新媒體聚合平臺獲得利潤,維持發(fā)展。再加上現(xiàn)在生活節(jié)奏越來越快,人們對信息獲取的量和效率要求提高,不想把時間浪費在自己不感興趣的信息,從而用戶獲取信息的“個性化”特征變得明顯起來。
基于此背景下,算法推送新聞的傳播機制應(yīng)運而生,用戶不需要特意搜索自己需要的信息,而是海量的信息會自行“找到”用戶,為用戶節(jié)省搜索時間之余,又能做到真正為用戶提供有用的信息。
2.2新聞推薦算法的發(fā)展現(xiàn)狀
算法推薦是依據(jù)用戶數(shù)據(jù)為用戶推薦特定領(lǐng)域的信息,根據(jù)受眾使用反饋不斷修正并完善推薦方案。目前主要有兩類新聞機構(gòu)使用算法推送,其一是新型的互聯(lián)網(wǎng)新聞聚合類平臺,國內(nèi)主要是以今日頭條和一點資訊等算法類平臺為代表,在我國新聞客戶端市場上擁有極高的占有率。張一鳴創(chuàng)建今日頭條是依靠大數(shù)據(jù)和算法為用戶推薦信息,提供連接人與信息的服務(wù),算法會以關(guān)鍵詞等元素判斷用戶的興趣愛好,從全網(wǎng)抓取內(nèi)容實現(xiàn)個性化推薦。國外則是以Facebook、Instagram等平臺為代表,這些APP都是通過算法挖掘用戶的數(shù)據(jù),以用戶個性化需求為導(dǎo)向?qū)τ脩暨M行新聞推送。另一種則是專業(yè)新聞生產(chǎn)的傳統(tǒng)媒體,為積極應(yīng)對新聞市場的競爭和提高技術(shù)水平而轉(zhuǎn)型到新聞全媒體平臺,如國內(nèi)的“人民日報”等,國外利用算法推送向用戶推送新聞的傳統(tǒng)媒體則有美國的美聯(lián)社、華盛頓郵報和英國的BBC等,他們利用算法監(jiān)督受眾的數(shù)量還有閱讀行為,使他們的新聞報道能夠更加受受眾的喜歡,增加用戶的粘性。
2.2 新聞推薦算法的原理
2.2.1 新聞推薦算法的基本要素
算法推送有三個基本要素,分別是用戶、內(nèi)容和算法。用戶是算法推送系統(tǒng)的服務(wù)對象,對用戶的理解和認(rèn)知越是透徹,內(nèi)容分法的準(zhǔn)確性和有效性就越準(zhǔn)確。內(nèi)容是算法推送系統(tǒng)的基本生產(chǎn)資料,對多種形式內(nèi)通的分析、組織、儲存和分發(fā)都需要科學(xué)的手段與方法。算法是算法推送技術(shù)上的支持,也是最核心的。系統(tǒng)中大量用戶與海量的信息是無法自行匹配的,需要推送算法把用戶和內(nèi)容連接起來,在用戶和內(nèi)容之間發(fā)揮橋梁作用,高效把合適的內(nèi)容推薦給合適的用戶。
2.2.2 新聞推薦算法的基本原理
算法推送的出現(xiàn)需要具備兩個條件:足夠的信息源和精確的算法框架。其中,算法的內(nèi)容生產(chǎn)源與信息分發(fā)最終效果密切相關(guān):是否有足夠多的信息可供抓取與信息是否有足夠的品質(zhì)令用戶滿意都將對信息的傳播效果產(chǎn)生影響。與此同時,分發(fā)環(huán)節(jié)也在向前追溯,改變著整個傳播的生態(tài)。目前,國內(nèi)新聞傳播領(lǐng)域所使用的算法推送主要有三大類——協(xié)同過濾推送、基于內(nèi)容推送和關(guān)聯(lián)規(guī)則推送。
協(xié)同過濾推送分為基于用戶的協(xié)同過濾和基于模型的協(xié)同過濾。前者主要考慮的是用戶和用戶之間的相似度,只要找出相似用戶喜歡的新聞文章類別,并預(yù)測目標(biāo)用戶對該文章的喜歡程度,就可以將其他文章推薦給用戶;后者和前者是類似的,區(qū)別在此時轉(zhuǎn)向找到文章和文章之間的相似度,只有找到了目標(biāo)用戶對某類文章的喜愛程度,那么我們就可以對相似度高的類似文章進行預(yù)測,將喜愛程度相當(dāng)?shù)南嗨莆恼峦扑]給用戶。因此,前者利用用戶歷史數(shù)據(jù)在整個用戶數(shù)據(jù)庫中尋找相似的推送文章進行推薦,后者通過用戶歷史數(shù)據(jù)構(gòu)造預(yù)測模型,再通過模型進行預(yù)測并推送。
基于內(nèi)容的推送即根據(jù)用戶歷史進行文本信息特征抽取、過濾,生成模型,向用戶推薦與歷史項目內(nèi)容相似的信息。它的優(yōu)點之一就是解決了協(xié)同過濾中數(shù)據(jù)稀少時無法準(zhǔn)確判斷分發(fā)的問題。但如果長期只根據(jù)用戶歷史數(shù)據(jù)推薦信息,會造成過度個性化,容易形成“信息繭房”。
關(guān)聯(lián)規(guī)則推送就是基于用戶歷史數(shù)據(jù)挖掘用戶數(shù)據(jù)背后的關(guān)聯(lián),以分析用戶的潛在需求,向用戶推薦其可能感興趣的信息?;谠撍惴ǖ男畔⑼扑]流程主要分為兩個步驟,第一步是根據(jù)當(dāng)前用戶閱讀過的感興趣的內(nèi)容,通過規(guī)則推導(dǎo)出用戶還沒有閱讀過的可能感興趣的內(nèi)容;第二是根據(jù)規(guī)則的重要程度,對內(nèi)容排序并展現(xiàn)給用戶。關(guān)聯(lián)規(guī)則推送的效果依賴規(guī)則的數(shù)量和質(zhì)量,但隨著規(guī)則數(shù)量的增多,對系統(tǒng)的要求也會提高。
2.2.3 算法推送的實現(xiàn)流程
在信息過載的時代,同一個新聞選題有很多同質(zhì)化的報道,因此分發(fā)前需要對新聞內(nèi)容進行消重,消重后的新聞內(nèi)容便等待推送,此時的推送有三個類別:啟動推送、擴大推送和限制推送。
第一類是啟動推送,先對用戶精準(zhǔn)推送,即將其訂閱賬號的更新內(nèi)容第一時間向用戶推薦;然后根據(jù)用戶的歷史瀏覽數(shù)據(jù),把相似的文本特征歸類后推送給其他用戶;最后是給關(guān)注用戶的相似人群進行推薦。第二類擴大推送是指對于某個點擊率、閱讀時長都明顯高于平均水平的新聞內(nèi)容,系統(tǒng)會將它自動篩選出來,并向更多的人進行推薦。但在擴大推薦的過程中,系統(tǒng)會依據(jù)用戶的反饋進行調(diào)整。第三為限制推送,指某個點擊率、閱讀時長都明顯低于平均水平的新聞內(nèi)容,會被系統(tǒng)自動篩選出來,遏制推送,這樣的內(nèi)容會被縮小推薦范圍。
3. “今日頭條”新聞推薦算法分析
“今日頭條”是國內(nèi)一款資訊類的媒體聚合平臺,每天有超過1.2億人使用。從“你關(guān)心的,才是頭條!”到如今的“信息創(chuàng)造價值!”,產(chǎn)品slogan的變化也意味著今日頭條正逐漸擺脫以往單一、粗暴的流量思維,而開始注重人與信息的連接,在促進信息高效、精準(zhǔn)傳播的同時注重正確的價值引導(dǎo)。
在2018年初,“今日頭條”的資深算法架構(gòu)師曹歡歡博士在一場分享交流會上公開了其算法運行原理。在他的敘述中,非常詳細(xì)地介紹了“今日頭條”的算法推薦系統(tǒng)概述以及算法推薦系統(tǒng)的操作原理。
3.1.1-1 曹歡歡博士的今日頭條算法建模
上圖用數(shù)學(xué)形式化的方法去描述“今日頭條”的算法推送,實際上就是一個能夠得出用戶對內(nèi)容滿意程度的函數(shù):即y為用戶對內(nèi)容的滿意度,Xi,Xc,Xu分別是今日頭條公開的算法推送的三個維度:Xi是用戶,包括用戶的性別、年齡、職業(yè)和興趣標(biāo)簽,還有其他算法模型刻畫的隱形用戶偏好等;Xc是環(huán)境,這也是移動互聯(lián)網(wǎng)時代新聞推送的特點,由于用戶隨時隨地在不停移動,移動終端也在移動,用戶在不同的工作場合、旅行等場景信息推送偏好也會不同;Xu是內(nèi)容,今日頭條本身就是信息聚合類平臺,平臺上涵蓋各種不同形式的內(nèi)容。本章將以該函數(shù)為基礎(chǔ),逐一分析今日頭條的推薦算法。
3.1 推薦維度之一:內(nèi)容分析
內(nèi)容分析原指第二次世界大戰(zhàn)期間,傳播學(xué)家拉斯韋爾等研究學(xué)家組織了“戰(zhàn)士通訊研究”的工作,以德國公開出版的戰(zhàn)時報紙為分析研究對象,弄清報紙內(nèi)容本質(zhì)性的事實和趨勢,揭示隱含的隱性情報內(nèi)容,獲取了許多軍情機密情報并且對事態(tài)發(fā)展作出情報預(yù)測。在“今日頭條”中,內(nèi)容分析則是對文章、視頻內(nèi)容提取關(guān)鍵要素,通過對文本、視頻標(biāo)題關(guān)鍵字進行語義識別,給內(nèi)容進行分類。“今日頭條”的推送系統(tǒng)是典型的層次化文本分類算法,來幫助每篇新聞?wù)业胶线m的分類,比如:第一大分類是政治、科技、財經(jīng)、娛樂、體育等,體育類可以下分籃球、足球、網(wǎng)球等,足球又可以下分中國足球和國際足球,中國足球最后下分為甲、中超、國家隊等。這一步是對文章進行對這個工作主要目的是對文章進行分類,方便以后對客戶推薦。
想要內(nèi)容分析實現(xiàn)效果,則需要海量的內(nèi)容信息給算法系統(tǒng)提供有效的篩選和分類?!敖袢疹^條”既然是依賴于算法推送新聞,那它背后的數(shù)據(jù)庫必然是強大的,“網(wǎng)頁蜘蛛”和“頭條號”就是支撐今日頭條平臺消息來源的重要渠道,其消息來源極其豐富,何時何地有何新鮮事,都能高效率抓取信息。
第一個消息來源的渠道是“網(wǎng)頁蜘蛛”,“網(wǎng)頁蜘蛛”又叫網(wǎng)頁爬蟲,頭條使用的就是搜索引擎爬蟲叫“Bytespider”。它能按照一定的規(guī)則,自動爬行抓取互聯(lián)網(wǎng)的信息或腳本,就像蜘蛛通過蛛網(wǎng)進行捕食,當(dāng)發(fā)現(xiàn)新的信息資源,蜘蛛會立刻出動抓取信息內(nèi)容并將其收入自己的數(shù)據(jù)庫中。和微信的垂直搜索不同,Bytespider是能夠抓取全網(wǎng)內(nèi)容的全新搜索引擎,因此“今日頭條”的搜索引擎功能很全面,搜索的資源很廣,資源包容性極高。
Bytespider信息抓取的基本流程如下:首先是網(wǎng)頁抓取。Bytespider順著網(wǎng)頁中的超鏈接,從這個網(wǎng)站爬到另一個網(wǎng)站,通過超鏈接分析連續(xù)訪問抓取更多網(wǎng)頁。被抓取的網(wǎng)頁被稱之為網(wǎng)頁快照。由于互聯(lián)網(wǎng)中超鏈接的應(yīng)用很普遍,理論上,從一定范圍的網(wǎng)頁出發(fā),就能搜集到絕大多數(shù)的網(wǎng)頁。第二步是處理網(wǎng)頁。搜索引擎抓到網(wǎng)頁后,還要做大量的預(yù)處理工作,才能提供檢索服務(wù)。其中,最重要的就是提取關(guān)鍵詞,建立索引庫和索引。其他還包括消除重復(fù)網(wǎng)頁、判斷網(wǎng)頁類型、分析超鏈接、計算網(wǎng)頁的重要度、豐富度等。第三步提供檢索服務(wù)。用戶輸入關(guān)鍵詞進行檢索,搜索引擎從索引數(shù)據(jù)庫中找到匹配該關(guān)鍵詞的網(wǎng)頁,為了用戶便于判斷,除了網(wǎng)頁標(biāo)題和URL外,還會提供一段來自網(wǎng)頁的摘要以及其他信息。
第二個消息來源渠道是“頭條號”。與“今日頭條”不同,它是今日頭條針對媒體、國家機構(gòu)、企業(yè)以及自媒體推出的專業(yè)信息發(fā)布平臺。致力于幫助生產(chǎn)者在移動互聯(lián)網(wǎng)上高效率地獲得更多的曝光和關(guān)注。簡單來說頭條號是媒體在上面撰寫并發(fā)布文章、視頻后,會在今日頭條(包括今日頭條極速版)平臺展示。通過頭條號后臺,媒體可以看到具體文章推薦量、閱讀量、粉絲閱讀量、評論量、轉(zhuǎn)發(fā)量和收藏量,最后通過這些可以量化的用戶閱讀行為的反饋,算法系統(tǒng)進一步對目標(biāo)用戶進行內(nèi)容推薦。
3.2 推薦維度之二:用戶分析
用戶分析通過提取用戶的有效數(shù)據(jù),如用戶經(jīng)常瀏覽的文字類型、經(jīng)常搜索的關(guān)鍵字、注冊時登記信息的內(nèi)容等,算法系統(tǒng)可以將每個用戶的瀏覽記錄、瀏覽時間、留言、評論和轉(zhuǎn)發(fā)等行為進行關(guān)鍵字提取,最終形成用戶畫像,以便之后對用戶進行文章和視頻的精準(zhǔn)推送。舉個例子,給喜歡閱讀“體育”的用戶標(biāo)上“體育”標(biāo)簽;給喜歡“娛樂”的用戶標(biāo)上“娛樂”的標(biāo)簽,這一步的作用是給用戶的興趣進行建模,包括用戶對文章和視頻的全局熱度、分類熱度,主題熱度,以及關(guān)鍵詞熱度等。熱度信息在大的推薦系統(tǒng)能夠解決新聞冷啟動問題,幫助新聞實現(xiàn)推送。
用戶分析還具有協(xié)同特征,它可以在部分程度上幫助解決所謂算法越推越窄的問題。協(xié)同特征也就是“聯(lián)想式”的推送方法,并非只考慮用戶已有歷史,而是通過用戶行為分析不同用戶間相似性,比如點擊相似、興趣分類相似、主題相似、興趣詞相似,甚至向量相似,從而擴展模型的探索能力。根據(jù)用戶之間計算數(shù)據(jù)的相似程度,把用戶細(xì)化分類成為不同的目標(biāo)群體,再向目標(biāo)群體集中的推送其感興趣的新聞內(nèi)容
內(nèi)容分析和用戶分析是相輔相成的,如果沒有分析的文本標(biāo)簽,無法得到用戶興趣標(biāo)簽,沒有用戶的興趣標(biāo)簽就無法給用戶定位實現(xiàn)精準(zhǔn)推送。
3.3 推薦維度之三:環(huán)境分析
環(huán)境分析就是根據(jù)文章的時效性和接近性推送給相應(yīng)的用戶,比如獲取用戶當(dāng)前所在位置是否在旅游區(qū),這個可以通過獲取用戶的實時位置來實現(xiàn)。還會不斷與用戶之前經(jīng)常出現(xiàn)的所在地進行對比等方式確認(rèn)當(dāng)前狀態(tài),分析出用戶是在常住地區(qū)還是在旅行。這時若系統(tǒng)檢測到用戶正在泰山及周邊游玩,則可能會相應(yīng)推送泰山的相關(guān)文章、周邊的交通新聞和天氣信息等等。
通過上面三個推薦維度可以作為數(shù)據(jù)基礎(chǔ),分析當(dāng)前用戶處于什么環(huán)境,結(jié)合用戶畫像以及文章的內(nèi)容分類來推薦,盡量做到推送的內(nèi)容都是用戶所感興趣的。算法系統(tǒng)還會通過內(nèi)容分類、分析抽取,把文本相似度高的文章,包括新聞主題、內(nèi)容相似的文章進行消重,解決推送重復(fù)的問題,進一步對目標(biāo)用戶進行精確且不重復(fù)的內(nèi)容推薦。最后過濾質(zhì)量低俗色情的內(nèi)容,以免造成平臺會有負(fù)面傾向。
3.4 “今日頭條”新聞推薦算法的價值取向
3.4.1 “用戶為上”
“今日頭條”的算法推送是站在用戶的立場上的,以滿足用戶個性化和推送的精準(zhǔn)性,“今日頭條”也重新衡量了新聞價值標(biāo)準(zhǔn):以用戶為上,用戶對新聞內(nèi)容和閱讀方式的滿意度便是平臺推送新聞的價值宗旨。傳統(tǒng)媒體時代,只有報紙和電視,有什么受眾就得看什么,而如今“今日頭條”根據(jù)用戶興趣去進行推送。算法推送平臺用戶范圍廣,很多用戶熱衷關(guān)注負(fù)面,也有許多用戶都有窺視欲和好奇心,喜歡無聊八卦和無聊新聞,而且在好奇心作用下用戶都有從眾心理。這使得生產(chǎn)者過度去迎合受眾,只要是用戶喜歡看就可以發(fā)表在“今日頭條”上。
3.4.2 “算法主導(dǎo)”
“今日頭條”更注重技術(shù)分發(fā),生產(chǎn)者是用戶,受眾者也是用戶,這樣一來內(nèi)容監(jiān)管和分發(fā)就很困難。算法推送機制根據(jù)用戶愛好進行推送,這樣生產(chǎn)的內(nèi)容快、也無疑會加速內(nèi)容配送效率。在算法推送模型中,用戶點擊頻率、閱讀時間、點贊評論以及轉(zhuǎn)發(fā)在算法時代都是可以進行量化的目標(biāo)。在這樣情況下生產(chǎn)的內(nèi)容,想要獲得較大點擊率和推送率,需要標(biāo)題才能吸引用戶,因為用戶在平臺一眼能看到的就是標(biāo)題和配圖。標(biāo)題和配圖決定用戶是否會打開你的內(nèi)容,這導(dǎo)致許多內(nèi)容生產(chǎn)者在編輯新聞標(biāo)題時陷入標(biāo)題黨的怪圈,還有導(dǎo)致低俗內(nèi)容的呈現(xiàn),以制造沖突制造懸念貼標(biāo)簽等方式引用戶點擊,意圖把自己的文章做成爆文。對于海量的信息內(nèi)容,即使今日頭條數(shù)據(jù)和智能推薦做的再好,目前來說也難以抵擋海量的垃圾信息。
4.算法推送新聞引發(fā)的倫理問題
在如今網(wǎng)絡(luò)時代的傳播思維中,“用戶為上”、“算法主導(dǎo)”的新聞價值取向已經(jīng)在算法聚合類平臺成為了普遍,算法推送技術(shù)作為吸引用戶的手段,搭建起一個充滿誘導(dǎo)的媒介環(huán)境,以此增加用戶對平臺的粘性。算法推送技術(shù)在獲取信息、傳播速度等方面與以往相比有著跨時代的進步,但與此同時,由于算法推送技術(shù)的加入,衍生出新的倫理問題,并且日漸復(fù)雜化。
4.1 算法推送引發(fā)的倫理問題
4.1.1 算法推送過于機械化,沒有思考能力
單向的算法推薦對用戶來說經(jīng)常會帶來內(nèi)容雜亂無章、信息量過大、信息價值低等問題。從邏輯講,算法只是從關(guān)鍵字的檢索匹配來完成統(tǒng)計推薦,但對新聞報道或文學(xué)作品具有藝術(shù)性、專業(yè)性的內(nèi)容來說,是不能保證推送的質(zhì)量的。算法方面,目前主要基于匹配檢索與統(tǒng)計,大部分都是個人關(guān)注的信息類型和標(biāo)簽,難以達到較好的推送效果。一千個人眼里有一千個哈姆雷特,但是計算機只有只有一個。算法技術(shù)過于注重機械化的統(tǒng)計,只根據(jù)關(guān)鍵詞來推薦用戶,對我們中國具有博大精深的中國文字文化底蘊,推薦算法是遠遠不夠的。整個新聞客戶端顯得像是一個菜市場,沒有態(tài)度、沒有風(fēng)格,閱讀感受單一化,呈現(xiàn)了碎片化的特點。新聞不只是讓用戶能夠了解身邊發(fā)生的新鮮事,還有宣傳正面思想和傳播正能量的作用,新聞應(yīng)該還要給人們帶來新的思考。讓機器做出正確判斷很簡單,但是讓機器綜合心理學(xué)、社會學(xué)、乃至某細(xì)分領(lǐng)域內(nèi)的規(guī)則做出判斷還要正確地引導(dǎo)受眾則很難,正如現(xiàn)在算法技術(shù)還不能完成一篇富有人文性、文學(xué)性和批判性的深度報道,它止步在了碎片式的、表層的傳播范疇。
4.1.2 容易引起“信息繭房”效應(yīng)
“信息繭房”這一概念是凱斯.桑斯坦在《信息烏托邦》一書中提出的。意指受眾在過度的信息自我選擇之中,這樣會降低接觸外界其他信息的可能,從而將自己的生活桎梏于蠶繭一般的“蠶房”中的現(xiàn)象。人們的信息領(lǐng)域會習(xí)慣性被自己的興趣引導(dǎo),信息窄化帶來了受眾對信息接收的單一性,這種單一性的可能會使受眾陷入循環(huán),加重受眾信息同質(zhì)化。
在互聯(lián)網(wǎng)的普及初期,受眾主要是從主流媒體和門戶網(wǎng)站獲取新聞信息,主流媒體能夠保障新聞的質(zhì)量;對于其他資訊的獲取,由于技術(shù)的限制,此時的繭房并沒有過度被放大,受眾是有適當(dāng)?shù)淖灾鬟x擇性閱讀新聞的。但到了如今以智能技術(shù)的互聯(lián)網(wǎng)時代,情況發(fā)生了改變,信息繭房的現(xiàn)象越來越明顯,用戶被標(biāo)簽的情況下,算法系統(tǒng)進行大量的主動推送,使受眾被動地成為信息的接收者。用戶的閱讀興趣不可能涵蓋所有的知識領(lǐng)域,算法分發(fā)的核心邏輯是根據(jù)用戶的行為數(shù)據(jù)來進行精確推薦的,但同時算法又會自動過濾掉“不感興趣”“不認(rèn)同”的信息,實現(xiàn)“看我想看,聽我想聽”。在此過程中,因為算法技術(shù)的力量將用戶的信息選擇效果放大了倍數(shù),進而將受眾困住在信息繭房當(dāng)中,受眾也很難憑借自身力量打破繭房,甚至在不知覺中受到更多負(fù)面的影響。
4.1.3 算法推送的“偽中立性”
客觀和全面是新聞倫理的基本要求,新聞從業(yè)者必須從可好信息源來獲取真實的信息,以客觀的態(tài)度反應(yīng)現(xiàn)實。我們慣常認(rèn)為,互聯(lián)網(wǎng)技術(shù)服務(wù)商是技術(shù)中立者,不需要承擔(dān)約束大眾媒體的社會責(zé)任,然而當(dāng)信息把關(guān)人又新聞編輯轉(zhuǎn)變?yōu)樗惴üこ處?,傳統(tǒng)的媒介倫理似乎已經(jīng)失效。算法具有商業(yè)傾向性,“中立性”是算法平臺用以逃避媒體責(zé)任的理由,給大眾媒介造成傳播亂象,如此一來更像是一場算法平臺“肆意妄為又不想負(fù)責(zé)”的詭辯。
算法平臺的信息源是經(jīng)過選擇和過濾的,“頭條號”的內(nèi)容占“今日頭條”整個信息系統(tǒng)的絕大部分,然而在“人人都可以做新聞人”的時代,頭條號平臺是一個開放的網(wǎng)絡(luò)媒介環(huán)境,存在大量的偏見和錯誤的認(rèn)知。無論是“今日頭條”平臺設(shè)立的算法規(guī)則,還是其他爬蟲的抓取的關(guān)鍵詞,算法系統(tǒng)的信息源很多是具有目的性的、有偏見和非客觀的信息,所以信息源不能直接作用于用戶。因此,篩選算法系統(tǒng)的信息源與傳統(tǒng)的人工編輯相比較,范圍極廣且很難把關(guān),若算法被惡意利用,那么使整個傳播系統(tǒng)將會被輕易控制。
4.1.4 算法推送里的“議程設(shè)置”
原議程設(shè)置功能揭示的重要內(nèi)涵是:“受眾對新聞的看法雖然被大眾媒體議程設(shè)置功能所主導(dǎo),但其更深刻的是議程設(shè)置給大眾媒體新聞帶來放大與延伸,從而使受眾對新聞選擇做出能動性修正,讓受眾在滿足需求和媒介依賴中逐漸培養(yǎng)出的潛在認(rèn)同感”。
推送算法技術(shù)在互聯(lián)網(wǎng)平臺的運用,使原來傳統(tǒng)媒體主導(dǎo)的議程設(shè)置過程發(fā)生了變化,伴隨著傳播權(quán)的轉(zhuǎn)移、公眾參與度的提高和信息量劇增等原因?qū)е伦h程設(shè)置功逐漸能減弱。過往傳統(tǒng)新聞的內(nèi)容是由編輯有選擇地進行報道后再呈現(xiàn)在受眾面前的,而個性化新聞推送是用戶自己來選擇看哪一方面的內(nèi)容,而這一環(huán)節(jié)中,天然的技術(shù)賦權(quán)將傳播權(quán)從傳統(tǒng)媒體下放至平臺的用戶,使得受眾和社會的連接無需依賴傳統(tǒng)媒介,新聞媒體作為把關(guān)人的作用和議程設(shè)置功能都在減弱。
4.2 算法新聞治理缺陷下的算法權(quán)利異化
算法作為人工智能的基石之一,是“一種有限、確定、有效并適合用計算機程序來實現(xiàn)的解決問題的方法,是計算機科學(xué)的基礎(chǔ)”。近年來,伴隨人工智能深度學(xué)習(xí)算法取得的重大突破和大數(shù)據(jù)時代的到來,人工智能的應(yīng)用場景不斷拓展,人工智能時代正逐漸從想象成為現(xiàn)實。借助于海量的大數(shù)據(jù)和具備強大計算能力的硬件設(shè)備,擁有深度學(xué)習(xí)算法的人工智能機器可以通過自主學(xué)習(xí)和強化訓(xùn)練來不斷提升自身的能力,解決很多人類難以有效應(yīng)對的治理難題。伴隨人工能算法在國家和社會治理中重要性的日漸凸顯,國家和社會對于算法的依賴也逐漸加深,一種新型的權(quán)力形態(tài)——算法權(quán)力也隨之出現(xiàn)。
可以把算法權(quán)利分為四種:數(shù)據(jù)主權(quán)、算法設(shè)計權(quán)、研發(fā)的資本權(quán)和算法控制權(quán)。由于前三種權(quán)利都是單向的、算法開發(fā)者賦予算法的權(quán)利,是屬于算法開發(fā)者的,與算法分發(fā)平臺呈現(xiàn)的效果沒有直接的影響,所以本文將著重論述算法控制權(quán)。
算法控制權(quán)是雙向的,用戶是算法技術(shù)數(shù)據(jù)行為的提供者,同時又是被算法技術(shù)控制的受害者。例如我們看到“今日頭條”會通過推送算法來監(jiān)管用戶的發(fā)布和瀏覽行為,同時平臺會通過算法決策系統(tǒng)來實現(xiàn)內(nèi)容的發(fā)布去引導(dǎo)用戶。算法控制權(quán)當(dāng)然是一種天然技術(shù)賦予的權(quán)利,但算法控制權(quán)是在用戶提供數(shù)據(jù)行為的情況下才得以實現(xiàn)的,因此算法控制權(quán)既存在內(nèi)容生產(chǎn)權(quán),同時有要尊重和保護算法相對人的義務(wù)。
正因為如此,算法技術(shù)被認(rèn)為是一種雙刃劍,一方面算法能夠做出精準(zhǔn)的行為預(yù)測,可以為管理者提供非常好的循環(huán)干預(yù)機制;對于公共行為主體來說,可以通過對大數(shù)據(jù)的應(yīng)用來解決社會治理問題,對于私人主體來說可以借助數(shù)據(jù)來提供個性化和定制化的服務(wù);另一方面,算法技術(shù)存在著諸如利益和風(fēng)險不對稱等問題,而且由于算法技術(shù)發(fā)展的超前性,新科技的創(chuàng)造者具備不對稱的信息和技術(shù)優(yōu)勢,能夠按照自身利益的需求來塑造在平臺上的算法推送邏輯和社會系統(tǒng),這帶來了監(jiān)管的不確定性。人們要通過集體行為去承擔(dān)社會責(zé)任,通過這樣的方式規(guī)制算法權(quán)利,可以讓我們能夠?qū)λ惴ǚ职l(fā)系統(tǒng)的意義和價值得到更深刻的思考。
二、人民搜索是什么
人民搜索網(wǎng)絡(luò)股份公司,于2010年5月31日由人民日報社和人民網(wǎng)共同出資組建。人民搜索即Goso.cn于2010年6月20日正式上線測試。2010年9月25日,鄧亞萍正式擔(dān)任人民搜索網(wǎng)絡(luò)股份公司總經(jīng)理。2010年12月20日,人民搜索正式推出第一個產(chǎn)品“新聞搜索1.0”。2011年6月20日人民搜索改版更名為“即刻搜索”,新域名為www.jike.com。
人民搜索是由人民日報社和人民網(wǎng)共同出資組建的搜索運營企業(yè)。
人民搜索依托人民日報社與人民網(wǎng)在新聞媒體領(lǐng)域的優(yōu)勢與資源,從新聞搜索作為切入點,騰空出世,進入到搜索引擎的產(chǎn)業(yè)中。新聞搜索是一個切入點,也是一個起點,人民搜索還將不斷推出新的搜索服務(wù)。
人民搜索從創(chuàng)立之初,即強調(diào)“共建、共贏”的開放理念,愿與產(chǎn)業(yè)鏈中相關(guān)的機構(gòu)與企業(yè)共同構(gòu)建具有公信力、有創(chuàng)新力、有影響力的搜索平臺。公司不僅通過校園招聘、社會招聘等多種渠道廣泛吸納了優(yōu)秀的創(chuàng)新人才,而且從創(chuàng)立之初就建立在一個產(chǎn)學(xué)研用一體化的機制之上,人民搜索與中科院計算所等建立了密切的戰(zhàn)略合作關(guān)系,并計劃與國內(nèi)具有相關(guān)技術(shù)專長的科研機構(gòu),為中國實踐產(chǎn)學(xué)研用一體化的運作模式作出了積極而有成效的探索。
人民搜索的頁面上提供了新聞、網(wǎng)頁、圖片、博客、論壇、財經(jīng)、時政 等搜索分類。2010年12月20日上線的新聞搜索1.0版,改變了過去以關(guān)鍵詞為核心的信息檢索模式,而是通過關(guān)鍵詞聚焦為新聞事件,再對每一個新聞事件通過新聞、信息、評論、博客、論壇、微博、圖片、視頻等多個維度來立體展現(xiàn)——對海量信息進行了“縮”和“放”的處理,這與過去完全平鋪式的簡單信息檢索模式相比,還是作出了有益的探索性創(chuàng)新。
新聞搜索1.0,以對媒體從業(yè)者需求的深度把握,還推出了“媒體轉(zhuǎn)載率”、“傳播熱度”等特色指標(biāo),讓網(wǎng)友能夠感受到新聞的生命力、新聞的傳播過程和傳播的溫度,讀新聞不再是讀信息,而是在讀故事。
新版通用搜索引擎平臺——即刻搜索以網(wǎng)頁搜索為默認(rèn)結(jié)果,致力于成為大眾探索求知的工具、工作生活的助手和文化交流的平臺。
三、人民日報批評網(wǎng)絡(luò)虛假流量,虛假流量是如何做出來的?
機器作弊常見的手段有:通過機器發(fā)送假流量、肉食機訪問網(wǎng)頁、 DNS/IP訪問網(wǎng)頁、爬蟲技術(shù)訪問網(wǎng)頁等手段制造假流量,以模擬瀏覽行為產(chǎn)生大量的瀏覽痕跡或點擊,從而提高了流量,機器作弊的成本相對較低,但都離不開編碼程序。當(dāng)前更有效的防范措施,是通過基本的用戶行為分析來識別出這類假流量,再通過補量、屏蔽來減少這類假流量。比如:頻繁更換用戶身份,在一家 cookie上猛薅羊毛,一位用戶展示了上千次;“人為欺騙”場景的手段有,通過雇傭、誘騙等方式大量雇傭人員點擊廣告,下載 APP,訪問網(wǎng)頁,因為屬于人為操作。
這種虛假流量很難屏蔽,但是成本比較高。這類虛假流量可以通過深入的用戶行為分析,如轉(zhuǎn)化等來識別,可以通過增加“人工作弊”的運營成本來減少這類虛假流量。說到虛假流量的盈利形式,與上述廣告支付形式密不可分。每一個廣告都會有相應(yīng)的結(jié)算和考核指標(biāo),這已經(jīng)成為虛假流量欺詐的痛點之一。每一個廣告都有對應(yīng)的付費形式,每一個付費形式都有一個虛假流量利益的主張點,構(gòu)成了虛假流量利益的形式。這些虛假流量的出現(xiàn)通常具有明顯的特征,比如頻繁點擊卻沒有有效互動,同一個人在一段時間內(nèi)頻繁訪問廣告等等。
虛假流量之所以能夠成為生態(tài)圈,是因為供求雙方都有共同的利益。在這個生態(tài)圈中,虛假流量的提供者、虛假流量的獲得者是兩個重要的角色。面對審查指標(biāo)的壓力:企業(yè)(廣告主)過度追求的KPI和效果指標(biāo)時,根據(jù)審查指標(biāo)的壓力越來越大,暴露、點擊等指標(biāo)無法完成時,無意識地忽視廣告刷量的影響。
歸因分析可以幫助企業(yè)識別最終轉(zhuǎn)型來自于哪個渠道,但企業(yè)往往忽略了這一功能。常見的原因是在預(yù)算充足,客戶情況符合KPI的情況下,企業(yè)的營銷運作會忽略不同渠道的虛假流量。但是,有些渠道有混合流量。如果不追蹤每個渠道的流量質(zhì)量,就會縱容虛假流量對營銷效果的長期影響。這對于針對效果的營銷來說是最重要的,尤其是每年復(fù)盤的時候,才發(fā)現(xiàn)虧損不是小數(shù)目。
虛假流量沒有先進的技術(shù)含量,流量詐騙的成本極低。相關(guān)數(shù)據(jù)顯示,刷流量的成本不到正常流量成本的十分之一。廣告主對流量質(zhì)量的評價,除出版者提供的報道外,沒有直接證據(jù)證明對方存在欺詐行為,因此很難追究虛假流量維權(quán)。
四、人民日報的的投稿要求
大多數(shù)報刊雜志都有相對穩(wěn)定的作者群和稿源,要在激烈的用稿競爭中獲勝,為自己爭得一席之地,使自己的作品盡可能變成鉛字,讓你的研究成果為更多的人認(rèn)可和受益,也讓大家與你共同分享成功的喜悅,投稿時須注意以下5個問題:
1.投稿要對路
每種報刊雜志都有自己特定的辦報(刊)方針和宗旨,有自己的讀者對象,投稿前必須先對此進行了解,搞清它的發(fā)行出版周期是雙月刊、季刊、月刊還是半月刊、周刊,如果是報紙的話,是日報、周二報、周報還是半月報、月報,接下來要了解各種報刊都開設(shè)了哪些欄目,各欄目都發(fā)表些什么樣的文章,可能的話還應(yīng)該了解一下報刊的辦刊歷史,看看近年都發(fā)表過什么樣的文章,對照一下你研究的問題以及撰寫的論文原來有沒有人研究過寫過,研究現(xiàn)狀如何,原來發(fā)表過的此類文章是從哪些角度寫的,你的文章有無創(chuàng)新發(fā)展。此外,還應(yīng)對報刊的發(fā)稿動態(tài)和走向以及下一步熱點稿件是哪一類進行研究,最后看看你撰寫的文章適合于哪些報刊的哪些欄目,投寄時最好在信封上注明欄目名稱,以便于編輯人員及時準(zhǔn)確地處理稿件。要做到這一點,平時對有關(guān)報刊必須多看、多翻閱, 至少對近期目錄做到心中有數(shù),這樣投稿時才能做到有的放矢,不致于把中學(xué)化學(xué)教學(xué)方面的稿件寄給適合小學(xué)生閱讀的報刊。
例如:中學(xué)化學(xué)教學(xué)研究的權(quán)威雜志——《化學(xué)教育》是中國化學(xué)會主辦的綜合性學(xué)術(shù)月刊。經(jīng)常在每年第一期刊登《化學(xué)教育》欄目簡介,《化學(xué)教育》征稿簡則。如果要向這家雜志投稿,就必須仔細(xì)研究這兩篇文章。其它幾家雜志如:中學(xué)化學(xué)教學(xué)參考、中學(xué)化學(xué)等也會對其讀者對象、投稿要求、雜志欄目等方面進行介紹。
2.注意把握時機
教研論文按時效性大體可分為兩類:一類時效性強,與教學(xué)進度配合(例如《中學(xué)化學(xué)教學(xué)參考》的新教材教學(xué)參考,各種同步練習(xí)等),另一類時效性不強,與教學(xué)進度無關(guān)。后者什么時候投稿都行, 而前者必須掌握一定的提前量,到底提前多長時間投稿,一般報刊都會通過報刊啟示提醒讀者和作者。正常情況下,如果報刊沒有規(guī)定,與教學(xué)進度配合的稿件,雙月刊、月刊應(yīng)提前4—6個月??偟恼f來,新聞類稿件越及時越好,報刊發(fā)行周期越短,提前量相應(yīng)要小些。投稿最忌諱“馬后炮”,一般不是很出色的稿子,“馬后炮”是很難發(fā)表的,比如:與下學(xué)期一開學(xué)要學(xué)的內(nèi)容有關(guān)的稿件, 一般在上學(xué)期期末最遲在假期當(dāng)中就要發(fā),這樣才能給教師備課提供借鑒和參考,如果你等到教完這部分內(nèi)容后再寫出來投出去,那就成了“馬后炮”,這類稿件不是極有價值一般不會保留到第二年再發(fā)。這便產(chǎn)生了矛盾,因為大多數(shù)與教學(xué)進度有關(guān)的稿件都是在教學(xué)后發(fā)現(xiàn)了問題才研究撰寫出來的,而此時已經(jīng)錯過了投稿時機。怎么辦?筆者的經(jīng)驗是可以先寫出來慢慢加工仔細(xì)斟酌,到第二年合適的時候再投出去,這樣經(jīng)過冷加工后,稿件會更成熟。有些報刊采用期長達幾個月甚至半年,即使只有一個月,由于不能一稿多投,等到收到答復(fù),再投給其它報刊也已錯過了時機。這種情況下也可以采用上述辦法,只是最好有個發(fā)稿記錄,記下何時發(fā)給誰?結(jié)果如何?再投稿時心中有數(shù)。
3.注意格式要規(guī)范
如果稿件是手寫的,要注意書寫認(rèn)真規(guī)范,整潔清楚,無錯別字,標(biāo)點符號準(zhǔn)確無誤,而且必須使用方格稿紙謄清,注明每頁字?jǐn)?shù)。如果是打印稿,還應(yīng)注意字不可太小,一般正文部分以三號字或小三號字為宜,頁腳須注明頁數(shù)與字?jǐn)?shù),便于編輯排版時參考。一般報刊編輯部都不收復(fù)寫稿和復(fù)印稿。不少報刊編輯部對稿件格式都有詳細(xì)而明確的要求,投稿前要認(rèn)真研究。正規(guī)論文的格式應(yīng)該是標(biāo)題、標(biāo)題之下是通訊地址、通訊地址之后是加小括號的郵政編碼,然后空格后是作者姓名。較長的論文在正文之前應(yīng)有200—300字的“摘要”,和不超過5個的關(guān)鍵詞,以便于編輯閱稿時節(jié)約時間,了解要點,通常正文之后還應(yīng)注明“引文出處”或“備注”以及主要參考書目,參考書目要寫清書名、出版社名、版本、編著者等。如果是第一次投稿,最好文后加“作者簡介”,以方便編輯了解情況,建立作者檔案,同時這也是自我推銷的需要。當(dāng)然,簡介必須實事求是,不可海吹,因為稿件最后能否采用,不是看你的簡介來決定,關(guān)鍵還是稿件的質(zhì)量,提高命中率的根本還在于稿件質(zhì)量。
4.適當(dāng)控制字?jǐn)?shù)
不同的刊物,對論文字?jǐn)?shù)的要求不同,而且差別很大,有的喜歡長篇大論,有的喜歡短小精悍,投稿時應(yīng)對各刊物發(fā)表的文章進行研究,總結(jié)歸納出一些規(guī)律,這樣投稿才有針對性。一般說來,寄給報刊發(fā)表的文章,應(yīng)盡量短些,選題最好小一點,內(nèi)容實用些,可操作一些,讓別人看了能受到啟發(fā)教育或拿過來就可以用;而參加評選的論文,理論性應(yīng)強些,選題可稍大點,字?jǐn)?shù)亦應(yīng)適當(dāng)多一些,這樣才能將問題說清說透。通常組織論文評選的部門下通知或發(fā)啟示時,對論文選題、格式、字?jǐn)?shù)都有明確要求,撰寫時應(yīng)充分注意,如果沒有要求,筆者以為參加評選的論文字?jǐn)?shù)以3000- 5000字為宜,一般不要少于3000字,也不要多于7000字,根據(jù)選題只要論述清楚了就行,不必把過多的注意力放在字?jǐn)?shù)多少上。就發(fā)表的文章來看,字?jǐn)?shù)多少的差別亦很大,這主要與選題性質(zhì)、報刊容量、些讀者對象等因素有關(guān),一般理論性較強的選題可稍長些,應(yīng)用性較強的選題應(yīng)短些,投給雜志的稿件可稍長些,而投給報紙的稿件應(yīng)盡量短些,面向教師及研究工作者的論文可稍長些,面向?qū)W生的作品應(yīng)盡量短些,選題較大的、學(xué)術(shù)性強的論文可稍長些,選題很小、學(xué)術(shù)性不強的、普及性的作品應(yīng)盡量短些。這里的“稍長”或“稍短”是相對而言,沒有嚴(yán)格規(guī)定,在筆者看來,“稍長”一些的文章可掌握在 3000-5000字之間,當(dāng)然,如果1500-2000字能解決問題則最好;“ 稍短”一的文章以不超過2000字為宜,如果500-1000字頂多1500 字能說清問題則最好。不論哪類文章,在控制字?jǐn)?shù)的同時應(yīng)十分注意文章的科學(xué)性和可讀性。所謂科學(xué)性是指文章的觀點不能出錯,引用的論據(jù)資料應(yīng)準(zhǔn)確無誤,論證過程應(yīng)經(jīng)得住推敲;所謂可讀性主要是指文字表述要讓人喜聞樂讀,一看題目就想看內(nèi)容,一看內(nèi)容就讓人愛不釋手,非一口氣讀完不可,當(dāng)然這不是一日之功,需要長時間磨煉,文字功底是練出來的。
例如:《化學(xué)教育》的“化學(xué)與社會”欄目字?jǐn)?shù)應(yīng)在5000字以內(nèi),“復(fù)習(xí)指導(dǎo)”字?jǐn)?shù)應(yīng)在3000字內(nèi),“調(diào)查報告”字?jǐn)?shù)在3000字內(nèi),“實驗教學(xué)與教具研制”字?jǐn)?shù)在500—2000。
5.講究投稿策略
剛開始投稿的人,將稿子投出后總希望盡快得到編輯部的回音。事實上,由于編輯部每天要處理的稿件無以數(shù)計,所以,不少刊物收到稿件后常常連收稿通知都懶得發(fā),這挫傷了不少作者的積極性,甚至有人從此不再寫稿。還有個別刊物大量地照顧“關(guān)系稿件”,眼睛只盯住幾個“名人”,結(jié)果使很多新人退避三舍。但應(yīng)該承認(rèn),任何刊物都會考慮自己的信譽,真正有生命力的刊物在用稿上一定會堅持認(rèn)稿不認(rèn)人的原則,只要稿件對路時機合適,質(zhì)量屬于上乘之作,任何編輯部都沒有舍優(yōu)求次的道理。基于這種考慮,從撰稿者角度出發(fā),筆者以為,投稿時應(yīng)注意以下策略:一是持之以恒,管寄不管發(fā),即經(jīng)常投稿,投出后就不要再去想它,不要指望它一定能發(fā)表,壓低期望值,用不用讓編輯部去考慮,事實上你想也沒有用;二是猛打猛沖,以多取勝,越不發(fā)越寄,時間長了,編輯就會有印象,特別是一些稿源充足級別較高的刊物,很可能你寄的稿子連仔細(xì)看都未來得及就提出了處理意見,“屢投屢退,屢退屢投”就可能感動上帝,如果你寫的稿件確有水平,不用說,只仔細(xì)看一次就可能改變你的命運,甚至連你以前投的稿子都會引起編輯的注意; 三是認(rèn)準(zhǔn)的路走到底,只要你感到你的稿件確有價值,就可以反復(fù)投,也可以轉(zhuǎn)投其它同類刊物,相信是金子就一定有被人發(fā)現(xiàn)認(rèn)可的時候;四是由低到高,循序漸進,一般來說,刊物的級別越低,發(fā)行范圍越小,稿源越不足,同樣質(zhì)量的稿件投給這樣的刊物就可能增加命中的機會,剛開始寫稿打知名度的新人尤其應(yīng)注意這一點,夢想一鳴驚人一口吃成個胖子是不現(xiàn)實的;五是趁熱打鐵,即收到刊物的采用通知后馬上再寄,趁編輯部對你的稿子還有印象,繼續(xù)開拓。六是注意對準(zhǔn)檔次,即投稿時注意稿件的質(zhì)量與刊物的級別影響對應(yīng)一致,這可以分為兩種情況:第一種情況是原來發(fā)表過文章有一定知名度的作者,可以“好稿子”對“高級別”刊物,這樣可以擴大影響、創(chuàng)牌子、打名聲,提高知名度,當(dāng)然作品一定是“ 拳頭產(chǎn)品”,如刊物多次發(fā)表過你的稿子屬于“熟門熟路”,可采取中檔稿子對高級刊物的策略;第二種情況是原來未發(fā)表過文章,沒有什么名氣,門路不熟,屬于淌路子的作者,可采用“田忌賽馬”的辦法,以好對中、以中對低,如此可取得“三局二勝”的效果。
最后說一下“一稿多投”。各刊物都有自己的規(guī)定,都反對“ 一稿多投”,都要求過了采用期之后再改投它刊。但是很多稿子時效性很強,特別是配合教學(xué)進度的稿件常常是“過了這個村就沒那個店”了。在這種情況下,有兩個辦法:一是按規(guī)定辦,過期改投或留待明年再投,二是采取變相的“一稿多投”,變通的辦法就是作好投稿記錄,收到采用通知后立即通知其它刊物,不要再發(fā)。一般說來,知名度不大、剛開始寫稿的作者,特別是質(zhì)量一般的稿件,即使一稿多投,也很少會出現(xiàn)幾家刊物同時采用的情況。從這個角度出發(fā),從維護作者權(quán)益的角度出發(fā),筆者贊成第二種辦法,各報刊雜志編輯部似亦不應(yīng)反對這種辦法。要說責(zé)任的話,作者寫稿很不容易,你不用又不及時通知作者,耽誤了用稿時機,這個責(zé)任編輯部應(yīng)該負(fù),不知筆者的看法是否正確。
各大報紙的投稿地址參考如下http://zhidao.baidu.com/question/4073053.html?si=5
以上就是關(guān)于爬蟲人民日報關(guān)鍵詞相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
偽原創(chuàng)文章生成器小爬蟲(偽原創(chuàng)文章生成器app)
2023最掙錢的行業(yè)(2030年最賺錢的行業(yè))