|
第二十天 熱點(diǎn)專題五 新聞推薦算法專題 新聞推薦算法是目前新媒體研究中的熱點(diǎn)。 在前互聯(lián)網(wǎng)時(shí)代,報(bào)紙、廣播、電視等傳統(tǒng)媒體主要通過人工為受眾推薦信息; 在互聯(lián)網(wǎng)發(fā)展初期,信息的熱門推薦方法得到發(fā)展并在各種網(wǎng)站大量使用; 目前所處的大數(shù)據(jù)時(shí)代,則以個性化算法推薦和信息流展示為主流。 一、現(xiàn)狀概況 個性化信息推送是基于“用戶洞察”的個性化信息的智能匹配,即通過人工智能分析和過濾機(jī)制,根據(jù)個性化需求聚合相關(guān)的信息和應(yīng)用,并以此對信息進(jìn)行深度智能分析,以實(shí)現(xiàn)用戶個性化、動態(tài)的需求。概言之,就是為用戶找到與其需求相匹配的內(nèi)容;反過來說也就是為內(nèi)容找到與其屬性相匹配的用戶。個性化內(nèi)容推送作為一種相對成熟的人工智能技術(shù),對于新聞業(yè)務(wù)鏈的創(chuàng)新發(fā)展產(chǎn)生了革命性的影響。 目前,個性化新聞推送,主要是通過挖掘用戶數(shù)據(jù),從而針對用戶興趣點(diǎn)進(jìn)行新聞推送的聚合新聞APP。國內(nèi)主要是以今日頭條、天天快報(bào)和一點(diǎn)資訊等算法類資訊平臺為代表。用戶粘連性強(qiáng)、滲透率高等特點(diǎn)使得這類平臺在我國新聞APP市場上擁有極高的市場占有率。 個性化新聞推送已經(jīng)成為新聞市場的“新星”,新聞產(chǎn)業(yè)的市場格局在個性新聞推送的驅(qū)動下正在發(fā)生著變化,整個新聞生產(chǎn)業(yè)務(wù)鏈條正在面臨重塑,新聞生產(chǎn)環(huán)節(jié)和用戶接收環(huán)節(jié)都呈現(xiàn)出若干前所未有的新特點(diǎn)。 二、新聞生產(chǎn)的智能化數(shù)據(jù)驅(qū)動范式 數(shù)據(jù)引擎成為內(nèi)容標(biāo)配,激活“長尾內(nèi)容”,新聞內(nèi)容分發(fā)成為專業(yè)化的獨(dú)立部門。
1.新聞生產(chǎn)的智能化數(shù)據(jù)驅(qū)動范式 數(shù)據(jù)引擎成為內(nèi)容“標(biāo)配”;激活“長尾內(nèi)容”,傳統(tǒng)的新聞生產(chǎn)是一種依賴新聞生產(chǎn)者經(jīng)驗(yàn)的規(guī)模化生產(chǎn),相對而言帶有精英主義的傲慢。而個性化新聞推送引發(fā)的新聞生產(chǎn)是一種“新聞內(nèi)容+數(shù)據(jù)化精確制導(dǎo)”的生產(chǎn)方式,新聞生產(chǎn)者的精英主義傲慢逐步被互聯(lián)網(wǎng)時(shí)代的數(shù)據(jù)思維和用戶思維所取代。 互聯(lián)網(wǎng)時(shí)代的用戶對于信息的個性化需求廣度和深度在不斷擴(kuò)張,新聞生產(chǎn)者為了滿足受眾的個性化需求,在產(chǎn)品最初環(huán)節(jié)就以用戶的興趣為出發(fā)點(diǎn),把用戶的需求當(dāng)作目標(biāo)把用戶興趣圖譜、社會關(guān)系圖譜、生活習(xí)慣圖譜等數(shù)據(jù)作為定制化生產(chǎn)新聞的基礎(chǔ)。在這樣一個過程中,新聞生產(chǎn)實(shí)際上是一種數(shù)據(jù)化的新聞生產(chǎn),新聞生產(chǎn)者利用數(shù)據(jù)驅(qū)動帶動業(yè)務(wù)發(fā)展和產(chǎn)品研發(fā),用數(shù)據(jù)支撐新聞生產(chǎn)的選題、策劃、制作方式等每個流程,新聞產(chǎn)品也更能觸動用戶的痛點(diǎn)時(shí),個性化新聞推送能夠使得長尾內(nèi)容得到有效利用,并且形成一定規(guī)模,內(nèi)容資源得到更大力度的激活與開發(fā)。 長尾需求表明商業(yè)和文化的未來不在熱門產(chǎn)品,不在傳播需求曲線的主體部分,而在于過去被視為“失敗者”的那些產(chǎn)品—也就是需求曲線中那條無窮長的尾巴。個性化新聞推送下通過對數(shù)據(jù)的挖掘,原來被忽視的大量的長尾信息被挖據(jù)。這些非主流、個性化的產(chǎn)品需求,雖然是需求的尾巴,但是經(jīng)過散落在社會各個角落中的用戶的累積,形成一定規(guī)模,能夠使得大量傳統(tǒng)的新聞資源和價(jià)值被激發(fā)。
2.新聞內(nèi)容分發(fā)成為專業(yè)化的獨(dú)立部門
今天,傳統(tǒng)的內(nèi)容分發(fā)已經(jīng)無法解決海量的內(nèi)容與用戶特定需求之間越來越深刻的矛盾在這種形勢下,個性化內(nèi)容推送的專業(yè)分發(fā)平臺應(yīng)運(yùn)而生,在智能化數(shù)據(jù)引擎的作用下內(nèi)容和用戶之間形成新的強(qiáng)連接關(guān)系。與此同時(shí),內(nèi)容生產(chǎn)環(huán)節(jié)和分發(fā)環(huán)節(jié)順理成章地分離開來。
新的內(nèi)容分發(fā)平臺是基于移動端的,集社交、搜索、場景識別、個性化推送、智能化聚合于一體的智能算法型平臺,提高了內(nèi)容分發(fā)的效率及個性化切合度。以今日頭條為例它的定位是一個個性化的內(nèi)容分發(fā)渠道,根據(jù)用戶在社交網(wǎng)站上發(fā)布的內(nèi)容及其所屬類別、用戶自標(biāo)簽、社交關(guān)系、社交行為,以及參與的群組、機(jī)型、使用時(shí)間等數(shù)據(jù)源,推斷用戶的興趣點(diǎn),對用戶進(jìn)行畫像,并根據(jù)這些興趣的重要程度或者先后順序進(jìn)行推送,從而實(shí)現(xiàn)個性化新聞推送。根據(jù)這些數(shù)據(jù),用戶與信息之間實(shí)現(xiàn)了精確匹配。它推送的內(nèi)容來自兩方面,一方面是對網(wǎng)易、騰訊等各大門戶網(wǎng)站的新聞進(jìn)行內(nèi)容聚合合,另一方面則是其頭條號下匯集的自媒體內(nèi)容。它不生產(chǎn)內(nèi)容,只專注于內(nèi)容的分發(fā),使得用戶直接與信息源對接,這實(shí)際在某種程度上保證了新聞的客觀性和新聞資源最大限度的利用和開發(fā)。 三、個性化新聞推薦算法的問題
內(nèi)容不契合用戶興趣點(diǎn)、倫理沖突、個性化新聞推薦算法的問題、信息繭房與信息成癮
1.內(nèi)容不契合用戶興趣點(diǎn)
個性化推薦對數(shù)據(jù)的數(shù)量與質(zhì)量要求較高,多數(shù)新聞資訊類APP要面對大量歷史閱讀記錄為空白的新增用戶,基于此,個性化推薦效果遠(yuǎn)不如熱門推薦效果。另外,無論是基于內(nèi)容的推薦還是協(xié)同過濾算法技術(shù),本身都存在一定的缺陷。如無法對文章內(nèi)容進(jìn)行深入處理,只能從文章特有的高頻關(guān)鍵詞進(jìn)行標(biāo)簽層面的相似度匹配,話題層面膚淺無法與用戶氣質(zhì)、性格、生活方式等進(jìn)行深層次匹配,難以滿足用戶細(xì)膩的心理需要。
2.倫理沖突 數(shù)字系統(tǒng)以清晰的方式,和它們根植于其中的文化緊密地融合在一起”。托馬斯·克倫普在其著作《數(shù)字人類學(xué)》中直截了當(dāng)?shù)刂赋?人類建構(gòu)的數(shù)字系統(tǒng)就是人的鏡像系統(tǒng)。不可否認(rèn),人類社會充滿著各種各樣的歧視,世俗社會的民族、宗教歧視,商業(yè)社會的金錢歧視,政治社會的權(quán)力歧視等,在利益交織的社會中不斷變種。作為同構(gòu)現(xiàn)實(shí)的表征機(jī)制,算法新聞的設(shè)計(jì)是人主導(dǎo)的,不可避免地會受到價(jià)值干涉,盡管許多公司極力回避這個問題。以客觀、公正的科學(xué)名義設(shè)計(jì)出的算法難免會有“變種”的歧視,而這個歧視也將變得更加隱蔽。 純粹的個性化推薦系統(tǒng)缺乏對文章的質(zhì)量與內(nèi)容的把關(guān),終極目的就是實(shí)現(xiàn)流量最大化,因此,用戶在獵奇心理驅(qū)使下點(diǎn)開的低俗內(nèi)容就會得到廣泛地傳播。如早孕網(wǎng)紅、淫穢色情等內(nèi)容嚴(yán)重破壞了網(wǎng)絡(luò)生態(tài)環(huán)境。技術(shù)哲學(xué)家安德魯芬伯格的技術(shù)批判理論認(rèn)為技術(shù)不是一個中立的工具,而是會帶有自己的價(jià)值觀與偏好。然而平臺方的默認(rèn)失責(zé),使得算法被錯誤的價(jià)值觀俘獲,低質(zhì)內(nèi)容流行網(wǎng)絡(luò)。不僅如此,新媒體成為了假新聞的重災(zāi)區(qū),個性化推薦在不經(jīng)意間成為了謠言滋生的幫兇。 3.信息繭房與信息成癮
由于個性化推薦系統(tǒng)時(shí)根據(jù)用戶已有的閱讀偏好進(jìn)行關(guān)鍵詞匹配與推薦,因此相似度低的內(nèi)容基本不會被推薦。在一次又一次閱讀自己喜歡領(lǐng)域的信息后,用戶不斷地在自己與世界之間筑起一座高墻,許多人沉溺于這樣的擬態(tài)環(huán)境中不能自拔。信息成癮與信息繭房是一枚硬幣的兩面,個性化推薦應(yīng)用在被用戶使用的過程中,由于算法不斷貼合用戶想看的內(nèi)容,使得用戶的欲望不斷被滿足,構(gòu)成了一個正向反饋,使用戶形成心理依賴。
4.權(quán)利沖突
算法的權(quán)利沖突主要體現(xiàn)在兩方面,一是用戶信息的“被遺忘權(quán)”,二是內(nèi)容原創(chuàng)版權(quán)。個性化推薦算法“記住”了用戶的閱讀喜好,但是對于用戶而言,被記住不一定是好事用戶同樣存在著讓算法忘記他過去喜好的需求。另外,算法只負(fù)責(zé)推薦,并不知道文章由誰撰寫,以及是否涉嫌抄寫。事實(shí)上,許多企業(yè)的推薦系統(tǒng)中的文章數(shù)據(jù),是從其他網(wǎng)頁抓取的,換句話說,是未經(jīng)授權(quán)的竊取。
四、推薦算法的優(yōu)化策略
技術(shù)革新
推薦篁法的優(yōu)化策略
構(gòu)建優(yōu)質(zhì)內(nèi)容生態(tài) 克服信息繭房 1.技術(shù)革新 傳統(tǒng)的推薦算法范式本質(zhì)上就是熱門推薦補(bǔ)充關(guān)鍵詞匹配,要實(shí)現(xiàn)有效傳播,在技術(shù)上必須不斷革新。對于協(xié)同過濾算法中存在的不恰當(dāng)推薦問題,在應(yīng)用上可以增設(shè)一個界面,允許用戶設(shè)定明確地不想被推薦的話題,增加算法的可預(yù)測性和可控制性。另外,應(yīng)當(dāng)加強(qiáng)內(nèi)容的審核,有針對性地開發(fā)一套機(jī)器學(xué)習(xí)系統(tǒng),根據(jù)文本關(guān)鍵詞等特征識別出低俗內(nèi)容,以人工審核為輔助,守住內(nèi)容底線。 2.構(gòu)建優(yōu)質(zhì)內(nèi)容生態(tài) 從內(nèi)容生態(tài)的構(gòu)建角度,互聯(lián)網(wǎng)企業(yè)應(yīng)當(dāng)考慮整個個產(chǎn)業(yè)的長遠(yuǎn)發(fā)展,將回報(bào)向優(yōu)質(zhì)內(nèi)容的生產(chǎn)者傾斜,同時(shí)遏制低俗內(nèi)容的蔓延。作為互聯(lián)網(wǎng)公司,要改變單純追求用戶時(shí)長的KPI( Key Perfoemance Indicator,關(guān)鍵績效指標(biāo))評判標(biāo)準(zhǔn),注意內(nèi)容的消費(fèi)升級。其次,監(jiān)管自動化內(nèi)容審核系統(tǒng)已經(jīng)有了長足的進(jìn)步,但是依然需要一套人工審核系統(tǒng)來完成最后的內(nèi)容放行。要積極通過立法方式規(guī)范監(jiān)管,鼓勵優(yōu)質(zhì)主旋律內(nèi)容的生產(chǎn)與傳播。同時(shí),政府機(jī)構(gòu)應(yīng)當(dāng)充分發(fā)揮作用,對市場調(diào)節(jié)失靈的情況進(jìn)行合理干預(yù),讓信息流消費(fèi)市場不至于淪為低質(zhì)量內(nèi)容循環(huán)生產(chǎn)的垃圾堆。 3.克服“信息繭房” 個性化推送帶來的“繭房”效應(yīng)問題可以通過對用戶潛在信息需求的挖掘來解決。社交網(wǎng)絡(luò)時(shí)代,用戶的需求半徑即社交半徑,活動范圍即場景化需求。要想進(jìn)一步滿足用戶的潛在需求,需要獲取用戶的社交數(shù)據(jù)和場景化應(yīng)用數(shù)據(jù),結(jié)合用戶的社交特征和場景進(jìn)行個性化新聞推送。對不具備社交續(xù)體基因的個性化新聞推送平臺而言,要獲取核心社交數(shù)據(jù),必須打通行業(yè)壁壘,廣泛開展技術(shù)共享或資本層面的合作。場景化數(shù)據(jù)反映的是用戶隨時(shí)隨地的動態(tài)需求,用戶日常生活的活動范圍就是用戶可能產(chǎn)生場景化新聞需求的突破口,通過技術(shù)手段對用戶的活動范圍進(jìn)行精準(zhǔn)的畫像,結(jié)合LBS等技術(shù)就可以優(yōu)化場景化新聞資訊信息供給和服務(wù)。
第二十天 習(xí)題訓(xùn)練 l 簡答題(本大題共題,各1分,共分(2018復(fù)旦大學(xué)專碩440) 題目:以《今日頭條》為例,分析新聞個性化推送。 新聞個性化推送,是當(dāng)下互聯(lián)網(wǎng)時(shí)代,基于大數(shù)據(jù)和算法技術(shù)而產(chǎn)生的新的新聞分發(fā)模式,以《今日頭條》客戶端為例,吸引了大量受眾。新聞的個性化推送為新媒體環(huán)境下的新聞生產(chǎn)和分發(fā)找到了新的模式,但也暴露出了很多問題新聞個性化推送的優(yōu)勢。
(一)受眾地位升級,最大限度滿足受眾需求
新聞的推送完全從受眾的角度出發(fā),受眾的需求得到了前所未有的重視,地位得到了提高。
(二)激活新聞內(nèi)客的長尾應(yīng),滿足用戶的小眾需求
新聞個性化推薦給原本不受重視的新聞小眾內(nèi)容帶來了新的發(fā)展可能,滿足用戶小眾需求的同時(shí)也為營利帶了一種新的可能。
(三)帶來新聞機(jī)構(gòu)的變革,新聞內(nèi)容分發(fā)成為專業(yè)的獨(dú)立部門
新聞內(nèi)容分發(fā)成為專業(yè)的獨(dú)立部門,給新聞機(jī)構(gòu)帶了一次新的變革。
二、新聞個性化推送的劣勢
(一)完全由受眾出發(fā),容易使受眾形成信息繭房和滴費(fèi)形式的固化。
以算法主導(dǎo)的新聞個性化推送,會根據(jù)用戶的喜好和習(xí)慣推送類似的新聞,這樣會給受眾帶來信息繭房和消費(fèi)內(nèi)容的固化的問題。
(二)算法獲取數(shù)據(jù),公民隱私容易遭受侵犯。
個性化推薦的本質(zhì),其實(shí)是對于用戶數(shù)據(jù)的攫取和挖據(jù),在缺乏配套制度的情況下,數(shù)據(jù)的挖據(jù)容易造成隱私的泄露。
(三)算法由人為控制,容易造成凌駕于公權(quán)力之上的第三權(quán)力。
算法公司為第三方公司,掌握眾多用戶的信息和數(shù)據(jù),這對于政府公權(quán)力來說是種隱患。新聞個性化推送的本質(zhì)其實(shí)是從受眾角度出發(fā),進(jìn)行新聞的生產(chǎn)和分發(fā),這其實(shí)是在傳統(tǒng)媒體收到互聯(lián)網(wǎng)的沖擊,和當(dāng)下內(nèi)容生產(chǎn)過剩的情況下的有效嘗試。但是還出現(xiàn)了許多問題,這些問題可以由技術(shù)的進(jìn)步和人為把關(guān)的加強(qiáng)來解決,由此,發(fā)揮出新聞個性化推送最大的現(xiàn)實(shí)價(jià)值和意義。
|