《算法新聞》課件第十二章 人工智能與推薦系統(tǒng)_第1頁(yè)
《算法新聞》課件第十二章 人工智能與推薦系統(tǒng)_第2頁(yè)
《算法新聞》課件第十二章 人工智能與推薦系統(tǒng)_第3頁(yè)
《算法新聞》課件第十二章 人工智能與推薦系統(tǒng)_第4頁(yè)
《算法新聞》課件第十二章 人工智能與推薦系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1節(jié)人工智能簡(jiǎn)介

1.1人工智能的概念1.1.1從AlphaGo到AlphaGoZero·AlphaGo是一個(gè)人工智能圍棋程序,由谷歌旗下的DeepMind公司開(kāi)發(fā),其技術(shù)原理是深度學(xué)習(xí)。AlphaGo結(jié)合了數(shù)百萬(wàn)圍棋專家的棋譜,使用監(jiān)督學(xué)習(xí)進(jìn)行自我訓(xùn)練。2016年AlphaGo以總分4:1勝圍棋九段選手李世石,2017年以總分3:1勝柯潔?!?017年10月DeepMind團(tuán)隊(duì)公布了最強(qiáng)版阿爾法圍棋,代號(hào)為AlphaGoZero,其特點(diǎn)是“自學(xué)成才”。AlphaGoZero則不需要事前訓(xùn)練。其原理是從單一神經(jīng)網(wǎng)絡(luò)開(kāi)始,通過(guò)神經(jīng)網(wǎng)絡(luò)強(qiáng)大的搜索算法,進(jìn)行自我對(duì)弈。神經(jīng)網(wǎng)絡(luò)通過(guò)逐漸調(diào)整,提升預(yù)測(cè)下一步的能力,最終贏得比賽?!?qiáng)化學(xué)習(xí)主要有三部分內(nèi)容:①?zèng)Q策過(guò)程——決定落子動(dòng)作②獎(jiǎng)勵(lì)系統(tǒng)——判斷落子動(dòng)作是否對(duì)贏得棋局有幫助,若有,則會(huì)給模型加分③系列動(dòng)作的學(xué)習(xí)——用以在比賽中獲勝

1.1人工智能的概念1.1.2人工智能概念的界定有人認(rèn)為……·像人一樣思考、行動(dòng)的系統(tǒng)就是人工智能系統(tǒng)。·人工智能是機(jī)器展現(xiàn)出某種“智能”特征?!と绻麛?shù)字計(jì)算機(jī)及其控制的機(jī)器人能執(zhí)行智能生物的某些任務(wù)即可認(rèn)為其具備了人工智能?!と斯ぶ悄苁怯?jì)算機(jī)學(xué)科的一個(gè)分支,機(jī)器人、專家系統(tǒng)、語(yǔ)音和圖像識(shí)別以及自然語(yǔ)言處理等均屬于人工智能研究的領(lǐng)域?!叭斯ぶ悄苁抢脭?shù)字計(jì)算機(jī)或者數(shù)字計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識(shí)并使用知識(shí)獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)”?!袊?guó)電子技術(shù)標(biāo)準(zhǔn)化研究院《人工智能標(biāo)準(zhǔn)化白皮書》(2018年1月)→此解釋將理論、方法、概念、技術(shù)和應(yīng)用系統(tǒng)整合在一起表述人工智能,完整地界定了人工智能的范疇。

1.1人工智能的概念1.1.3人工智能概念的解讀·從學(xué)科劃分的角度來(lái)理解,目前一般認(rèn)為人工智能歸屬于計(jì)算機(jī)科學(xué)的范疇。人工智能企圖了解智能的實(shí)質(zhì),嘗試?yán)斫馊祟愂侨绾嗡伎己托袆?dòng)的,并生產(chǎn)出一種新的能夠以與人類智能相似方式做出反應(yīng)的智能機(jī)器。

·當(dāng)前,人工智能所覆蓋和服務(wù)的領(lǐng)域不斷擴(kuò)大,其發(fā)展離不開(kāi)計(jì)算科學(xué)、語(yǔ)言學(xué)、心理學(xué)、自動(dòng)化學(xué)乃至哲學(xué)等多種學(xué)科的交叉融合。目前人工智能領(lǐng)域比較成熟的機(jī)器人、圖像識(shí)別、自然語(yǔ)言處理以及專家系統(tǒng)等均需要其他學(xué)科理論的支撐。(e.g.聊天機(jī)器人、足式機(jī)器人)

·人工智能的愿景是讓機(jī)器勝任以往具有人類智能才能完成的復(fù)雜工作,而不是諸如工廠流水線機(jī)器生產(chǎn)那樣的“簡(jiǎn)單”工作。我們的期許是它模擬人類智能,延伸智力范圍,甚至響應(yīng)人類情感,目前這一領(lǐng)域仍然處于探索的初級(jí)階段。第1節(jié)人工智能簡(jiǎn)介

1.2人工智能的起源與發(fā)展·奠基:1950年,計(jì)算機(jī)科學(xué)家圖靈在《心智》期刊發(fā)表論文《計(jì)算機(jī)器與智能》(ComputingMachineryandIntelligence)圖靈在該文中,提出“圖靈測(cè)試”(如果被試者無(wú)法判斷人類與人工智能機(jī)器反應(yīng)的差別,即可認(rèn)定該機(jī)器具備人工智能),為后來(lái)的人工智能科學(xué)提供了開(kāi)創(chuàng)性的構(gòu)思?!ご_立:1956年美國(guó)達(dá)特茅斯人工智能夏季研討會(huì)“人工智能”這一術(shù)語(yǔ)的定義第一次被確立——人工智能就是要讓機(jī)器的行為看起來(lái)像是人所表現(xiàn)出來(lái)的智能行為一樣。同時(shí),它也標(biāo)志著人工智能學(xué)科的誕生。

1.2人工智能的起源與發(fā)展從人工智能概念提出至今已歷經(jīng)60多年,其發(fā)展經(jīng)歷了三個(gè)主要階段:·第一階段:1950s人工智能概念提出—1980s人工智能的第一個(gè)瓶頸期·由于計(jì)算機(jī)科技自身的發(fā)展,基于抽象數(shù)學(xué)推理的可編程數(shù)字計(jì)算機(jī)出現(xiàn)。此時(shí)的計(jì)算機(jī)完全按照編程邏輯執(zhí)行命令,科學(xué)家建立推理模型解決問(wèn)題?!な褂脵C(jī)械的符號(hào)模型難以對(duì)現(xiàn)實(shí)世界許多事情和過(guò)程完成建模。隨著計(jì)算任務(wù)的復(fù)雜性不斷加大,模型的復(fù)雜性也不斷加大,當(dāng)時(shí)的計(jì)算能力和理論水平無(wú)法支撐?!さ诙A段:1980s—1990s,人工智能的發(fā)展又經(jīng)歷了一次起落過(guò)程“起”:專家系統(tǒng)快速發(fā)展,數(shù)學(xué)模型有重大突破,可以把各領(lǐng)域?qū)<业闹R(shí)放到系統(tǒng)里提供決策支持?!奥洹保?990s末,因?qū)<蚁到y(tǒng)存在若干缺點(diǎn)(知識(shí)獲取、推理能力等不足;開(kāi)發(fā)成本高,需要多位相關(guān)領(lǐng)域?qū)<业闹С?;?jì)算機(jī)系統(tǒng)建模、建設(shè)門檻高),人工智能的發(fā)展又一次進(jìn)入低谷期?!さ谌A段:21世紀(jì)初至今,迎來(lái)了又一個(gè)繁榮時(shí)期隨著大數(shù)據(jù)的積聚、理論算法的革新、計(jì)算和存儲(chǔ)能力的提升,人工智能在很多應(yīng)用領(lǐng)域取得了突破性進(jìn)展。第1節(jié)人工智能簡(jiǎn)介

1.3人工智能的發(fā)展層次1.3.1弱人工智能“弱人工智能”指不能真正實(shí)現(xiàn)推理和解決問(wèn)題的智能機(jī)器,這些機(jī)器表現(xiàn)出一定的智能,但是并不真正擁有智能,也不會(huì)有自主意識(shí)。迄今為止的人工智能系統(tǒng)都是實(shí)現(xiàn)特定功能的專用智能,而不是像人類智能那樣能夠不斷適應(yīng)復(fù)雜的新環(huán)境并不斷涌現(xiàn)出新的功能,因此都屬于弱人工智能。

·運(yùn)算智能運(yùn)算智能主要是機(jī)器快速運(yùn)算和記憶存儲(chǔ)的能力。從與人的對(duì)比來(lái)看,運(yùn)算能力和存儲(chǔ)能力是機(jī)器的優(yōu)勢(shì)。(例:國(guó)際象棋程序“深藍(lán)”、圍棋程序AlphaGo)·感知智能感知智能側(cè)重視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感知能力,目的是使機(jī)器可以像人一樣具有這些感知能力,實(shí)現(xiàn)人機(jī)的交互。從感知智能這個(gè)角度,人工智能越來(lái)越接近人類。(例:語(yǔ)音對(duì)話機(jī)器人、四足機(jī)器人、自動(dòng)駕駛機(jī)器人)

1.3人工智能的發(fā)展層次1.3.2強(qiáng)人工智能“強(qiáng)人工智能”也稱“通用人工智能”“強(qiáng)人工智能”或“類人智能”,是指真正能思維的智能機(jī)器,并且這樣的機(jī)器是有知覺(jué)和自我意識(shí)的。強(qiáng)人工智能機(jī)器可分為兩大類:·類人:機(jī)器的思考和推理與人的思維類似。·非類人:機(jī)器產(chǎn)生了和人完全不一樣的知覺(jué)和意識(shí),使用和人完全不一樣的推理方式。

·認(rèn)知智能認(rèn)知智能是指機(jī)器能理解,并且會(huì)思考。概念、意識(shí)、觀念等都是人類認(rèn)知智能的表現(xiàn),如果機(jī)器自己能形成觀點(diǎn),那么就認(rèn)為其上升到了認(rèn)知智能的層次。目前機(jī)器在認(rèn)知智能這個(gè)層次與人類相比還有差距。

·創(chuàng)造智能在認(rèn)知智能之上的層次是創(chuàng)造智能。人與機(jī)器的區(qū)別恰恰在于人具有主動(dòng)創(chuàng)造的能力。如果想讓人工智能程序具有創(chuàng)造能力,技術(shù)上是極具挑戰(zhàn)性的。其技術(shù)上的突破點(diǎn)目前還尚未接近。

1.3.2強(qiáng)人工智能

·方法:圖靈測(cè)試采用問(wèn)答模式,觀察者與兩個(gè)測(cè)試對(duì)象對(duì)話(例如以打字的方式),測(cè)試對(duì)象中一個(gè)是人,另一個(gè)是機(jī)器。要求觀察者不斷提出各種問(wèn)題,從而判斷回答者是人還是機(jī)器。如果機(jī)器與觀察者的對(duì)話使得觀察者認(rèn)為他自己是與人對(duì)話,則認(rèn)為機(jī)器通過(guò)了圖靈測(cè)試。案例:判別聊天機(jī)器人的人工智能水平·實(shí)例展示問(wèn):你住在哪個(gè)國(guó)家?答:法國(guó)。

問(wèn):你們國(guó)家的首都是哪里?

答:北京。

問(wèn):你多大了?

答:32歲。

問(wèn):你的媽媽多大了?

答:35歲。第2節(jié)人工智能與智能媒體

2.1智能媒體的概念

·概念“智能媒體”是一種基于人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)手段實(shí)現(xiàn)的更為深入的新一代媒介融合產(chǎn)物。·特點(diǎn)智能媒體集“單向廣播+雙向交互+智能引擎”三種特點(diǎn)于一體,可以幫助人們更好地搜集、整理數(shù)量龐大的信息,用戶在輕松接受媒體信息的同時(shí)可以參與到媒體中并與其進(jìn)行交互。(時(shí)效性強(qiáng)、數(shù)據(jù)精準(zhǔn)、交互體驗(yàn)新穎)第2節(jié)人工智能與智能媒體

2.2智能化媒體傳播模式的核心邏輯人工智能給媒體行業(yè)帶來(lái)了從宏觀到微觀全方位的改變。

從信息采集環(huán)節(jié)、新聞編輯制作環(huán)節(jié)、新聞?wù)J知體驗(yàn)環(huán)節(jié)到內(nèi)容推送環(huán)節(jié)均發(fā)生行業(yè)生態(tài)環(huán)境的變化。人工智能與媒體結(jié)合,智能媒體的基本運(yùn)作范式也會(huì)從這四個(gè)方面進(jìn)行變革。

2.2智能化媒體傳播模式的核心邏輯2.2.1信息采集:擴(kuò)充渠道和數(shù)據(jù)量

·傳統(tǒng)媒體·新聞生產(chǎn)的主要模式路徑:“單一渠道采集、封閉式生產(chǎn)、點(diǎn)對(duì)面單向傳播”·在傳統(tǒng)媒體中,選題策劃篩選、大量的前期文案工作、實(shí)地調(diào)研、選擇并聯(lián)系采訪對(duì)象等煩瑣工作都與信息采集環(huán)節(jié)相關(guān)?!鹘y(tǒng)媒體中人工收集數(shù)據(jù)的體量偏小,來(lái)源渠道較為單一,而且時(shí)間成本較高,但是數(shù)據(jù)來(lái)源和質(zhì)量相對(duì)有保證。

·智能媒體·在智能媒體中,數(shù)據(jù)來(lái)源渠道的廣度可以大幅擴(kuò)充,可采集的數(shù)據(jù)量較之傳統(tǒng)媒體也有若干量級(jí)的提升。·各種新設(shè)備層出不窮(如物聯(lián)網(wǎng)的設(shè)備、傳感器、全球定位系統(tǒng)、無(wú)人機(jī)以及智能手環(huán)等),都可以不斷采集數(shù)據(jù)并匯入新聞系統(tǒng),提供新聞制作的數(shù)據(jù)原料。

2.2智能化媒體傳播模式的核心邏輯2.2.2內(nèi)容生產(chǎn):發(fā)現(xiàn)規(guī)律和線索

·傳統(tǒng)媒體·在傳統(tǒng)媒體中,內(nèi)容的優(yōu)勢(shì)顯著。一份尼爾森評(píng)級(jí)數(shù)據(jù)報(bào)告中顯示,在研究的上百萬(wàn)份社會(huì)化媒體樣本案例中,其中有近八成的內(nèi)容來(lái)源于傳統(tǒng)媒體公司。·在一些簡(jiǎn)短的財(cái)經(jīng)簡(jiǎn)報(bào)中,傳統(tǒng)媒體的內(nèi)容生產(chǎn)優(yōu)勢(shì)可能還不太明顯,當(dāng)涉及一些深度報(bào)道、調(diào)查性新聞以及人文情懷的文章時(shí),傳統(tǒng)媒體在內(nèi)容上的優(yōu)勢(shì)就顯示出來(lái)了。·智能媒體·現(xiàn)階段智能媒體的內(nèi)容生產(chǎn)在一定程度上還是要依賴于傳統(tǒng)媒體?!め槍?duì)海量數(shù)據(jù),我們從經(jīng)驗(yàn)上無(wú)法直接了解和發(fā)現(xiàn)線索時(shí),就可以使用多維數(shù)據(jù)的可視化工具,通過(guò)數(shù)據(jù)可視化,從數(shù)據(jù)展現(xiàn)出來(lái)的特點(diǎn),去挖掘數(shù)據(jù)背后的關(guān)系,整理故事線索。因此智能媒體能夠輔助發(fā)現(xiàn)數(shù)據(jù)的規(guī)律和價(jià)值。

2.2智能化媒體傳播模式的核心邏輯2.2.3認(rèn)知體驗(yàn)

在認(rèn)知體驗(yàn)環(huán)節(jié),智能媒體支持多媒體內(nèi)容的展現(xiàn),比如智能視頻剪輯和生成?!?yīng)用嘗試:自動(dòng)進(jìn)行視頻編輯的產(chǎn)品實(shí)驗(yàn)(斯坦福大學(xué))·功能:自動(dòng)編輯視頻+控制剪輯風(fēng)格·具體內(nèi)容:①程序可以準(zhǔn)確地識(shí)別出需要剪輯的內(nèi)容。系統(tǒng)會(huì)利用面部識(shí)別和情緒識(shí)別系統(tǒng),對(duì)每一幀畫面進(jìn)行分析,將所有鏡頭(包括多個(gè)角度拍攝的畫面)按照設(shè)定的腳本進(jìn)行組織;還能根據(jù)需求找到指定的內(nèi)容,比如會(huì)標(biāo)注某個(gè)鏡頭是廣角或特寫鏡頭,以及這些鏡頭中包含了哪些人物和角色。②在所有的元素都可以被組織之后,系統(tǒng)會(huì)按照不同的風(fēng)格和習(xí)慣對(duì)視頻進(jìn)行剪輯和處理。

2.2智能化媒體傳播模式的核心邏輯2.2.4內(nèi)容分發(fā)

·傳統(tǒng)媒體·傳統(tǒng)媒體由于面向新聞的大量生產(chǎn),依靠人工編輯傳播,導(dǎo)致其受眾細(xì)分或者個(gè)性化定制意識(shí)偏弱?!て浣Y(jié)果一方面使得傳統(tǒng)媒體用戶要額外花時(shí)間去篩選出自己感興趣的文章,另一方面卻有利于信息傳播的均衡?!っ嫦颉笆鼙姟保阂?guī)模較小,低頻靜態(tài),呈松散型聯(lián)系,商業(yè)價(jià)值較低。·智能媒體·現(xiàn)階段通過(guò)智能篩選的智能媒體新聞,在根據(jù)用戶喜好量身定制的同時(shí),也消除了用戶對(duì)其他新聞產(chǎn)生興趣的可能?!ぴ谥悄苊襟w推送的過(guò)程中,具體內(nèi)容推送的算法也會(huì)受到算法本身設(shè)定的干擾,其推送的內(nèi)容是否真的完美契合用戶喜好還有待探究。(曾在臉書工作過(guò)的人員透露:“臉書在推送時(shí)會(huì)適當(dāng)壓制保守傾向的內(nèi)容,推送較為自由傾向的內(nèi)容。”)·面向“用戶”:規(guī)模較大,高頻動(dòng)態(tài),呈緊密型聯(lián)系,商業(yè)價(jià)值較高。第2節(jié)人工智能與智能媒體

2.3人工智能與媒體的融合2.3.1人工智能輔助媒介生產(chǎn)·隨著相關(guān)應(yīng)用的逐漸發(fā)展,智能媒體融合越來(lái)越緊密:人工智能技術(shù)可以對(duì)海量數(shù)據(jù)進(jìn)行采集、整理和價(jià)值挖掘,發(fā)掘線索,優(yōu)化選題,以及輔助視頻編輯、實(shí)現(xiàn)投遞分發(fā)環(huán)節(jié)的個(gè)性化推薦。

2.3人工智能與媒體的融合2.3.2新聞自動(dòng)化

·通過(guò)人工智能、大數(shù)據(jù)、智能寫稿等技術(shù),可以幫助實(shí)現(xiàn)新聞的自動(dòng)化生產(chǎn),也可以對(duì)新聞內(nèi)容的真實(shí)性進(jìn)行有效核查,幫助確立新聞數(shù)據(jù)的權(quán)威性,從而利用自動(dòng)化新聞數(shù)據(jù)為信息來(lái)源渠道進(jìn)行把關(guān)?!?duì)于一些模式性比較強(qiáng)的新聞,如金融和體育類新聞,智能媒體已經(jīng)可以實(shí)現(xiàn)稿件的自動(dòng)化撰寫。例如騰訊公司開(kāi)發(fā)的寫作機(jī)器人Dreamwriter可以根據(jù)算法自動(dòng)生成稿件,一分鐘內(nèi)完成資訊整合并送達(dá)用戶。圖2.1寫作機(jī)器人Dreamwriter自動(dòng)撰寫的稿件摘錄第2節(jié)人工智能與智能媒體

2.4人工智能在媒體平臺(tái)中的應(yīng)用

·內(nèi)容生產(chǎn)平臺(tái)內(nèi)容生產(chǎn)平臺(tái)是人工智能時(shí)代智能媒體的基礎(chǔ),以機(jī)器人新聞最具代表性。通過(guò)自動(dòng)化進(jìn)行內(nèi)容生產(chǎn),可以將記者從煩瑣而簡(jiǎn)單的工作中解救出來(lái)?!ぶ悄芡扑推脚_(tái)智能推送平臺(tái)得益于大數(shù)據(jù)和智能推薦算法的有效結(jié)合,可以個(gè)性化匹配用戶的新聞需求,力求新聞投遞更加精準(zhǔn)、有效、合理?!び脩艟酆掀脚_(tái)用戶聚合平臺(tái)是基于內(nèi)容生產(chǎn)平臺(tái)和智能推送平臺(tái),例如推特、微博等社會(huì)化媒體平臺(tái),運(yùn)用有效的內(nèi)容和個(gè)性化的新聞分發(fā),對(duì)用戶進(jìn)行數(shù)據(jù)的深入發(fā)掘和分析,整理出更深度的用戶習(xí)慣,進(jìn)一步增加用戶黏性,讓用戶對(duì)產(chǎn)品產(chǎn)生依賴性的消費(fèi)習(xí)慣,從而進(jìn)行內(nèi)容的再生產(chǎn)。

第2節(jié)人工智能與智能媒體

2.5人工智能的技術(shù)表現(xiàn)“這一波人工智能的爆發(fā)首先橫掃了自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)這兩個(gè)領(lǐng)域。”——斯坦福大學(xué)人工智能實(shí)驗(yàn)室主任李飛飛這兩個(gè)領(lǐng)域也是智能媒體的主要技術(shù)體現(xiàn)。

·自然語(yǔ)言處理·在這一領(lǐng)域最為常見(jiàn)的就是語(yǔ)音識(shí)別技術(shù),它是一個(gè)基礎(chǔ)性的技術(shù)。·今后,隨著語(yǔ)音識(shí)別技術(shù)的提高和廣泛應(yīng)用,或許能改變?nèi)祟惻c所有設(shè)備之間的交互方式?!ぴ谥悄苊襟w中,語(yǔ)音識(shí)別技術(shù)和傳感器的結(jié)合,可以更為有效快速地搜集和捕捉信息數(shù)據(jù),提高信息準(zhǔn)確度。·語(yǔ)音識(shí)別技術(shù)也可以為記者提高寫作效率。例如,科大訊飛公司旗下產(chǎn)品“訊飛聽(tīng)見(jiàn)”可以實(shí)現(xiàn)長(zhǎng)時(shí)間錄音內(nèi)容的轉(zhuǎn)文字處理,其精準(zhǔn)度也在不斷地提高。

2.5人工智能的技術(shù)表現(xiàn)

·計(jì)算機(jī)視覺(jué)領(lǐng)域·在這一領(lǐng)域最為常見(jiàn)的就是各項(xiàng)智能識(shí)別技術(shù),例如人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別等,除此之外還有各項(xiàng)視覺(jué)支持技術(shù)?!ぴ谥悄苊襟w中,計(jì)算機(jī)視覺(jué)領(lǐng)域的技術(shù)可以得到廣泛應(yīng)用。例如在參會(huì)人員眾多的會(huì)議中,利用人臉識(shí)別技術(shù)去鎖定被采訪對(duì)象,幫助記者采集新聞素材。·在新聞體驗(yàn)環(huán)節(jié),利用虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)等技術(shù),可以為用戶打造全新的新聞體驗(yàn)場(chǎng)所,營(yíng)造出身臨其境的效果,更為有效地還原新聞現(xiàn)場(chǎng)。第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人新聞寫作機(jī)器人(寫稿機(jī)器人)是人工智能技術(shù)在媒體實(shí)際應(yīng)用中的代表,也是最為直觀、廣泛的人工智能技術(shù)產(chǎn)品。新聞寫作機(jī)器人在國(guó)外的應(yīng)用要早于國(guó)內(nèi):·早在2010年一家名為NarrativeScience的公司就研發(fā)出一款名為Quill的新聞自動(dòng)寫作程序·

《洛杉磯時(shí)報(bào)》最早將這一技術(shù)引入實(shí)際的新聞生產(chǎn)中去·2014年,人工智能編輯WordSmith在美聯(lián)社正式上線·在國(guó)內(nèi),最早應(yīng)用新聞寫作機(jī)器人的機(jī)構(gòu)是騰訊財(cái)經(jīng)。2015年9月,騰訊財(cái)經(jīng)Dreamwriter寫作機(jī)器人生產(chǎn)了第一篇國(guó)內(nèi)自動(dòng)化新聞稿件。應(yīng)用:現(xiàn)階段,無(wú)論國(guó)內(nèi)還是國(guó)外,新聞寫作機(jī)器人主要應(yīng)用于財(cái)經(jīng)新聞、體育新聞等領(lǐng)域的新聞生產(chǎn)中,這類新聞的共性是以數(shù)據(jù)信息為主、對(duì)時(shí)效性要求高、字?jǐn)?shù)少。第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.1自動(dòng)化新聞及其原理3.1.1自動(dòng)化新聞的相關(guān)要素

·技術(shù)儲(chǔ)備大數(shù)據(jù)(數(shù)據(jù)來(lái)源、原材料)算法(擬人化寫作)·相關(guān)人群記者(深度報(bào)道、專業(yè)報(bào)道)編輯(記者稿件VS機(jī)器人稿件)讀者·發(fā)展出口應(yīng)用(寫稿機(jī)器人)理論(學(xué)界進(jìn)行理論研究)圖3.1自動(dòng)化新聞的相關(guān)要素

3.1自動(dòng)化新聞及其原理3.1.2自動(dòng)化新聞的概念

·自動(dòng)化新聞·“自動(dòng)化新聞”(automatedjournalism)也被稱為“算法新聞”(algorithmicjournalism)或“機(jī)器人新聞”(robotjournalism),是建立在算法和人工智能程序平臺(tái)和自然語(yǔ)言處理技術(shù)的基礎(chǔ)上的新型新聞生產(chǎn)模式?!懜鍣C(jī)器人·自動(dòng)化新聞中用來(lái)生產(chǎn)內(nèi)容的程序叫作寫稿機(jī)器人。

·自動(dòng)化新聞VS寫稿機(jī)器人(同一過(guò)程,側(cè)重角度不同)·自動(dòng)化新聞——過(guò)程和產(chǎn)品的角度新聞是自動(dòng)化新聞生產(chǎn)的最終產(chǎn)品,自動(dòng)化則指整個(gè)生產(chǎn)過(guò)程涉及的人力較少、計(jì)算力比較多·寫稿機(jī)器人——算法和生產(chǎn)的邏輯角度機(jī)器人則是具體的生產(chǎn)者

3.1自動(dòng)化新聞及其原理3.1.3自動(dòng)化新聞的特征

·最主要的特征:從數(shù)據(jù)源自動(dòng)獲取數(shù)據(jù),使用算法來(lái)進(jìn)行內(nèi)容整合,并完成擬人化的內(nèi)容生產(chǎn),即新聞的文字及部分視覺(jué)內(nèi)容可以由算法直接、自動(dòng)生成。

·寫稿機(jī)器人可以和記者做的深度報(bào)道、情感溝通等方面進(jìn)行互補(bǔ)。圖3.2自動(dòng)化新聞案例

3.1自動(dòng)化新聞及其原理3.1.4自動(dòng)化新聞的生產(chǎn)過(guò)程①在數(shù)據(jù)庫(kù)及其他數(shù)據(jù)來(lái)源處檢索并鎖定與報(bào)道主題相關(guān)的數(shù)據(jù)。數(shù)據(jù)來(lái)源可能是生產(chǎn)者系統(tǒng)內(nèi)部的,也可能是外部數(shù)據(jù)源(如股票交易所、體育比賽主辦方等)。

②對(duì)原始數(shù)據(jù)進(jìn)行整理和分類。原始數(shù)據(jù)往往并不是直接可用的,一般需要對(duì)原始數(shù)據(jù)進(jìn)行清洗、整理和分類,舍去無(wú)用數(shù)據(jù)。

③通過(guò)排序、比較和聚合數(shù)據(jù)來(lái)明確新聞故事的關(guān)鍵事實(shí)。

④按照某種敘事的語(yǔ)義結(jié)構(gòu)對(duì)關(guān)鍵事實(shí)進(jìn)行組織。不同產(chǎn)業(yè)、行業(yè)的文章,有不同的敘事結(jié)構(gòu),稱為“模板”,例如體育類新聞和財(cái)經(jīng)類新聞的敘事模板就大不相同。

⑤對(duì)最終形成的文本內(nèi)容進(jìn)行審核,完成分發(fā)和出版,同時(shí)可以按照需要提供不同風(fēng)格、語(yǔ)言和語(yǔ)法復(fù)雜程度的產(chǎn)品。

3.1.4自動(dòng)化新聞的生產(chǎn)過(guò)程

圖3.3自動(dòng)化新聞的生產(chǎn)第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.2自動(dòng)化新聞的發(fā)展和應(yīng)用3.2.1發(fā)展現(xiàn)狀:歐美美國(guó)的自動(dòng)化新聞發(fā)展較早。截至2018年初,歐美幾乎所有的主流新聞機(jī)構(gòu)都已經(jīng)建立起了一定程度的自動(dòng)化新聞生產(chǎn)平臺(tái)。·美聯(lián)社與WordSmith·自動(dòng)捕捉最新財(cái)經(jīng)數(shù)據(jù)→運(yùn)用美聯(lián)社預(yù)設(shè)的新聞框架→數(shù)據(jù)內(nèi)容填充→財(cái)經(jīng)簡(jiǎn)報(bào)

“人工寫一篇類似自動(dòng)化新聞的簡(jiǎn)單財(cái)報(bào)大約需要記者和編輯耗費(fèi)30分鐘,在使用自動(dòng)化寫作軟件前,我的65位員工每季度大約只能寫300篇報(bào)道,現(xiàn)在我們卻能完成3700篇?!薄缆?lián)社全球商業(yè)總編麗莎·吉布斯

美聯(lián)社副總裁吉姆·肯尼迪曾表示,讓寫稿機(jī)器人不再需要人工的最終審核而達(dá)到直接發(fā)稿的水平是他們的終極目標(biāo)。

3.2.1發(fā)展現(xiàn)狀:歐美

·里程碑事件·事件:2014年3月7日《洛杉磯時(shí)報(bào)》對(duì)當(dāng)天早晨一場(chǎng)4.7級(jí)地震的自動(dòng)化報(bào)道。·成果:此文稿完全由計(jì)算機(jī)程序Quakebot生成,在這次地震發(fā)生后僅三分鐘內(nèi)就實(shí)現(xiàn)了全文的發(fā)布,且在形式上與人類記者撰寫的報(bào)道幾乎沒(méi)有任何差別。Quakebot使得《洛杉磯時(shí)報(bào)》成為最早報(bào)道此次地震的媒體?!ぴ恚篞uakebot從GeologicalSurvey獲取關(guān)于地震的原始數(shù)據(jù),只要地震的級(jí)別大于某一個(gè)閾值,就會(huì)把相應(yīng)的數(shù)據(jù)抽出來(lái),把它放在預(yù)置好的模板中去,然后送到《洛杉磯時(shí)報(bào)》的系統(tǒng)里,經(jīng)過(guò)人工審核后即可進(jìn)行發(fā)布。

3.2自動(dòng)化新聞的發(fā)展和應(yīng)用3.2.2發(fā)展現(xiàn)狀:中國(guó)·新華社與“快筆小新”·工作流程和特點(diǎn):①采集清洗。依托大數(shù)據(jù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)采集、清洗和標(biāo)準(zhǔn)化處理,不同來(lái)源的數(shù)據(jù)格式往往不同。②計(jì)算分析。根據(jù)業(yè)務(wù)需求定制相應(yīng)的算法模型,對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)計(jì)算和分析。

③模板匹配。“快筆小新”會(huì)根據(jù)計(jì)算和分析結(jié)果選取合適的模板,生成中文新聞置標(biāo)語(yǔ)言標(biāo)準(zhǔn)(CNML)的稿件自動(dòng)進(jìn)入待編稿庫(kù),供編輯審核后簽發(fā)。

·“快筆小新”如何避免稿件的千篇一律?①進(jìn)行模板的定制。不同事件有不同寫法,可以根據(jù)事件本身的情況來(lái)選擇一個(gè)相應(yīng)的稿件模板,進(jìn)行內(nèi)容創(chuàng)作。(不同事件有不同的模板權(quán)重)②為了支持模板,可建立更加完善的歷史數(shù)據(jù)庫(kù)。(財(cái)經(jīng)類的季報(bào)、年報(bào)、歷史報(bào)價(jià)等數(shù)據(jù)庫(kù),體育類的賽事、運(yùn)動(dòng)員基本資料等數(shù)據(jù)庫(kù))③針對(duì)業(yè)務(wù)報(bào)道需求,研發(fā)計(jì)算同比、環(huán)比、指數(shù)、累計(jì)進(jìn)球數(shù)、積分排名等各種指標(biāo)的歷史統(tǒng)計(jì)模型、趨勢(shì)分析模型等,提高報(bào)道內(nèi)容的豐富性。

3.2.2發(fā)展現(xiàn)狀:中國(guó)

·《光明日?qǐng)?bào)》與“光明小明”·亮點(diǎn):自然語(yǔ)言處理技術(shù)的應(yīng)用(人機(jī)對(duì)話、人性化溝通)·交互方式突破:傳統(tǒng)方式:用戶閱讀新聞(單向傳播,被支配地位)小明:溝通、對(duì)話、交流(雙向傳播,平等)·更多功能:“光明小明”還可以通過(guò)圖片識(shí)別出相關(guān)內(nèi)容的背景資料。比如當(dāng)用戶把一名NBA球星的照片發(fā)給小明,它可以很快地告訴用戶他是誰(shuí),以及相關(guān)的其他資料信息?!靶∶髂愫?!我想查詢今天北京的空氣質(zhì)量指數(shù)?!毙∶鳎夯卮稹獭澳敲瓷钲谀兀俊毙∶鳎夯卮稹坛绦蝾A(yù)設(shè)×自主學(xué)習(xí)√第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.3自動(dòng)化新聞的技術(shù)難點(diǎn)自動(dòng)化新聞的核心技術(shù)是自然語(yǔ)言理解,同時(shí)會(huì)涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、深度學(xué)習(xí)、知識(shí)圖譜等多項(xiàng)技術(shù)?!ぜ夹g(shù)難點(diǎn)·學(xué)習(xí)和模擬文字這種相比語(yǔ)音、視頻等更抽象的交流方式并用于內(nèi)容生產(chǎn)。(文法和語(yǔ)法正確、不生硬、與時(shí)俱進(jìn)、通俗易懂)

·語(yǔ)言具有復(fù)雜性,同一句話可能代表不同含義,例如反諷、暗喻等方式。正確理解人類語(yǔ)言還要有足夠的背景知識(shí),比如對(duì)成語(yǔ)和歇后語(yǔ)的理解?!八某煽?jī)不能更好了”贊美?嘲笑?第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.4自動(dòng)化新聞的發(fā)展前景·添加語(yǔ)境資料。為了讓寫稿機(jī)器人制作的稿件更加生動(dòng)、擬人化,支持的場(chǎng)景和領(lǐng)域更多,需要考慮為自動(dòng)化新聞添加語(yǔ)境資料,方便其得出較為復(fù)雜的結(jié)論。

·核查與修正數(shù)據(jù)自身的偏向性。與記者相比,由于寫稿機(jī)器人的技術(shù)門檻較高,算法對(duì)數(shù)據(jù)的使用是否有偏向性、是否是透明的,往往受到公眾質(zhì)疑?!ぬ岣邤?shù)據(jù)本身的可解釋性。通常,人工的稿件往往需要注明所引數(shù)據(jù)的來(lái)源,但是對(duì)于一些自動(dòng)化新聞來(lái)說(shuō),由于其數(shù)據(jù)來(lái)源比較多,精確地標(biāo)出每一個(gè)數(shù)據(jù)源也存在一定的技術(shù)挑戰(zhàn)?!て渌?。算法甚至有望實(shí)現(xiàn)對(duì)圖像數(shù)據(jù)的讀取和結(jié)構(gòu)化,利用多媒體素材,更好地組織內(nèi)容生產(chǎn),提高語(yǔ)言的豐富程度,并且進(jìn)一步提升擬人化水平。第4節(jié)自動(dòng)事實(shí)核查

4.1自動(dòng)事實(shí)核查的概念和發(fā)展現(xiàn)狀

·事實(shí)的含義事實(shí)應(yīng)該與客觀現(xiàn)實(shí)一致并且可以被證據(jù)證明。·人工核查的不足當(dāng)前,假新聞和謠言在互聯(lián)網(wǎng)上傳播和擴(kuò)散,正是由于其與事實(shí)不符或者故意混淆事實(shí),導(dǎo)致了受眾的誤解、困惑甚至恐慌。而人工核查的方式在面對(duì)大量假新聞和謠言時(shí)又顯得力不從心。·自動(dòng)事實(shí)核查·是指將人工智能技術(shù)應(yīng)用于自動(dòng)事實(shí)核查。同時(shí),也與人工信息核查流程相融合和交叉驗(yàn)證,以便實(shí)現(xiàn)更準(zhǔn)確的核查效果。·關(guān)于自動(dòng)事實(shí)核查的研究得到了越來(lái)越多的資金支持。(事實(shí)核查慈善機(jī)構(gòu)FullFact獲得來(lái)自谷歌公司的5萬(wàn)歐元經(jīng)費(fèi)支持,杜克大學(xué)的杜克記者實(shí)驗(yàn)室獲得來(lái)自奈特基金會(huì)等機(jī)構(gòu)120萬(wàn)美元的資金支持,用于啟動(dòng)“科技與核查合作”項(xiàng)目)第4節(jié)自動(dòng)事實(shí)核查

4.2自動(dòng)事實(shí)核查的目標(biāo)、路徑和研究發(fā)現(xiàn)4.2.1自動(dòng)事實(shí)核查的目標(biāo)·【識(shí)別】嘗試發(fā)現(xiàn)網(wǎng)絡(luò)上流傳的虛假或可疑信息·該目標(biāo)的作用是從網(wǎng)絡(luò)上海量的信息中篩選出可能的不實(shí)消息,縮小核查范圍,否則后續(xù)的自動(dòng)事實(shí)核查將面臨數(shù)據(jù)量過(guò)大、對(duì)計(jì)算資源要求太高的困境?!?shù)據(jù)在現(xiàn)有的海量體量基礎(chǔ)上仍迅速增長(zhǎng),逐條核查互聯(lián)網(wǎng)上的全部數(shù)據(jù)不可行,需要設(shè)計(jì)合理算法和規(guī)則來(lái)快速發(fā)現(xiàn)虛假信息。·由于人工核查準(zhǔn)確率高,通常會(huì)實(shí)行人工核查與機(jī)器核查相結(jié)合的方式。·【檢驗(yàn)】核實(shí)有疑問(wèn)的信息,為記者和公眾成員的信息核實(shí)提供便利·當(dāng)公眾或?qū)I(yè)記者對(duì)現(xiàn)有消息存疑,可尋求事實(shí)核查系統(tǒng)的幫助,核對(duì)存疑消息?!ひ虼?,自動(dòng)事實(shí)核查系統(tǒng)需要保證較高的準(zhǔn)確性和有效性,保證公眾得到的是權(quán)威回答。·【糾正】通過(guò)不同的媒體平臺(tái)將

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論