《算法新聞》課件第十二章人工智能與推薦系統(tǒng)

上傳人：1*** IP屬地：廣東上傳時(shí)間：2022-12-04 格式：PPTX 頁(yè)數(shù)：38 大?。?82.62KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩33頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1節(jié)人工智能簡(jiǎn)介

1.1人工智能的概念1.1.1從AlphaGo到AlphaGoZero·AlphaGo是一個(gè)人工智能圍棋程序，由谷歌旗下的DeepMind公司開(kāi)發(fā)，其技術(shù)原理是深度學(xué)習(xí)。AlphaGo結(jié)合了數(shù)百萬(wàn)圍棋專家的棋譜，使用監(jiān)督學(xué)習(xí)進(jìn)行自我訓(xùn)練。2016年AlphaGo以總分4:1勝圍棋九段選手李世石，2017年以總分3:1勝柯潔?！?017年10月DeepMind團(tuán)隊(duì)公布了最強(qiáng)版阿爾法圍棋，代號(hào)為AlphaGoZero，其特點(diǎn)是“自學(xué)成才”。AlphaGoZero則不需要事前訓(xùn)練。其原理是從單一神經(jīng)網(wǎng)絡(luò)開(kāi)始，通過(guò)神經(jīng)網(wǎng)絡(luò)強(qiáng)大的搜索算法，進(jìn)行自我對(duì)弈。神經(jīng)網(wǎng)絡(luò)通過(guò)逐漸調(diào)整，提升預(yù)測(cè)下一步的能力，最終贏得比賽?！?qiáng)化學(xué)習(xí)主要有三部分內(nèi)容：①?zèng)Q策過(guò)程——決定落子動(dòng)作②獎(jiǎng)勵(lì)系統(tǒng)——判斷落子動(dòng)作是否對(duì)贏得棋局有幫助，若有，則會(huì)給模型加分③系列動(dòng)作的學(xué)習(xí)——用以在比賽中獲勝

1.1人工智能的概念1.1.2人工智能概念的界定有人認(rèn)為……·像人一樣思考、行動(dòng)的系統(tǒng)就是人工智能系統(tǒng)。·人工智能是機(jī)器展現(xiàn)出某種“智能”特征?！と绻麛?shù)字計(jì)算機(jī)及其控制的機(jī)器人能執(zhí)行智能生物的某些任務(wù)即可認(rèn)為其具備了人工智能?！と斯ぶ悄苁怯?jì)算機(jī)學(xué)科的一個(gè)分支，機(jī)器人、專家系統(tǒng)、語(yǔ)音和圖像識(shí)別以及自然語(yǔ)言處理等均屬于人工智能研究的領(lǐng)域?！叭斯ぶ悄苁抢脭?shù)字計(jì)算機(jī)或者數(shù)字計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能，感知環(huán)境、獲取知識(shí)并使用知識(shí)獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)”?！袊?guó)電子技術(shù)標(biāo)準(zhǔn)化研究院《人工智能標(biāo)準(zhǔn)化白皮書》（2018年1月）→此解釋將理論、方法、概念、技術(shù)和應(yīng)用系統(tǒng)整合在一起表述人工智能，完整地界定了人工智能的范疇。

1.1人工智能的概念1.1.3人工智能概念的解讀·從學(xué)科劃分的角度來(lái)理解，目前一般認(rèn)為人工智能歸屬于計(jì)算機(jī)科學(xué)的范疇。人工智能企圖了解智能的實(shí)質(zhì)，嘗試?yán)斫馊祟愂侨绾嗡伎己托袆?dòng)的，并生產(chǎn)出一種新的能夠以與人類智能相似方式做出反應(yīng)的智能機(jī)器。

·當(dāng)前，人工智能所覆蓋和服務(wù)的領(lǐng)域不斷擴(kuò)大，其發(fā)展離不開(kāi)計(jì)算科學(xué)、語(yǔ)言學(xué)、心理學(xué)、自動(dòng)化學(xué)乃至哲學(xué)等多種學(xué)科的交叉融合。目前人工智能領(lǐng)域比較成熟的機(jī)器人、圖像識(shí)別、自然語(yǔ)言處理以及專家系統(tǒng)等均需要其他學(xué)科理論的支撐。（e.g.聊天機(jī)器人、足式機(jī)器人）

·人工智能的愿景是讓機(jī)器勝任以往具有人類智能才能完成的復(fù)雜工作，而不是諸如工廠流水線機(jī)器生產(chǎn)那樣的“簡(jiǎn)單”工作。我們的期許是它模擬人類智能，延伸智力范圍，甚至響應(yīng)人類情感，目前這一領(lǐng)域仍然處于探索的初級(jí)階段。第1節(jié)人工智能簡(jiǎn)介

1.2人工智能的起源與發(fā)展·奠基：1950年，計(jì)算機(jī)科學(xué)家圖靈在《心智》期刊發(fā)表論文《計(jì)算機(jī)器與智能》（ComputingMachineryandIntelligence）圖靈在該文中，提出“圖靈測(cè)試”（如果被試者無(wú)法判斷人類與人工智能機(jī)器反應(yīng)的差別，即可認(rèn)定該機(jī)器具備人工智能），為后來(lái)的人工智能科學(xué)提供了開(kāi)創(chuàng)性的構(gòu)思?！ご_立：1956年美國(guó)達(dá)特茅斯人工智能夏季研討會(huì)“人工智能”這一術(shù)語(yǔ)的定義第一次被確立——人工智能就是要讓機(jī)器的行為看起來(lái)像是人所表現(xiàn)出來(lái)的智能行為一樣。同時(shí)，它也標(biāo)志著人工智能學(xué)科的誕生。

1.2人工智能的起源與發(fā)展從人工智能概念提出至今已歷經(jīng)60多年，其發(fā)展經(jīng)歷了三個(gè)主要階段：·第一階段：1950s人工智能概念提出—1980s人工智能的第一個(gè)瓶頸期·由于計(jì)算機(jī)科技自身的發(fā)展，基于抽象數(shù)學(xué)推理的可編程數(shù)字計(jì)算機(jī)出現(xiàn)。此時(shí)的計(jì)算機(jī)完全按照編程邏輯執(zhí)行命令，科學(xué)家建立推理模型解決問(wèn)題?！な褂脵C(jī)械的符號(hào)模型難以對(duì)現(xiàn)實(shí)世界許多事情和過(guò)程完成建模。隨著計(jì)算任務(wù)的復(fù)雜性不斷加大，模型的復(fù)雜性也不斷加大，當(dāng)時(shí)的計(jì)算能力和理論水平無(wú)法支撐?！さ诙A段：1980s—1990s，人工智能的發(fā)展又經(jīng)歷了一次起落過(guò)程“起”：專家系統(tǒng)快速發(fā)展，數(shù)學(xué)模型有重大突破，可以把各領(lǐng)域?qū)＜业闹R(shí)放到系統(tǒng)里提供決策支持?！奥洹保?990s末，因?qū)＜蚁到y(tǒng)存在若干缺點(diǎn)（知識(shí)獲取、推理能力等不足；開(kāi)發(fā)成本高，需要多位相關(guān)領(lǐng)域?qū)＜业闹С?；?jì)算機(jī)系統(tǒng)建模、建設(shè)門檻高），人工智能的發(fā)展又一次進(jìn)入低谷期?！さ谌A段：21世紀(jì)初至今，迎來(lái)了又一個(gè)繁榮時(shí)期隨著大數(shù)據(jù)的積聚、理論算法的革新、計(jì)算和存儲(chǔ)能力的提升，人工智能在很多應(yīng)用領(lǐng)域取得了突破性進(jìn)展。第1節(jié)人工智能簡(jiǎn)介

1.3人工智能的發(fā)展層次1.3.1弱人工智能“弱人工智能”指不能真正實(shí)現(xiàn)推理和解決問(wèn)題的智能機(jī)器，這些機(jī)器表現(xiàn)出一定的智能，但是并不真正擁有智能，也不會(huì)有自主意識(shí)。迄今為止的人工智能系統(tǒng)都是實(shí)現(xiàn)特定功能的專用智能，而不是像人類智能那樣能夠不斷適應(yīng)復(fù)雜的新環(huán)境并不斷涌現(xiàn)出新的功能，因此都屬于弱人工智能。

·運(yùn)算智能運(yùn)算智能主要是機(jī)器快速運(yùn)算和記憶存儲(chǔ)的能力。從與人的對(duì)比來(lái)看，運(yùn)算能力和存儲(chǔ)能力是機(jī)器的優(yōu)勢(shì)。（例：國(guó)際象棋程序“深藍(lán)”、圍棋程序AlphaGo）·感知智能感知智能側(cè)重視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感知能力，目的是使機(jī)器可以像人一樣具有這些感知能力，實(shí)現(xiàn)人機(jī)的交互。從感知智能這個(gè)角度，人工智能越來(lái)越接近人類。（例：語(yǔ)音對(duì)話機(jī)器人、四足機(jī)器人、自動(dòng)駕駛機(jī)器人）

1.3人工智能的發(fā)展層次1.3.2強(qiáng)人工智能“強(qiáng)人工智能”也稱“通用人工智能”“強(qiáng)人工智能”或“類人智能”，是指真正能思維的智能機(jī)器，并且這樣的機(jī)器是有知覺(jué)和自我意識(shí)的。強(qiáng)人工智能機(jī)器可分為兩大類：·類人：機(jī)器的思考和推理與人的思維類似。·非類人：機(jī)器產(chǎn)生了和人完全不一樣的知覺(jué)和意識(shí)，使用和人完全不一樣的推理方式。

·認(rèn)知智能認(rèn)知智能是指機(jī)器能理解，并且會(huì)思考。概念、意識(shí)、觀念等都是人類認(rèn)知智能的表現(xiàn)，如果機(jī)器自己能形成觀點(diǎn)，那么就認(rèn)為其上升到了認(rèn)知智能的層次。目前機(jī)器在認(rèn)知智能這個(gè)層次與人類相比還有差距。

·創(chuàng)造智能在認(rèn)知智能之上的層次是創(chuàng)造智能。人與機(jī)器的區(qū)別恰恰在于人具有主動(dòng)創(chuàng)造的能力。如果想讓人工智能程序具有創(chuàng)造能力，技術(shù)上是極具挑戰(zhàn)性的。其技術(shù)上的突破點(diǎn)目前還尚未接近。

1.3.2強(qiáng)人工智能

·方法：圖靈測(cè)試采用問(wèn)答模式，觀察者與兩個(gè)測(cè)試對(duì)象對(duì)話（例如以打字的方式），測(cè)試對(duì)象中一個(gè)是人，另一個(gè)是機(jī)器。要求觀察者不斷提出各種問(wèn)題，從而判斷回答者是人還是機(jī)器。如果機(jī)器與觀察者的對(duì)話使得觀察者認(rèn)為他自己是與人對(duì)話，則認(rèn)為機(jī)器通過(guò)了圖靈測(cè)試。案例：判別聊天機(jī)器人的人工智能水平·實(shí)例展示問(wèn)：你住在哪個(gè)國(guó)家？答：法國(guó)。

問(wèn)：你們國(guó)家的首都是哪里？

答：北京。

問(wèn)：你多大了？

答：32歲。

問(wèn)：你的媽媽多大了？

答：35歲。第2節(jié)人工智能與智能媒體

2.1智能媒體的概念

·概念“智能媒體”是一種基于人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)手段實(shí)現(xiàn)的更為深入的新一代媒介融合產(chǎn)物。·特點(diǎn)智能媒體集“單向廣播＋雙向交互＋智能引擎”三種特點(diǎn)于一體，可以幫助人們更好地搜集、整理數(shù)量龐大的信息，用戶在輕松接受媒體信息的同時(shí)可以參與到媒體中并與其進(jìn)行交互。（時(shí)效性強(qiáng)、數(shù)據(jù)精準(zhǔn)、交互體驗(yàn)新穎）第2節(jié)人工智能與智能媒體

2.2智能化媒體傳播模式的核心邏輯人工智能給媒體行業(yè)帶來(lái)了從宏觀到微觀全方位的改變。

從信息采集環(huán)節(jié)、新聞編輯制作環(huán)節(jié)、新聞?wù)J知體驗(yàn)環(huán)節(jié)到內(nèi)容推送環(huán)節(jié)均發(fā)生行業(yè)生態(tài)環(huán)境的變化。人工智能與媒體結(jié)合，智能媒體的基本運(yùn)作范式也會(huì)從這四個(gè)方面進(jìn)行變革。

2.2智能化媒體傳播模式的核心邏輯2.2.1信息采集：擴(kuò)充渠道和數(shù)據(jù)量

·傳統(tǒng)媒體·新聞生產(chǎn)的主要模式路徑：“單一渠道采集、封閉式生產(chǎn)、點(diǎn)對(duì)面單向傳播”·在傳統(tǒng)媒體中，選題策劃篩選、大量的前期文案工作、實(shí)地調(diào)研、選擇并聯(lián)系采訪對(duì)象等煩瑣工作都與信息采集環(huán)節(jié)相關(guān)?！鹘y(tǒng)媒體中人工收集數(shù)據(jù)的體量偏小，來(lái)源渠道較為單一，而且時(shí)間成本較高，但是數(shù)據(jù)來(lái)源和質(zhì)量相對(duì)有保證。

·智能媒體·在智能媒體中，數(shù)據(jù)來(lái)源渠道的廣度可以大幅擴(kuò)充，可采集的數(shù)據(jù)量較之傳統(tǒng)媒體也有若干量級(jí)的提升。·各種新設(shè)備層出不窮（如物聯(lián)網(wǎng)的設(shè)備、傳感器、全球定位系統(tǒng)、無(wú)人機(jī)以及智能手環(huán)等），都可以不斷采集數(shù)據(jù)并匯入新聞系統(tǒng)，提供新聞制作的數(shù)據(jù)原料。

2.2智能化媒體傳播模式的核心邏輯2.2.2內(nèi)容生產(chǎn)：發(fā)現(xiàn)規(guī)律和線索

·傳統(tǒng)媒體·在傳統(tǒng)媒體中，內(nèi)容的優(yōu)勢(shì)顯著。一份尼爾森評(píng)級(jí)數(shù)據(jù)報(bào)告中顯示，在研究的上百萬(wàn)份社會(huì)化媒體樣本案例中，其中有近八成的內(nèi)容來(lái)源于傳統(tǒng)媒體公司。·在一些簡(jiǎn)短的財(cái)經(jīng)簡(jiǎn)報(bào)中，傳統(tǒng)媒體的內(nèi)容生產(chǎn)優(yōu)勢(shì)可能還不太明顯，當(dāng)涉及一些深度報(bào)道、調(diào)查性新聞以及人文情懷的文章時(shí)，傳統(tǒng)媒體在內(nèi)容上的優(yōu)勢(shì)就顯示出來(lái)了。·智能媒體·現(xiàn)階段智能媒體的內(nèi)容生產(chǎn)在一定程度上還是要依賴于傳統(tǒng)媒體?！め槍?duì)海量數(shù)據(jù)，我們從經(jīng)驗(yàn)上無(wú)法直接了解和發(fā)現(xiàn)線索時(shí)，就可以使用多維數(shù)據(jù)的可視化工具，通過(guò)數(shù)據(jù)可視化，從數(shù)據(jù)展現(xiàn)出來(lái)的特點(diǎn)，去挖掘數(shù)據(jù)背后的關(guān)系，整理故事線索。因此智能媒體能夠輔助發(fā)現(xiàn)數(shù)據(jù)的規(guī)律和價(jià)值。

2.2智能化媒體傳播模式的核心邏輯2.2.3認(rèn)知體驗(yàn)

在認(rèn)知體驗(yàn)環(huán)節(jié)，智能媒體支持多媒體內(nèi)容的展現(xiàn)，比如智能視頻剪輯和生成?！?yīng)用嘗試：自動(dòng)進(jìn)行視頻編輯的產(chǎn)品實(shí)驗(yàn)（斯坦福大學(xué)）·功能：自動(dòng)編輯視頻+控制剪輯風(fēng)格·具體內(nèi)容：①程序可以準(zhǔn)確地識(shí)別出需要剪輯的內(nèi)容。系統(tǒng)會(huì)利用面部識(shí)別和情緒識(shí)別系統(tǒng)，對(duì)每一幀畫面進(jìn)行分析，將所有鏡頭（包括多個(gè)角度拍攝的畫面）按照設(shè)定的腳本進(jìn)行組織；還能根據(jù)需求找到指定的內(nèi)容，比如會(huì)標(biāo)注某個(gè)鏡頭是廣角或特寫鏡頭，以及這些鏡頭中包含了哪些人物和角色。②在所有的元素都可以被組織之后，系統(tǒng)會(huì)按照不同的風(fēng)格和習(xí)慣對(duì)視頻進(jìn)行剪輯和處理。

2.2智能化媒體傳播模式的核心邏輯2.2.4內(nèi)容分發(fā)

·傳統(tǒng)媒體·傳統(tǒng)媒體由于面向新聞的大量生產(chǎn)，依靠人工編輯傳播，導(dǎo)致其受眾細(xì)分或者個(gè)性化定制意識(shí)偏弱?！て浣Y(jié)果一方面使得傳統(tǒng)媒體用戶要額外花時(shí)間去篩選出自己感興趣的文章，另一方面卻有利于信息傳播的均衡?！っ嫦颉笆鼙姟保阂?guī)模較小，低頻靜態(tài)，呈松散型聯(lián)系，商業(yè)價(jià)值較低。·智能媒體·現(xiàn)階段通過(guò)智能篩選的智能媒體新聞，在根據(jù)用戶喜好量身定制的同時(shí)，也消除了用戶對(duì)其他新聞產(chǎn)生興趣的可能?！ぴ谥悄苊襟w推送的過(guò)程中，具體內(nèi)容推送的算法也會(huì)受到算法本身設(shè)定的干擾，其推送的內(nèi)容是否真的完美契合用戶喜好還有待探究。（曾在臉書工作過(guò)的人員透露：“臉書在推送時(shí)會(huì)適當(dāng)壓制保守傾向的內(nèi)容，推送較為自由傾向的內(nèi)容。”）·面向“用戶”：規(guī)模較大，高頻動(dòng)態(tài)，呈緊密型聯(lián)系，商業(yè)價(jià)值較高。第2節(jié)人工智能與智能媒體

2.3人工智能與媒體的融合2.3.1人工智能輔助媒介生產(chǎn)·隨著相關(guān)應(yīng)用的逐漸發(fā)展，智能媒體融合越來(lái)越緊密：人工智能技術(shù)可以對(duì)海量數(shù)據(jù)進(jìn)行采集、整理和價(jià)值挖掘，發(fā)掘線索，優(yōu)化選題，以及輔助視頻編輯、實(shí)現(xiàn)投遞分發(fā)環(huán)節(jié)的個(gè)性化推薦。

2.3人工智能與媒體的融合2.3.2新聞自動(dòng)化

·通過(guò)人工智能、大數(shù)據(jù)、智能寫稿等技術(shù)，可以幫助實(shí)現(xiàn)新聞的自動(dòng)化生產(chǎn)，也可以對(duì)新聞內(nèi)容的真實(shí)性進(jìn)行有效核查，幫助確立新聞數(shù)據(jù)的權(quán)威性，從而利用自動(dòng)化新聞數(shù)據(jù)為信息來(lái)源渠道進(jìn)行把關(guān)?！?duì)于一些模式性比較強(qiáng)的新聞，如金融和體育類新聞，智能媒體已經(jīng)可以實(shí)現(xiàn)稿件的自動(dòng)化撰寫。例如騰訊公司開(kāi)發(fā)的寫作機(jī)器人Dreamwriter可以根據(jù)算法自動(dòng)生成稿件，一分鐘內(nèi)完成資訊整合并送達(dá)用戶。圖2.1寫作機(jī)器人Dreamwriter自動(dòng)撰寫的稿件摘錄第2節(jié)人工智能與智能媒體

2.4人工智能在媒體平臺(tái)中的應(yīng)用

·內(nèi)容生產(chǎn)平臺(tái)內(nèi)容生產(chǎn)平臺(tái)是人工智能時(shí)代智能媒體的基礎(chǔ)，以機(jī)器人新聞最具代表性。通過(guò)自動(dòng)化進(jìn)行內(nèi)容生產(chǎn)，可以將記者從煩瑣而簡(jiǎn)單的工作中解救出來(lái)?！ぶ悄芡扑推脚_(tái)智能推送平臺(tái)得益于大數(shù)據(jù)和智能推薦算法的有效結(jié)合，可以個(gè)性化匹配用戶的新聞需求，力求新聞投遞更加精準(zhǔn)、有效、合理?！び脩艟酆掀脚_(tái)用戶聚合平臺(tái)是基于內(nèi)容生產(chǎn)平臺(tái)和智能推送平臺(tái)，例如推特、微博等社會(huì)化媒體平臺(tái)，運(yùn)用有效的內(nèi)容和個(gè)性化的新聞分發(fā)，對(duì)用戶進(jìn)行數(shù)據(jù)的深入發(fā)掘和分析，整理出更深度的用戶習(xí)慣，進(jìn)一步增加用戶黏性，讓用戶對(duì)產(chǎn)品產(chǎn)生依賴性的消費(fèi)習(xí)慣，從而進(jìn)行內(nèi)容的再生產(chǎn)。

第2節(jié)人工智能與智能媒體

2.5人工智能的技術(shù)表現(xiàn)“這一波人工智能的爆發(fā)首先橫掃了自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)這兩個(gè)領(lǐng)域。”——斯坦福大學(xué)人工智能實(shí)驗(yàn)室主任李飛飛這兩個(gè)領(lǐng)域也是智能媒體的主要技術(shù)體現(xiàn)。

·自然語(yǔ)言處理·在這一領(lǐng)域最為常見(jiàn)的就是語(yǔ)音識(shí)別技術(shù)，它是一個(gè)基礎(chǔ)性的技術(shù)。·今后，隨著語(yǔ)音識(shí)別技術(shù)的提高和廣泛應(yīng)用，或許能改變?nèi)祟惻c所有設(shè)備之間的交互方式?！ぴ谥悄苊襟w中，語(yǔ)音識(shí)別技術(shù)和傳感器的結(jié)合，可以更為有效快速地搜集和捕捉信息數(shù)據(jù)，提高信息準(zhǔn)確度。·語(yǔ)音識(shí)別技術(shù)也可以為記者提高寫作效率。例如，科大訊飛公司旗下產(chǎn)品“訊飛聽(tīng)見(jiàn)”可以實(shí)現(xiàn)長(zhǎng)時(shí)間錄音內(nèi)容的轉(zhuǎn)文字處理，其精準(zhǔn)度也在不斷地提高。

2.5人工智能的技術(shù)表現(xiàn)

·計(jì)算機(jī)視覺(jué)領(lǐng)域·在這一領(lǐng)域最為常見(jiàn)的就是各項(xiàng)智能識(shí)別技術(shù)，例如人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別等，除此之外還有各項(xiàng)視覺(jué)支持技術(shù)?！ぴ谥悄苊襟w中，計(jì)算機(jī)視覺(jué)領(lǐng)域的技術(shù)可以得到廣泛應(yīng)用。例如在參會(huì)人員眾多的會(huì)議中，利用人臉識(shí)別技術(shù)去鎖定被采訪對(duì)象，幫助記者采集新聞素材。·在新聞體驗(yàn)環(huán)節(jié)，利用虛擬現(xiàn)實(shí)（VR）、增強(qiáng)現(xiàn)實(shí)（AR）等技術(shù)，可以為用戶打造全新的新聞體驗(yàn)場(chǎng)所，營(yíng)造出身臨其境的效果，更為有效地還原新聞現(xiàn)場(chǎng)。第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人新聞寫作機(jī)器人（寫稿機(jī)器人）是人工智能技術(shù)在媒體實(shí)際應(yīng)用中的代表，也是最為直觀、廣泛的人工智能技術(shù)產(chǎn)品。新聞寫作機(jī)器人在國(guó)外的應(yīng)用要早于國(guó)內(nèi)：·早在2010年一家名為NarrativeScience的公司就研發(fā)出一款名為Quill的新聞自動(dòng)寫作程序·

《洛杉磯時(shí)報(bào)》最早將這一技術(shù)引入實(shí)際的新聞生產(chǎn)中去·2014年，人工智能編輯WordSmith在美聯(lián)社正式上線·在國(guó)內(nèi)，最早應(yīng)用新聞寫作機(jī)器人的機(jī)構(gòu)是騰訊財(cái)經(jīng)。2015年9月，騰訊財(cái)經(jīng)Dreamwriter寫作機(jī)器人生產(chǎn)了第一篇國(guó)內(nèi)自動(dòng)化新聞稿件。應(yīng)用：現(xiàn)階段，無(wú)論國(guó)內(nèi)還是國(guó)外，新聞寫作機(jī)器人主要應(yīng)用于財(cái)經(jīng)新聞、體育新聞等領(lǐng)域的新聞生產(chǎn)中，這類新聞的共性是以數(shù)據(jù)信息為主、對(duì)時(shí)效性要求高、字?jǐn)?shù)少。第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.1自動(dòng)化新聞及其原理3.1.1自動(dòng)化新聞的相關(guān)要素

·技術(shù)儲(chǔ)備大數(shù)據(jù)（數(shù)據(jù)來(lái)源、原材料）算法（擬人化寫作）·相關(guān)人群記者（深度報(bào)道、專業(yè)報(bào)道）編輯（記者稿件VS機(jī)器人稿件）讀者·發(fā)展出口應(yīng)用（寫稿機(jī)器人）理論（學(xué)界進(jìn)行理論研究）圖3.1自動(dòng)化新聞的相關(guān)要素

3.1自動(dòng)化新聞及其原理3.1.2自動(dòng)化新聞的概念

·自動(dòng)化新聞·“自動(dòng)化新聞”（automatedjournalism）也被稱為“算法新聞”（algorithmicjournalism）或“機(jī)器人新聞”（robotjournalism），是建立在算法和人工智能程序平臺(tái)和自然語(yǔ)言處理技術(shù)的基礎(chǔ)上的新型新聞生產(chǎn)模式?！懜鍣C(jī)器人·自動(dòng)化新聞中用來(lái)生產(chǎn)內(nèi)容的程序叫作寫稿機(jī)器人。

·自動(dòng)化新聞VS寫稿機(jī)器人（同一過(guò)程，側(cè)重角度不同）·自動(dòng)化新聞——過(guò)程和產(chǎn)品的角度新聞是自動(dòng)化新聞生產(chǎn)的最終產(chǎn)品，自動(dòng)化則指整個(gè)生產(chǎn)過(guò)程涉及的人力較少、計(jì)算力比較多·寫稿機(jī)器人——算法和生產(chǎn)的邏輯角度機(jī)器人則是具體的生產(chǎn)者

3.1自動(dòng)化新聞及其原理3.1.3自動(dòng)化新聞的特征

·最主要的特征：從數(shù)據(jù)源自動(dòng)獲取數(shù)據(jù)，使用算法來(lái)進(jìn)行內(nèi)容整合，并完成擬人化的內(nèi)容生產(chǎn)，即新聞的文字及部分視覺(jué)內(nèi)容可以由算法直接、自動(dòng)生成。

·寫稿機(jī)器人可以和記者做的深度報(bào)道、情感溝通等方面進(jìn)行互補(bǔ)。圖3.2自動(dòng)化新聞案例

3.1自動(dòng)化新聞及其原理3.1.4自動(dòng)化新聞的生產(chǎn)過(guò)程①在數(shù)據(jù)庫(kù)及其他數(shù)據(jù)來(lái)源處檢索并鎖定與報(bào)道主題相關(guān)的數(shù)據(jù)。數(shù)據(jù)來(lái)源可能是生產(chǎn)者系統(tǒng)內(nèi)部的，也可能是外部數(shù)據(jù)源（如股票交易所、體育比賽主辦方等）。

②對(duì)原始數(shù)據(jù)進(jìn)行整理和分類。原始數(shù)據(jù)往往并不是直接可用的，一般需要對(duì)原始數(shù)據(jù)進(jìn)行清洗、整理和分類，舍去無(wú)用數(shù)據(jù)。

③通過(guò)排序、比較和聚合數(shù)據(jù)來(lái)明確新聞故事的關(guān)鍵事實(shí)。

④按照某種敘事的語(yǔ)義結(jié)構(gòu)對(duì)關(guān)鍵事實(shí)進(jìn)行組織。不同產(chǎn)業(yè)、行業(yè)的文章，有不同的敘事結(jié)構(gòu)，稱為“模板”，例如體育類新聞和財(cái)經(jīng)類新聞的敘事模板就大不相同。

⑤對(duì)最終形成的文本內(nèi)容進(jìn)行審核，完成分發(fā)和出版，同時(shí)可以按照需要提供不同風(fēng)格、語(yǔ)言和語(yǔ)法復(fù)雜程度的產(chǎn)品。

3.1.4自動(dòng)化新聞的生產(chǎn)過(guò)程

圖3.3自動(dòng)化新聞的生產(chǎn)第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.2自動(dòng)化新聞的發(fā)展和應(yīng)用3.2.1發(fā)展現(xiàn)狀：歐美美國(guó)的自動(dòng)化新聞發(fā)展較早。截至2018年初，歐美幾乎所有的主流新聞機(jī)構(gòu)都已經(jīng)建立起了一定程度的自動(dòng)化新聞生產(chǎn)平臺(tái)。·美聯(lián)社與WordSmith·自動(dòng)捕捉最新財(cái)經(jīng)數(shù)據(jù)→運(yùn)用美聯(lián)社預(yù)設(shè)的新聞框架→數(shù)據(jù)內(nèi)容填充→財(cái)經(jīng)簡(jiǎn)報(bào)

“人工寫一篇類似自動(dòng)化新聞的簡(jiǎn)單財(cái)報(bào)大約需要記者和編輯耗費(fèi)30分鐘，在使用自動(dòng)化寫作軟件前，我的65位員工每季度大約只能寫300篇報(bào)道，現(xiàn)在我們卻能完成3700篇?！薄缆?lián)社全球商業(yè)總編麗莎·吉布斯

美聯(lián)社副總裁吉姆·肯尼迪曾表示，讓寫稿機(jī)器人不再需要人工的最終審核而達(dá)到直接發(fā)稿的水平是他們的終極目標(biāo)。

3.2.1發(fā)展現(xiàn)狀：歐美

·里程碑事件·事件：2014年3月7日《洛杉磯時(shí)報(bào)》對(duì)當(dāng)天早晨一場(chǎng)4.7級(jí)地震的自動(dòng)化報(bào)道。·成果：此文稿完全由計(jì)算機(jī)程序Quakebot生成，在這次地震發(fā)生后僅三分鐘內(nèi)就實(shí)現(xiàn)了全文的發(fā)布，且在形式上與人類記者撰寫的報(bào)道幾乎沒(méi)有任何差別。Quakebot使得《洛杉磯時(shí)報(bào)》成為最早報(bào)道此次地震的媒體?！ぴ恚篞uakebot從GeologicalSurvey獲取關(guān)于地震的原始數(shù)據(jù)，只要地震的級(jí)別大于某一個(gè)閾值，就會(huì)把相應(yīng)的數(shù)據(jù)抽出來(lái)，把它放在預(yù)置好的模板中去，然后送到《洛杉磯時(shí)報(bào)》的系統(tǒng)里，經(jīng)過(guò)人工審核后即可進(jìn)行發(fā)布。

3.2自動(dòng)化新聞的發(fā)展和應(yīng)用3.2.2發(fā)展現(xiàn)狀：中國(guó)·新華社與“快筆小新”·工作流程和特點(diǎn)：①采集清洗。依托大數(shù)據(jù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)采集、清洗和標(biāo)準(zhǔn)化處理，不同來(lái)源的數(shù)據(jù)格式往往不同。②計(jì)算分析。根據(jù)業(yè)務(wù)需求定制相應(yīng)的算法模型，對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)計(jì)算和分析。

③模板匹配。“快筆小新”會(huì)根據(jù)計(jì)算和分析結(jié)果選取合適的模板，生成中文新聞置標(biāo)語(yǔ)言標(biāo)準(zhǔn)（CNML）的稿件自動(dòng)進(jìn)入待編稿庫(kù)，供編輯審核后簽發(fā)。

·“快筆小新”如何避免稿件的千篇一律？①進(jìn)行模板的定制。不同事件有不同寫法，可以根據(jù)事件本身的情況來(lái)選擇一個(gè)相應(yīng)的稿件模板，進(jìn)行內(nèi)容創(chuàng)作。（不同事件有不同的模板權(quán)重）②為了支持模板，可建立更加完善的歷史數(shù)據(jù)庫(kù)。（財(cái)經(jīng)類的季報(bào)、年報(bào)、歷史報(bào)價(jià)等數(shù)據(jù)庫(kù)，體育類的賽事、運(yùn)動(dòng)員基本資料等數(shù)據(jù)庫(kù)）③針對(duì)業(yè)務(wù)報(bào)道需求，研發(fā)計(jì)算同比、環(huán)比、指數(shù)、累計(jì)進(jìn)球數(shù)、積分排名等各種指標(biāo)的歷史統(tǒng)計(jì)模型、趨勢(shì)分析模型等，提高報(bào)道內(nèi)容的豐富性。

3.2.2發(fā)展現(xiàn)狀：中國(guó)

·《光明日?qǐng)?bào)》與“光明小明”·亮點(diǎn)：自然語(yǔ)言處理技術(shù)的應(yīng)用（人機(jī)對(duì)話、人性化溝通）·交互方式突破：傳統(tǒng)方式：用戶閱讀新聞（單向傳播，被支配地位）小明：溝通、對(duì)話、交流（雙向傳播，平等）·更多功能：“光明小明”還可以通過(guò)圖片識(shí)別出相關(guān)內(nèi)容的背景資料。比如當(dāng)用戶把一名NBA球星的照片發(fā)給小明，它可以很快地告訴用戶他是誰(shuí)，以及相關(guān)的其他資料信息?！靶∶髂愫?！我想查詢今天北京的空氣質(zhì)量指數(shù)?！毙∶鳎夯卮稹獭澳敲瓷钲谀兀俊毙∶鳎夯卮稹坛绦蝾A(yù)設(shè)×自主學(xué)習(xí)√第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.3自動(dòng)化新聞的技術(shù)難點(diǎn)自動(dòng)化新聞的核心技術(shù)是自然語(yǔ)言理解，同時(shí)會(huì)涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、深度學(xué)習(xí)、知識(shí)圖譜等多項(xiàng)技術(shù)?！ぜ夹g(shù)難點(diǎn)·學(xué)習(xí)和模擬文字這種相比語(yǔ)音、視頻等更抽象的交流方式并用于內(nèi)容生產(chǎn)。（文法和語(yǔ)法正確、不生硬、與時(shí)俱進(jìn)、通俗易懂）

·語(yǔ)言具有復(fù)雜性，同一句話可能代表不同含義，例如反諷、暗喻等方式。正確理解人類語(yǔ)言還要有足夠的背景知識(shí)，比如對(duì)成語(yǔ)和歇后語(yǔ)的理解?！八某煽?jī)不能更好了”贊美？嘲笑？第3節(jié)自動(dòng)化新聞和寫稿機(jī)器人

3.4自動(dòng)化新聞的發(fā)展前景·添加語(yǔ)境資料。為了讓寫稿機(jī)器人制作的稿件更加生動(dòng)、擬人化，支持的場(chǎng)景和領(lǐng)域更多，需要考慮為自動(dòng)化新聞添加語(yǔ)境資料，方便其得出較為復(fù)雜的結(jié)論。

·核查與修正數(shù)據(jù)自身的偏向性。與記者相比，由于寫稿機(jī)器人的技術(shù)門檻較高，算法對(duì)數(shù)據(jù)的使用是否有偏向性、是否是透明的，往往受到公眾質(zhì)疑?！ぬ岣邤?shù)據(jù)本身的可解釋性。通常，人工的稿件往往需要注明所引數(shù)據(jù)的來(lái)源，但是對(duì)于一些自動(dòng)化新聞來(lái)說(shuō)，由于其數(shù)據(jù)來(lái)源比較多，精確地標(biāo)出每一個(gè)數(shù)據(jù)源也存在一定的技術(shù)挑戰(zhàn)?！て渌?。算法甚至有望實(shí)現(xiàn)對(duì)圖像數(shù)據(jù)的讀取和結(jié)構(gòu)化，利用多媒體素材，更好地組織內(nèi)容生產(chǎn)，提高語(yǔ)言的豐富程度，并且進(jìn)一步提升擬人化水平。第4節(jié)自動(dòng)事實(shí)核查

4.1自動(dòng)事實(shí)核查的概念和發(fā)展現(xiàn)狀

·事實(shí)的含義事實(shí)應(yīng)該與客觀現(xiàn)實(shí)一致并且可以被證據(jù)證明。·人工核查的不足當(dāng)前，假新聞和謠言在互聯(lián)網(wǎng)上傳播和擴(kuò)散，正是由于其與事實(shí)不符或者故意混淆事實(shí)，導(dǎo)致了受眾的誤解、困惑甚至恐慌。而人工核查的方式在面對(duì)大量假新聞和謠言時(shí)又顯得力不從心。·自動(dòng)事實(shí)核查·是指將人工智能技術(shù)應(yīng)用于自動(dòng)事實(shí)核查。同時(shí)，也與人工信息核查流程相融合和交叉驗(yàn)證，以便實(shí)現(xiàn)更準(zhǔn)確的核查效果。·關(guān)于自動(dòng)事實(shí)核查的研究得到了越來(lái)越多的資金支持。（事實(shí)核查慈善機(jī)構(gòu)FullFact獲得來(lái)自谷歌公司的5萬(wàn)歐元經(jīng)費(fèi)支持，杜克大學(xué)的杜克記者實(shí)驗(yàn)室獲得來(lái)自奈特基金會(huì)等機(jī)構(gòu)120萬(wàn)美元的資金支持，用于啟動(dòng)“科技與核查合作”項(xiàng)目）第4節(jié)自動(dòng)事實(shí)核查

4.2自動(dòng)事實(shí)核查的目標(biāo)、路徑和研究發(fā)現(xiàn)4.2.1自動(dòng)事實(shí)核查的目標(biāo)·【識(shí)別】嘗試發(fā)現(xiàn)網(wǎng)絡(luò)上流傳的虛假或可疑信息·該目標(biāo)的作用是從網(wǎng)絡(luò)上海量的信息中篩選出可能的不實(shí)消息，縮小核查范圍，否則后續(xù)的自動(dòng)事實(shí)核查將面臨數(shù)據(jù)量過(guò)大、對(duì)計(jì)算資源要求太高的困境?！?shù)據(jù)在現(xiàn)有的海量體量基礎(chǔ)上仍迅速增長(zhǎng)，逐條核查互聯(lián)網(wǎng)上的全部數(shù)據(jù)不可行，需要設(shè)計(jì)合理算法和規(guī)則來(lái)快速發(fā)現(xiàn)虛假信息。·由于人工核查準(zhǔn)確率高，通常會(huì)實(shí)行人工核查與機(jī)器核查相結(jié)合的方式。·【檢驗(yàn)】核實(shí)有疑問(wèn)的信息，為記者和公眾成員的信息核實(shí)提供便利·當(dāng)公眾或?qū)I(yè)記者對(duì)現(xiàn)有消息存疑，可尋求事實(shí)核查系統(tǒng)的幫助，核對(duì)存疑消息?！ひ虼?，自動(dòng)事實(shí)核查系統(tǒng)需要保證較高的準(zhǔn)確性和有效性，保證公眾得到的是權(quán)威回答。·【糾正】通過(guò)不同的媒體平臺(tái)將

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《算法新聞》課件第十二章人工智能與推薦系統(tǒng)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《算法新聞》課件第十二章 人工智能與推薦系統(tǒng)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

《算法新聞》課件第十二章人工智能與推薦系統(tǒng)