自然語言處理技術(shù)與應(yīng)用 試題B卷_第1頁
自然語言處理技術(shù)與應(yīng)用 試題B卷_第2頁
自然語言處理技術(shù)與應(yīng)用 試題B卷_第3頁
自然語言處理技術(shù)與應(yīng)用 試題B卷_第4頁
自然語言處理技術(shù)與應(yīng)用 試題B卷_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第1頁共4頁期末考試試題B卷(開卷)適用班級:人工智能2001/2002專業(yè):人工智能技術(shù)服務(wù)考試時長:120分鐘得分閱卷人一、選擇得分閱卷人1.自然語言處理的發(fā)展大致分為3個階段:(),20世紀(jì)70年代和21世紀(jì)。A.19世紀(jì)晚期B.19世紀(jì)中期C.19世紀(jì)早期D.20世紀(jì)50年代2.以下哪個不屬于文件對象的方法?()A.file.read([size])B.file.write(str)C.file.readline()D.file.close()3.為了保證無論是否出錯都能正確地關(guān)閉文件,可以使用()來實(shí)現(xiàn)。A.breakB.for循環(huán)語句C.try…finallyD.if...else4.目前的分詞方法主要有三種:基于規(guī)則的分詞方法、基于統(tǒng)計(jì)的分詞方法以及()。A.基于語法的分詞方法B.基于語種的分詞方法C.基于語言的分詞方法D.基于語義的分詞方法5.采用jieba搜索引擎模式對“南京市長江大橋”進(jìn)行分詞,得到的結(jié)果為()A.南京\市長江大橋B.南京市/長江大橋C.南京/南京市/京市/市長/長江/長江大橋/大橋D.南京/京市/南京市/長江/大橋/長江大橋6.詞性標(biāo)注的正確與否會直接影響到之后的()、語義分析,是中文自然語言處理的基礎(chǔ)之一。A.詞法分析B.語言分析C.句子分析D.句法分析7.關(guān)于Stanfordparser下面說法不正確的是:()Stanfordparser的底層是由Java實(shí)現(xiàn)的,因此需要確保安裝JDK。Stanfordparser的Python封裝是在NLTK庫中實(shí)現(xiàn)的,因此,需要安裝NLTK庫。NLTK是一款Python的自然語言處理工具,但主要針對中文。Stanfordparser基于概率統(tǒng)計(jì)進(jìn)行句法分析。8.RNN的應(yīng)用場景不包括()。A.生成圖像描述B.語音識別C.視頻標(biāo)記D.自動拍照9.當(dāng)處理序列問題發(fā)現(xiàn),當(dāng)前時刻的輸出既與前面時刻輸入有關(guān),又與未來時刻輸出有關(guān),應(yīng)選擇哪個模型更為合適()A.CNNB.RNNC.雙向LSTMD.GMM10.關(guān)于one-hot編碼說法不正確的是()。A.one-hot編碼是一位有效編碼B.每個狀態(tài)都有自己獨(dú)立的寄存器位C.隨著語料庫詞語的增加,詞向量的維度高且稀疏D.計(jì)算詞與詞之間的相似性11.基于主題模型方法使用的算法是()。A.TF-IDF算法B.LDA算法C.TextRank算法D.KNN算法12.TF-IDF算法中使用哪個函數(shù)對數(shù)據(jù)集進(jìn)行分詞,去停用詞()。A.posB.corpus_pathC.preprocessD.idf_dic13.根據(jù)代碼確定fit_prior:為True的含義()。classsklearn.naive_bayes.MultinominalNB(alpha=1.0,fit_prior=True,class_prior=None)不去學(xué)習(xí)類別先驗(yàn)概率訓(xùn)練模型追加訓(xùn)練模型用模型進(jìn)行預(yù)測14.基于詞典的情感分析方法的最大特點(diǎn)是()。A.簡單B.方便C.復(fù)雜D.快速15.自然語言理解的簡稱是什么?()。10.6A.NLPB.ANNC.NLUD.APL得分閱卷人二、判斷題(對的打‘√’,錯的打‘×’得分閱卷人1.句法分析的主要任務(wù)是:識別出句子所包含的句法成分,以及這些成分之間的關(guān)系。()2..jieba分詞工具提供了詞性標(biāo)注功能。jieba分詞是結(jié)合規(guī)則和統(tǒng)計(jì)的方式,也就是說同時使用詞典匹配和HMM。()3.Stanfordparser的底層是由python實(shí)現(xiàn)的。()4.re.match嘗試從字符串的起始位置匹配一個模式,如果起始位置匹配不成功的話,就返回none。()5.re.match嘗試從字符串的起始位置匹配一個模式,如果起始位置匹配不成功的話,就返回none。()6.自然語言處理(NaturalLanguageProcessing,NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域以及大數(shù)據(jù)領(lǐng)域的一個重要的研究方向。()7.基于語義的分詞方法通常包括三個部分:分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。()8.條件隨機(jī)場(CRF)也是一種基于馬爾科夫思想的統(tǒng)計(jì)模型。之前的模型都假設(shè)每個狀態(tài)均只與它前面的狀態(tài)有關(guān)。()9.命名實(shí)體識別(NER)的目的在于識別語料中人名、地名、組織機(jī)構(gòu)名等命名實(shí)體。()10.LTP的主要模型中SentenceSplitter是分句模型。()得分閱卷人三、填空得分閱卷人自然語言處理的發(fā)展歷程分別是:19世紀(jì)早期、、。2.目前的分詞方法主要有三種:基于規(guī)則的分詞方法、以及基于語義的分詞方法。3.命名實(shí)體識別分為和基于統(tǒng)計(jì)的命名實(shí)體識別。4.的目的在于識別語料中人名、地名、組織機(jī)構(gòu)名等命名實(shí)體。5.根據(jù)句法結(jié)構(gòu)的表示形式不同,最常見的句法分析任務(wù)可以分為以下三種:、依存句法分析以及深層文法句法分析。6.LSTM的三重門分別是:、和。7.GRU中有兩個門,決定前一狀態(tài)有多少信息寫入到當(dāng)前候選集上,決定前一時刻的狀態(tài)信息寫入到當(dāng)前狀態(tài)中的程度。8.在Python中,匹配下面生成詞典的正確函數(shù)是:dict=corpora.([words])從實(shí)現(xiàn)上考慮自動文摘所采用的方法可以分為和。影響聚類算法結(jié)果的主要因素有、、。11.基于詞典的情感分析方法的分類效果取決于。12.基于詞典的情感分析方法的最大特點(diǎn)是。13.聊天機(jī)器人按照功能需求來劃分,可以分為兩種,分別為和。得分閱卷人四、綜合應(yīng)用得分閱卷人請采用了今日頭條公開的分類數(shù)據(jù)作為訓(xùn)練語料庫,進(jìn)行Word2vec訓(xùn)練。得分閱卷人得分閱卷人.將以下內(nèi)容保存為txt文檔,并使用TextRank算法對以下內(nèi)容進(jìn)行文本摘要。我與父親不相見已二年余了,我最不能忘記的是他的背影。那年冬天,祖母死了,父親的差使也交卸了,正是禍不單行的日子,我從北京到徐州,打算跟著父親奔喪回家。到徐州見著父親,看見滿院狼藉的東西,又想起祖母,不禁簌簌地流下眼淚。父親說,“事已如此,不必難過,好在天無絕人之路!”回家變賣典質(zhì),父親還了虧空;又借錢辦了喪事。這些日子,家中光景很是慘淡,一半為了喪事,一半為了父親賦閑。喪事完畢,父親要到南京謀事,我也要回北京念書,我們便同行。到南京時,有朋友約去游逛,勾留了一日;第二日上午便須渡江到浦口,下午上車北去。父親因?yàn)槭旅?,本已說定不送我,叫旅館里一個熟識的茶房陪我同去。他再三囑咐茶房,甚是仔細(xì)。但他終于不放心,怕茶房不妥帖;頗躊躇了一會。其實(shí)我那年已二十歲,北京已來往過兩三次,是沒有甚么要緊的了。他躊躇了一會,終于決定還是自己送我去。我兩三回勸他不必去;他只說,“不要緊,他們?nèi)ゲ缓?”我們過了江,進(jìn)了車站。我買票,他忙著照看行李。行李太多了,得向腳夫行些小費(fèi),才可過去。他便又忙著和他們講價錢。我那時真是聰明過分,總覺他說話不大漂亮,非自己插嘴不可。但他終于講定了價錢;就送我上車。他給我揀定了靠車門的一張椅子;我將他給我做的紫毛大衣鋪好坐位。他囑我路上小心,夜里警醒些,不要受涼。又囑托茶房好好照應(yīng)我。我心里暗笑他的迂;他們只認(rèn)得錢,托他們直是白托!而且我這樣大年紀(jì)的人,難道還不能料理自己么?唉,我現(xiàn)在想想,那時真是太聰明了!我說道,“爸爸,你走吧?!彼囃饪戳丝?,說,“我買幾個橘子去。你就在此地,不要走動?!蔽铱茨沁呍屡_的柵欄外有幾個賣東西的等著顧客。走到那邊月臺,須穿過鐵道,須跳下去又爬上去。父親是一個胖子,走過去自然要費(fèi)事些。我本來要去的,他不肯,只好讓他去。我看見他戴著黑布小帽,穿著黑布大馬褂,深青布棉袍,蹣跚地走到鐵道邊,慢慢探身下去,尚不大難??墒撬┻^鐵道,要爬上那邊月臺,就不容易了。他用兩手攀著上面,兩腳再向上縮;他肥胖的身子向左微傾,顯出努力的樣子。這時我看見他的背影,我的淚很快地流下來了。我趕緊拭干了淚,怕他看見,也怕別人看見。我再向外看時,他已抱了朱紅的橘子望回走了。過鐵道時,他先將橘子散放在地上,自己慢慢爬下,再抱起橘子走。到這邊時,我趕緊去攙他。他和我走到車上,將橘子一股腦兒放在我的皮大衣上。于是撲撲衣上的泥土,心里很輕松似的,過一會說,“我走了;到那邊來信!”我望著他走出去。他走了幾步,回過頭看見我,說,“進(jìn)去吧,里邊沒人?!钡人谋秤盎烊雭韥硗娜死?,再找不著了,我便進(jìn)來坐下,我的眼淚又來了。近幾年來,父親和我都是東奔西走,家中光景是一日不如一日。他少年出外謀生,獨(dú)力支持,做了許多大事。那知老境卻如此頹唐!他觸目傷懷,自然情不能自已。情郁于中,自然要發(fā)之于外;家庭瑣屑便往往觸他之怒。他待我漸漸不同往日。但最近兩年的不見,他終于忘卻我的不好,只是惦記著我,惦記著我的兒子。我北來后,他寫了一信給我,信中說道,“我身體平安,惟膀子疼痛利害,舉箸提筆,諸多不便,大約大去之期不遠(yuǎn)矣?!蔽易x到此處,在晶瑩的淚光中,又看見那肥胖的,青布棉袍,黑布馬褂的背影。唉!我不知何時再能與他相見!得分閱卷人六、綜合應(yīng)用題三得分閱卷人編寫Python代碼實(shí)現(xiàn)垃圾郵件分類?!禤ython文本與語音應(yīng)用設(shè)計(jì)》期末考試

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論