中文信息處理與挖掘智慧樹知到期末考試答案章節(jié)答案2024年山東交通學(xué)院_第1頁
中文信息處理與挖掘智慧樹知到期末考試答案章節(jié)答案2024年山東交通學(xué)院_第2頁
中文信息處理與挖掘智慧樹知到期末考試答案章節(jié)答案2024年山東交通學(xué)院_第3頁
中文信息處理與挖掘智慧樹知到期末考試答案章節(jié)答案2024年山東交通學(xué)院_第4頁
中文信息處理與挖掘智慧樹知到期末考試答案章節(jié)答案2024年山東交通學(xué)院_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

中文信息處理與挖掘智慧樹知到期末考試答案+章節(jié)答案2024年山東交通學(xué)院就詞性標注手段來講,可以采用手動的方式進行標注也可以采用自動標注的方法。()

答案:對在神經(jīng)網(wǎng)絡(luò)方法之前,機器翻譯主要是基于統(tǒng)計模型的翻譯()。

答案:對跨語言摘要意思是要處理的文檔中會出現(xiàn)多種語言的文本。()

答案:錯與單文檔摘要相比,多文檔摘要需要從多個文檔抽取出的句子,因此要確定這些句子的順序。()

答案:對語言模型設(shè)計的任務(wù)就是尋找困惑度最小的模型,使其最接近真實的語言。()

答案:對中文語法不像英文語法那樣復(fù)雜,所以詞性標注的過程比較簡單()。

答案:錯用程序員的語言來說,類的一個實例,就是一個命名實體()。

答案:對支持向量機(SVM)算法是一個在有限的樣本空間中尋找一個超平面能將不同類別的樣本分開且間隔最大的二分類模型。()

答案:對引入注意力機制的目的是選出關(guān)鍵信息,捕捉上下文相關(guān)信息,防止重要信息的丟失,提高文本分類的準確性。()

答案:對在以信息交流為目的場景中,機器翻譯主要解決人與人之間的語言溝通問題()。

答案:對依存語法描述的是句子中詞語之間直接的句法關(guān)系,通常是一個詞語支配另一個或幾個詞語,而一個詞語以一定的關(guān)系能且只能夠依存于另外一個詞語,這種句法關(guān)系是沒有方向的。()

答案:錯決策式分析方法、判別式分析方法和生成式分析方法都屬于依存句法結(jié)構(gòu)所采用的分析算法,其中決策式分析方法相較于生成式分析方法和判別式分析方法,算法復(fù)雜度較低,準確率不高。()

答案:對基于詞典的切詞也有缺點,比如·歧義消解的能力差,同時切分正確率也不高,一般在95%左右。()

答案:對深度神經(jīng)網(wǎng)絡(luò)是指包含多個隱含層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。()

答案:對機器翻譯的發(fā)展使得人們在出國旅游時,語言不通不再是很多人的一大痛點()。

答案:對基于深度學(xué)習(xí)的情感分析方法主要解決了以下哪些問題()。

答案:數(shù)據(jù)量大的問題###分類準確率不高的問題###分類效率不高的問題###忽略上下文語義的問題句子的位置會影響句子的重要性。下列哪些位置是我們選取摘要句子的重點位置()

答案:文章的第一句###各個段落的第一句###各個段落的最后一句###文章的最后一句文本摘要按照輸出類型劃分主要分為哪幾類()

答案:抽取式摘要###生成式摘要下列屬于中文切詞方法的有()。

答案:規(guī)則與統(tǒng)計相結(jié)合的方法###生成式與判別式的相結(jié)合方法###由字構(gòu)詞的分詞方法###全切分方法下列屬于常用情感詞典的是()

答案:WordNet###NTUSD###SentiWordNet###HowNet依存關(guān)系分析把句子中的詞分為哪兩類。()

答案:核心詞###依存詞在文本情感分析過程中,數(shù)據(jù)預(yù)處理是提高數(shù)據(jù)質(zhì)量的重要操作,下列屬于數(shù)據(jù)預(yù)處理操作的是()。

答案:數(shù)據(jù)清洗###分詞操作###去停用詞###詞性標注情感分析任務(wù)按粒度可以分為()

答案:篇章級第七章###詞語級###句子級篇章分析的研究主要集中哪兩個方面()。

答案:連貫性###銜接性詞法分析,它屬于詞語級的自然語言處理,主要有()。

答案:新詞發(fā)現(xiàn)###分詞###命名實體識別###詞性標注從句群的功能角度來看,則可將其分為哪三大類。()

答案:主題句群###過度句群###插入句群中文文本情感分析任務(wù)的難點包括()。

答案:互聯(lián)網(wǎng)新詞層出不窮###文本存在多義或者同義現(xiàn)象###隱含語義難以抽取###中文語境復(fù)雜為了完成多文檔的抽取式摘要,我們要解決以下哪幾個關(guān)鍵技術(shù)問題()

答案:過濾冗余信息。###對句子重要性進行評估。###碎片化信息的聚合。###來自多個文檔的句子如何排序。命名實體識別也有很多方法,比如()。

答案:基于神經(jīng)網(wǎng)絡(luò)的方法###基于規(guī)則的方法###基于特征模板的方法話題鏈的形成主要依賴各種指代回指形式,具體包括()。

答案:零形回指###動詞回指###名詞回指()發(fā)表《翻譯備忘錄》,正式提出機器翻譯的思想。

答案:韋弗以下不屬于依存語法結(jié)構(gòu)描述方法的是()。

答案:句法樹以下哪種是重要而普遍的求估計量的方法。它在統(tǒng)計推斷中無需有關(guān)事前概率的信息,克服了貝葉斯法的致命的弱點,是統(tǒng)計學(xué)史上一大突破。()。

答案:最大似然估計描述一對隨機變量平均所需要的信息量的是()。

答案:聯(lián)合熵以下不屬于預(yù)訓(xùn)練模型的是()。

答案:LSTM下列關(guān)于句法分析的表述錯誤的是()

答案:短語結(jié)構(gòu)分析方法又可分為局部句法分析和全局句法分析,二者沒有區(qū)別關(guān)于文本摘要說法錯誤的是()

答案:文本摘要只能對單文檔進行抽取。不屬于詞語級自然語言處理的歧義類型是()。

答案:合成型歧義常用的漢語分詞方法有()。

答案:都是中文中()左右的句子,正向最大匹配法和逆向最大匹配法完全重合且正確。()

答案:90.0%詞語的左右鄰字越足夠豐富,也就是()越高。

答案:自由度下列不屬于線圖分析算法特點的是()。

答案:可以區(qū)分歧義結(jié)構(gòu)下面關(guān)于ROUGE說法錯誤的是()

答案:ROUGE是一種外部評價標準抽取式摘要一個典型的方法是基于圖排序的方法,關(guān)于它說法錯誤的是()

答案:圖排序?qū)⒕渥又g的關(guān)系作為頂點。()是自然語言處理的技術(shù)基礎(chǔ),也是自然語言理解過程的第一層。主要包括自動分詞、詞性標注、中文命名實體標注和新詞發(fā)現(xiàn)等。

答案:詞法分析以下不屬于依存句法分析方法的是()。

答案:規(guī)則式分析方法關(guān)于單文檔和多文檔提取摘要說法錯誤的是()

答案:多文檔提取摘要無需消除冗余句子。下面哪個選項是自然語言處理的應(yīng)用()。

答案:機器翻譯機器翻譯的英文是madtranslation。()

答案:錯機器翻譯可以有多種實現(xiàn)方法。給定源語言句子,對目標語言句子的條件概率進行建模,再用大規(guī)模語料庫訓(xùn)練模型的方法是()。

答案:基于統(tǒng)計的機器翻譯人類會翻譯是因為人類具有翻譯的能力,機器翻譯就是為機器賦予這種能力。()

答案:錯下列哪項是機器翻譯所面臨的的挑戰(zhàn)()。

答案:譯文調(diào)序###譯文選擇###數(shù)據(jù)稀疏人工翻譯和機器翻譯所涉及的領(lǐng)域知識是一致的。()

答案:錯機器翻譯可以有多種實現(xiàn)方法。給定源語言句子,對目標語言句子的條件概率進行建模,再用大規(guī)模語料庫訓(xùn)練模型的方法是基于統(tǒng)計的機器翻譯

答案:對近年,神經(jīng)機器翻譯逐漸成為機器翻譯的主流技術(shù);通常有兩個模塊,其中,()模塊把源語言句子轉(zhuǎn)換成中間語義表示.

答案:編碼器基于規(guī)則的方法由上到下可以分成四個層次,即詞匯轉(zhuǎn)換、句法轉(zhuǎn)換、()和中間語言層。

答案:語義轉(zhuǎn)換在人工智能領(lǐng)域,機器翻譯屬于()范疇。

答案:自然語言處理基于神經(jīng)網(wǎng)絡(luò)的機器翻譯中,近年引入的()可以提高長句的翻譯質(zhì)量,它賦予句子中的每個詞相同的權(quán)重。

答案:注意力機制5、

抽取式摘要典型模型一共有以下步驟,請按照先后順序?qū)⒉襟E進行排序(

)①摘要語句排序②語句重要性計算與排名③文檔理解④語句選擇

答案:③②④①多文檔摘要不必關(guān)心多個文檔中抽取處的句子之間的順序。()

答案:錯關(guān)于生成式摘要常用的一個方法:基于深度學(xué)習(xí)之序列轉(zhuǎn)換模型的方法說法錯誤的是()

答案:輸入序列較長時,語義向量中先提取的信息并不會被后提取的信息稀釋。按照輸出類型劃分文本摘要主要分為哪幾類()

答案:抽取式摘要###生成式摘要下面關(guān)于ROUGE說法正確的是()

答案:ROUGE要求由多個專家分別生成人工摘要,構(gòu)成標準摘要集。###ROUGE既是評估自動文摘也是及機器翻譯的一組指標。###ROUGE是一種基于召回率的相似性度量方法。按照輸入類型劃分,文本摘要分為抽取式摘要和生成式摘要。()

答案:錯下面哪些是文本自動摘要經(jīng)歷的發(fā)展階段()

答案:基于語言學(xué)的自動摘要###基于統(tǒng)計的自動摘要###啟發(fā)式自動摘要###基于神經(jīng)網(wǎng)絡(luò)的自動摘要下面哪些項是影響句子重要性的因素()

答案:句子位置###句子的長度###句子中詞語的重要性###句子是否包括線索詞關(guān)于文本摘要說法正確的是()

答案:文本摘要必須保留原文中的重要信息。###文本摘要需盡可能簡短精煉。###可以對單文檔進行抽取文本摘要。###可以對多文檔進行抽取文本摘要。與單文檔摘要相比,多文檔摘要有哪些特點()

答案:多文檔摘要要確定壓縮比率,即從每個文檔中抽取句子的比例。###多文檔摘要需注意減小句子之間的冗余度。###多文檔摘要比單文檔面臨更多挑戰(zhàn)。###從多個文檔抽取出的句子要確定它們的順序。對應(yīng)問答系統(tǒng)的處理流程,一般問答系統(tǒng)包括哪三個主要部分?()。

答案:信息檢索###問題分析###答案抽取哪一個概念由谷歌2012年正式提出,旨在實現(xiàn)更智能的搜索引擎,并且于2013年以后開始在學(xué)術(shù)界和業(yè)界普及。()。

答案:知識圖譜信息抽取的任務(wù)主要包括()。

答案:關(guān)系抽取###實體消岐###實體識別與抽取###事件抽取衡量和分析問答系統(tǒng)得復(fù)雜性,可以從問題、數(shù)據(jù)、答案3個維度來評價,同時問答系統(tǒng)根據(jù)問題、數(shù)據(jù)、答案3個維度的不同而屬于不同類別。()

答案:對問答系統(tǒng)的起源,可以追溯到1950年,A.M.Turning提出的"圖靈測試"。()

答案:對不管是賢二機器僧,還是同學(xué)們所熟知的QQ小弟、微軟小冰,在我們自然語言處理領(lǐng)域,都有一個共同的名字,那就是()。

答案:自動問答系統(tǒng)根據(jù)問答系統(tǒng)的發(fā)展、數(shù)據(jù)源、提問類型等,將問答系統(tǒng)分為哪幾種?()。

答案:面向知識圖譜的問答系統(tǒng)###社區(qū)問答系統(tǒng)###檢索式問答系統(tǒng)區(qū)別于傳統(tǒng)問答式檢索系統(tǒng)僅能回答有限類型的問題,社區(qū)問答系統(tǒng)的特點是()。

答案:問題的類型和答案的類型不限定根據(jù)問答系統(tǒng)處理的數(shù)據(jù)格式,將問答系統(tǒng)分為哪幾個歷史階段()。

答案:基于自由文本的問答系統(tǒng)###基于問題答案對的問答系統(tǒng)###基于知識圖譜的問答系統(tǒng)###基于機構(gòu)化數(shù)據(jù)的問答系統(tǒng)以直接而準確的方式回答用戶自然語言提問的自動問答系統(tǒng)將構(gòu)成下一代搜索引擎的基本形態(tài)。()

答案:對根據(jù)樣本數(shù)據(jù)標簽的有無或者多少,可以將機器學(xué)習(xí)算法主要分為()

答案:半監(jiān)督方法###聚類方法###有監(jiān)督方法LSTM模型和RNN模型都是屬于深度學(xué)習(xí)模型,都可用于情感分析任務(wù)中,但是LSTM模型克服了梯度消失問題。()

答案:對K近鄰(KNN)算法是依據(jù)最鄰近的幾個樣本的類別來決定待分類樣本所屬的類別,其中常用的距離公式包括()

答案:曼哈頓距離###歐式距離###切比雪夫距離###余弦距離以下屬于文本情感分析過程的是()。

答案:特征選擇###情感類別的輸出###特征表示###使用分類器進行情感分析詞語級情感分析又稱為方面級情感分析,是一種細粒度的情感分析,它包括方面的提取和方面的情感分析。()

答案:對樸素貝葉斯是一種分類方法,可以在任何情況下使用此方法進行文本情感分析。()

答案:錯常見的特征選擇方法包括{詞頻計數(shù)模型(N-gram)、詞袋模型(TF-IDF)和深度學(xué)習(xí)方法等。()

答案:對下列不屬于基于情感詞典的情感分析方法優(yōu)點的是()。

答案:預(yù)測準確率高BERT使用的是Transformer編碼器,由于Self-attention機制,所以模型上下層直接全部互相連接。()

答案:對特征表示是指將文字表示的內(nèi)容轉(zhuǎn)換成計算機可以處理的數(shù)字化特征向量,常見的特征表示方法有one-hot、word2vec。()

答案:對

答案:例2而通過分析篇章的信息性和意圖性,則可以挖掘篇章的語義特征。()

答案:對篇章結(jié)構(gòu)可以是篇章內(nèi)部關(guān)系的不同結(jié)構(gòu)化表達形式,主要包括下列哪些結(jié)構(gòu)。()

答案:功能結(jié)構(gòu)###指代結(jié)構(gòu)###話題結(jié)構(gòu)###修辭結(jié)構(gòu)話題的完整性從形式和內(nèi)容兩方面分別體現(xiàn)為篇章的兩大基本特性,即篇章連貫性和篇章銜接性.()

答案:對篇章(discourse)又稱為語篇或文本.()

答案:對篇章的哪幾個基本特征更是有力地促進了自然語言處理研究的發(fā)展。()

答案:連貫性###銜接性###信息性###意圖性1898年馬建忠的《馬氏文通》出版為標志創(chuàng)建了漢語復(fù)句理論。()

答案:對下列屬于Hobbs定義的12類關(guān)系的有()。

答案:并列###背景###結(jié)果###詳述篇章的()基本特征已被自然語言處理領(lǐng)域的研究者廣為接受。

答案:7個()是最早研究篇章銜接關(guān)系的理論體系。

答案:淺層銜接理論依存樹和句法樹都屬于語法表示方法,二者最大的不同在于句法樹上都是終結(jié)符結(jié)點,依存樹上還有非終結(jié)符結(jié)點。()

答案:錯重寫規(guī)則表示取代或擴展的規(guī)則,箭頭左邊代表一個或幾個成分構(gòu)成的序列,右邊符號代表單一的結(jié)構(gòu)成分。()

答案:錯在線圖句法分析中需要用到的數(shù)據(jù)結(jié)構(gòu)是()。

答案:線圖(Chart)###進程表(Agenda)###活動邊集(ActiveArc)下列屬于依存句法分析算法的是()。

答案:決策式分析方法###判別式分析方法###生成式分析方法上下文無關(guān)文法(PCFG)在滿足以下什么條件下,計算分析樹的概率可以使用所有規(guī)則概率的乘積()。

答案:上下文無關(guān)性###祖先無關(guān)###位置不變性形式語法是指面向機器處理的語法,它規(guī)定語言中允許出現(xiàn)的結(jié)構(gòu)的形式化說明。()

答案:對一個完整的語法表示,應(yīng)該包括以下哪些元素()。

答案:重寫規(guī)則###非終結(jié)符號集合###終結(jié)符號集合###一個特殊的非終結(jié)符句子句法分析主要包括兩類,分別是短語結(jié)構(gòu)分析和依存關(guān)系分析。()

答案:對線圖分析算法解決了從輸入詞串開始,一步步形成線圖,使得在一條邊可以覆蓋全部結(jié)點。()

答案:對在引入點規(guī)則后,以下屬于非活性邊的是()。

答案:NP->ran。下列(

)形式是最主要的信息載體()。

答案:文字自然語言處理過程可以有多個層次,包括()。

答案:語義分析###詞法分析###句法分析自然語言處理(NLP)通過詞、句子、篇章的分析,理解內(nèi)容。處理一個中文句子(漢字序列)時,在其NLP基本任務(wù)中,()負責將輸入的句子轉(zhuǎn)換為單詞序列。

答案:分詞設(shè)輸入句子“我愛人工智能”,經(jīng)過詞性標注等得到“我/PN愛/VV人工智能/NR”,其中,PN、VV和NR的含義分別是代詞、動詞、專有名詞;()是命名實體。

答案:“人工智能”語言是人類交流思想、表達情感最自然的工具,是思維的載體,也是人類區(qū)別其他動物的本質(zhì)特性。()

答案:對在詞法分析里,需要處理的最小單位是()。

答案:詞詞性標注的主要方法包括()。

答案:基于規(guī)則的方法###基于統(tǒng)計的方法###基于統(tǒng)計的和基于規(guī)則的相結(jié)合的方法以下哪一個屬于序列標注問題()。

答案:命名實體識別孤立語就是被孤立的語言。()

答案:錯用“信息熵”來衡量自由度,用“點間互信息”衡量一個詞匯內(nèi)部的凝聚程度。()

答案:對在自然語言處理中,以句子為處理單位時一般假設(shè)句子獨立于它前面的其它語句,句子的概率分布近似地符合以下哪項()。

答案:二項式分布設(shè)A、B是兩個事件,且P(B)>0,則稱P(A|B)為在已知事件B發(fā)生的條件下,事件A發(fā)生的()。

答案:條件概率哪一項常被用以衡量兩個隨機分布的差距。()

答案:相對熵在概率論和統(tǒng)計學(xué)中,一個離散性隨機變量的期望值,是試驗中每次可能結(jié)果的概率乘以其結(jié)果的總和,也被稱為()。

答案:均值###數(shù)學(xué)期望###期望設(shè)E為隨機試驗,Ω是它的樣本空間,對于E的每一個事件A賦予一個實數(shù),記為P(A),如果集合函數(shù)P(?)滿足下列哪些條件,則實數(shù)P(A)為事件A的概率。()

答案:規(guī)范性###非負性###可列可加性概率論作為統(tǒng)計語言模型的數(shù)學(xué)基礎(chǔ),應(yīng)用到自然語言處理領(lǐng)域,是由于:統(tǒng)計語言處理技術(shù)已經(jīng)成為自然語言處理的主流,而在統(tǒng)計語言處理的步驟中,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論