Python自然語言處理PPT1附錄 教學(xué)大綱_第1頁
Python自然語言處理PPT1附錄 教學(xué)大綱_第2頁
Python自然語言處理PPT1附錄 教學(xué)大綱_第3頁
Python自然語言處理PPT1附錄 教學(xué)大綱_第4頁
Python自然語言處理PPT1附錄 教學(xué)大綱_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE5附錄教學(xué)大綱課程名稱:python自然語言處理適用專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、人工智能、大數(shù)據(jù)等專業(yè)先修課程:概率論與數(shù)理統(tǒng)計(jì)、Python程序設(shè)計(jì)語言總學(xué)時:56學(xué)時授課學(xué)時:30學(xué)時實(shí)驗(yàn)(上機(jī))學(xué)時:26學(xué)時一、課程簡介本教材包括自然語言處理概述、Python語言簡述、Python數(shù)據(jù)類型、Python流程控制、Python函數(shù)、Python數(shù)據(jù)分析、Sklearn和NLTK、語料清洗、特征工程、中文分詞、文本分類、文本聚類、指標(biāo)評價、信息提取和情感分析。二、課程內(nèi)容及要求第1章自然語言處理概述(2學(xué)時)主要內(nèi)容:1人工智能發(fā)展歷程 2自然語言處理 3機(jī)器學(xué)習(xí)算法4自然語言處理相關(guān)庫5.語料庫基本要求:了解人工智能發(fā)展歷程、自然語言處理相關(guān)內(nèi)容;機(jī)器學(xué)習(xí)算法相關(guān)概念;了解基于Python與自然語言處理的關(guān)系;了解語料庫的相關(guān)概念。重點(diǎn):自然語言處理相關(guān)內(nèi)容、機(jī)器學(xué)習(xí)算法難點(diǎn):基于Python的相關(guān)庫第2章Python語言簡介(2學(xué)時)主要內(nèi)容:1.python簡介2.Python解釋器3python編輯器4代碼書寫規(guī)則基本要求:了解python簡介、熟悉Python解釋器、掌握python編輯器、了解代碼書寫規(guī)則重點(diǎn):掌握python編輯器、了解代碼書寫規(guī)則難點(diǎn):掌握python編輯器第3章Python數(shù)據(jù)類型(4學(xué)時)主要內(nèi)容:1.常量、變量和表達(dá)式2.基本數(shù)據(jù)類型3.運(yùn)算符與表達(dá)式4.列表5.元組6.字符串7.字典8.集合基本要求:理解數(shù)據(jù)類型的概念、作用以及Python語言的基本數(shù)據(jù)類型;掌握常量、變量基本概念;掌握Python語言各類運(yùn)算符的含義、運(yùn)算符的優(yōu)先級和結(jié)合性、表達(dá)式的構(gòu)成以及表達(dá)式的求解過程。掌握序列基礎(chǔ)知識;熟練掌握列表的定義、常用操作和常用函數(shù);熟練掌握元組的定義和常用操作;熟練掌握字典的定義和常用操作;掌握字符串格式化、字符串截取的方法;理解與字符串相關(guān)的重要內(nèi)置方法。熟練掌握字典的定義和常用操作;熟練掌握集合的定義和常用操作。重點(diǎn):數(shù)據(jù)類型的作用、變量的定義,各類運(yùn)算符以及構(gòu)成的表達(dá)式的求解。序列、列表、元組的定義和常用操作。字典、集合的定義和常用操作。難點(diǎn):運(yùn)算符的優(yōu)先級和結(jié)合性。列表常用函數(shù)的應(yīng)用,字符串的應(yīng)用。字典及集合的應(yīng)用。第4章Python流程控制(4學(xué)時)主要內(nèi)容:1.數(shù)據(jù)輸入與輸出2.順序結(jié)構(gòu)3.單分支選擇結(jié)構(gòu)4.雙分支選擇結(jié)構(gòu)5.多分支選擇結(jié)構(gòu)6.while循環(huán)結(jié)構(gòu)7.for語句結(jié)構(gòu)8.循環(huán)的嵌套基本要求:掌握程序的三種基本結(jié)構(gòu);掌握順序結(jié)構(gòu)程序設(shè)計(jì);熟練掌握Python語言中輸入輸出格式的規(guī)則和用法。熟練掌握if語句的三種形式和用法以及if語句的嵌套使用;掌握分支結(jié)構(gòu)的應(yīng)用。熟練掌握循環(huán)結(jié)構(gòu)while、for語句的規(guī)則和用法;熟悉continue、break、pass語句的用法;掌握循環(huán)結(jié)構(gòu)的嵌套規(guī)則。重點(diǎn):數(shù)據(jù)的輸入輸出。if語句的三種形式和使用方法。while、for語句的規(guī)則和用法;循環(huán)結(jié)構(gòu)的應(yīng)用。難點(diǎn):格式化輸出的規(guī)則和用法。分支結(jié)構(gòu)的應(yīng)用。循環(huán)的嵌套。第5章Python函數(shù)(4學(xué)時)主要內(nèi)容:1.函數(shù)聲明與調(diào)用2.函數(shù)傳參3.lambda函數(shù)4.遞歸函數(shù)基本要求:理解函數(shù)的作用;熟練掌握函數(shù)定義和函數(shù)調(diào)用的規(guī)則和用法;掌握函數(shù)參數(shù)傳遞的規(guī)則和用法;lambda函數(shù);理解函數(shù)的嵌套和遞歸調(diào)用。重點(diǎn):函數(shù)的作用、定義和調(diào)用;參數(shù)分類。難點(diǎn):函數(shù)的參數(shù)傳遞、遞歸調(diào)用。第6章Python數(shù)據(jù)分析(4學(xué)時)1.科學(xué)計(jì)算2.Numpy3Scipy4matplotlib5Pandas6Seaborn 基本要求:了解科學(xué)計(jì)算的基本概念;掌握Numpy、Scipy、matplotlib、Pandas、Seaborn的函數(shù)使用方法 重點(diǎn):Numpy、Scipy、matplotlib和Pandas難點(diǎn):Numpy、matplotlib和Pandas第7章Sklearn和NLTK(4學(xué)時)主要內(nèi)容:1.Sklearn2基于Sklearn機(jī)器學(xué)習(xí)3.NLTK4NlTK語料庫5NlTK文本分類 基本要求:了解Sklearn的基本功能,數(shù)據(jù)集,了解基于Sklearn機(jī)器學(xué)習(xí)流程。了解NLTK的基本功能、NLTK語料庫以及NL文本分類。重點(diǎn):Sklearn與NLTK難點(diǎn):Sklearn與NLTK第8章語料清洗(4學(xué)時)主要內(nèi)容:1數(shù)據(jù)清洗方法1.1缺失值清洗 1.2異常值清洗 1.3重復(fù)值清洗2數(shù)據(jù)轉(zhuǎn)換3missingno4詞云基本要求:了解數(shù)據(jù)清洗,掌握缺失值、異常值和重復(fù)值的處理方法;掌握missingno和詞云使用方法重點(diǎn):數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清洗難點(diǎn):缺失值、異常值和重復(fù)值清洗方法第9章特征工程(4學(xué)時)主要內(nèi)容:1特征預(yù)處理 1.1規(guī)范化 1.2標(biāo)準(zhǔn)化 1.3魯棒化 1.4正則化2獨(dú)熱編碼3CountVectorizer4TF-IDF基本要求:了解特征預(yù)處理,掌握規(guī)范化和標(biāo)準(zhǔn)化的處理方法。掌握獨(dú)熱編碼、CountVectorizer和TF-IDF基本原理和使用方法重點(diǎn):特征工程預(yù)處理、獨(dú)熱編碼難點(diǎn):獨(dú)熱編碼、CountVectorizer、TF-IDF第10章中文分詞(4學(xué)時)主要內(nèi)容: 1常見中文分詞方法1.1基于規(guī)則和詞表方法1.2基于統(tǒng)計(jì)方法 2Jieba分詞庫 3HanLP分詞庫 基本要求:了解常見中文分詞方法,掌握J(rèn)ieba分詞庫和HanLP分詞庫。重點(diǎn):Jieba分詞庫和HanLP分詞庫難點(diǎn):Jieba分詞庫和HanLP分詞庫第11章文本分類(4學(xué)時)主要內(nèi)容:1歷史回顧2貝葉斯定理 3樸素貝葉斯分類 3.1GaussianNB類 3.2MultinomialNB類 3.3BernoulliNB類 4支持向量機(jī)4.1線性核函數(shù) 4.2多項(xiàng)式核函數(shù) 4.3高斯核函數(shù)5貝葉斯進(jìn)行垃圾郵件分類基本要求:了解文本分類的歷史回顧、文本分類的相關(guān)方法;掌握貝葉斯定理、樸素貝葉斯分類;了解支持向量機(jī)原理,掌握線性核函數(shù)、多項(xiàng)式核函數(shù)和高斯核函數(shù)。重點(diǎn):貝葉斯定理、樸素貝葉斯分類難點(diǎn):樸素貝葉斯分類、支持向量機(jī)分類第12章文本聚類(4學(xué)時)主要內(nèi)容:1文本聚類步驟2主成分分析 3Kmeans算法步驟 4Kmeans評估指標(biāo)4.1調(diào)整蘭德系數(shù)4.2輪廓系數(shù)5掌握Kmeans進(jìn)行英文和中文聚類 基本要求:了解文本聚類步驟,掌握主成分分析、掌握Kmeans算法步驟,掌握調(diào)整蘭德系數(shù)和輪廓系數(shù)、掌握Kmeans進(jìn)行英文和中文聚類 重點(diǎn):聚類算法、主成分分析、k-means算法步驟難點(diǎn):主成分分析、K-means算法流程,Kmeans進(jìn)行英文和中文聚類第13章指標(biāo)評價(4學(xué)時)主要內(nèi)容:1混淆矩陣2準(zhǔn)確率3精確率4召回率5F1score6ROC曲線7AUC面積8分類評估報告9中文分詞的指標(biāo)10未登錄詞和登錄詞召回率基本要求:掌握混淆矩陣、準(zhǔn)確率、精確率與召回率、F1score、ROC曲線、AUC面積和分類評估報告,中文分詞的指標(biāo)、未登錄詞和登錄詞召回率重點(diǎn):混淆矩陣和分類評估報告難點(diǎn):混淆矩陣、精確率與召回率、ROC曲線、AUC面積,中文分詞的指標(biāo)、未登錄詞和登錄詞召回率第14章信息提?。?學(xué)時)主要內(nèi)容: 1相關(guān)概念 1.1信息 1.2信息熵 1.3互信息 2正則表達(dá)式 2.1基本語法 2.2re模塊 3命名實(shí)體 4馬爾可夫模型 基本要求:了解信息提取的相關(guān)概念,如信息、信息熵、互信息等。掌握正則表達(dá)式的基本語法和re模塊。了解命名實(shí)體和馬爾可夫模型的特點(diǎn)和使用方式。重點(diǎn):正則表達(dá)式的基本語法和re模塊、馬爾可夫模型難點(diǎn):正則表達(dá)式的基本語法和re模塊 第15章情感分析(4學(xué)時)主要內(nèi)容:1情感分析概述2基于情感詞典方法 3textblob 3.1分句和分詞 3.2詞性標(biāo)注 3.3情感分析 4snownlp 4.1分詞 4.2詞性標(biāo)注 4.3斷句 4.4情緒判斷 5小說人物情感分析6電影影評情感分析基本要求:了解情感分析概念、了解基于情感詞典的文本匹配算法、掌握textblob和snownlp、掌握小說人物和電影影評情感分析重點(diǎn):掌握textblob和snownlp難點(diǎn):掌握textblob和snownlp、掌握小說人物和電影影評情感分析三、教學(xué)安排及學(xué)時分配教學(xué)環(huán)節(jié)及學(xué)時主要內(nèi)容學(xué)時分配講課習(xí)題課實(shí)驗(yàn)小計(jì)自然語言處理概述22Python語言簡介22Python數(shù)據(jù)類型224Python流程控制224Python函數(shù)224Python數(shù)據(jù)分析224Sklearn和NLTK224語料清洗224特征工程224中文分詞224文本分類224文本聚類224指標(biāo)評價224信息提取224情感分析224302656四、考核方式最終成績由課堂成績、實(shí)驗(yàn)成績和期末大作業(yè)組成:(1)課堂成績:30%。主要考核課堂和翻轉(zhuǎn)課堂表現(xiàn),課后作業(yè)完成情況。(2)實(shí)驗(yàn)成績:30%,包括課堂小測、實(shí)驗(yàn)報告等,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論