基于格式模板與內(nèi)容模板的web應(yīng)用程序整合研究_第1頁
基于格式模板與內(nèi)容模板的web應(yīng)用程序整合研究_第2頁
基于格式模板與內(nèi)容模板的web應(yīng)用程序整合研究_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于格式模板與內(nèi)容模板的web應(yīng)用程序整合研究

0計(jì)算機(jī)技術(shù)在教學(xué)中的應(yīng)用隨著計(jì)算機(jī)在辦公室自動(dòng)化工作中的廣泛應(yīng)用,應(yīng)用作文進(jìn)入了一個(gè)新階段。用計(jì)算機(jī)寫作已經(jīng)成為一種新的寫作方法。由于應(yīng)用作文格式的標(biāo)準(zhǔn)化和內(nèi)容標(biāo)準(zhǔn)化,幾種應(yīng)用模型也是結(jié)合在一起的。應(yīng)用文本文件模型不僅可以極大地節(jié)省寫作時(shí)間,還可以最大限度地減少錯(cuò)誤,提高規(guī)范水平,有效提高辦公室效率。因此,越來越多的作家希望擁有實(shí)用的文本文件模型。在國外,計(jì)算機(jī)輔助寫作的研究大概始于20世紀(jì)60年代,美國伊利諾斯大學(xué)的研究人員為教學(xué)研制了計(jì)算機(jī)輔助寫作系統(tǒng)PLATO1,其方式是讓學(xué)生回答計(jì)算機(jī)提出的問題.在我國,計(jì)算機(jī)輔助寫作的研究大約始于20世紀(jì)80年代,雖然起步較晚,但發(fā)展迅速.應(yīng)用文輔助寫作是計(jì)算機(jī)輔助寫作的重要部分,香港大學(xué)教育學(xué)院母語教學(xué)教師支援中心岑紹基等學(xué)者對(duì)于應(yīng)用文計(jì)算機(jī)輔助寫作進(jìn)行了研究2,他們主要研究了9類實(shí)用的應(yīng)用文類型結(jié)構(gòu)、寫作技巧,給出范文示例,提供互動(dòng)練習(xí)平臺(tái),以幫助學(xué)校師生提高應(yīng)用文寫作水平;2002年大連理工大學(xué)金博等提出從樣本及例文庫中檢索出模板所需的寫作材料的方法3,根據(jù)Halliday的語篇理論,從計(jì)算機(jī)角度給出了與語篇相對(duì)應(yīng)的語塊概念、語塊的特征標(biāo)識(shí),主要根據(jù)語塊特征和受控語言檢索方法,從樣本庫中檢索出語塊,構(gòu)成模板所需的寫作材料.近十年來,計(jì)算機(jī)輔助寫作研究在理論上取得一定的進(jìn)展.從應(yīng)用角度看,出現(xiàn)了應(yīng)用文機(jī)輔寫作的商業(yè)化軟件,即利用模板、導(dǎo)航等技術(shù)來實(shí)現(xiàn)應(yīng)用文機(jī)輔寫作.盡管社會(huì)對(duì)應(yīng)用文模板具有強(qiáng)烈的需求,計(jì)算機(jī)輔助寫作及其相關(guān)領(lǐng)域的研究也有所發(fā)展,但圍繞應(yīng)用文格式與內(nèi)容模板展開的整合研究還沒有突破性進(jìn)展,主要原因是關(guān)鍵技術(shù)不成熟以及計(jì)算機(jī)輔助寫作的智能程度不高.而應(yīng)用文格式與內(nèi)容模板整合研究可以較好地減少應(yīng)用文寫作中格式排版的重復(fù)勞動(dòng),節(jié)約人力,提高寫作效率;也可以解決應(yīng)用文寫作中各種較為明顯的內(nèi)容缺陷,提高應(yīng)用文質(zhì)量;從而提高各類組織應(yīng)用文制作的總體水平.1文分類管理子系統(tǒng)通過對(duì)用戶進(jìn)行問卷調(diào)查及對(duì)調(diào)查結(jié)果進(jìn)行分析及參考面向高校師生的應(yīng)用文CAW系統(tǒng)4的軟件結(jié)構(gòu),系統(tǒng)的總體結(jié)構(gòu)圖1所示.從圖1可知,系統(tǒng)由5個(gè)子系統(tǒng)組成.應(yīng)用文分類管理子系統(tǒng)在整個(gè)系統(tǒng)起調(diào)度、導(dǎo)航的作用.通過應(yīng)用文分類管理子系統(tǒng),用戶可以對(duì)應(yīng)用文的分類以及各類應(yīng)用文的格式、內(nèi)容進(jìn)行有效地管理,并提供對(duì)應(yīng)用文寫作方法簡(jiǎn)介、格式文件設(shè)置等;格式模板設(shè)置子系統(tǒng)收集了大量的應(yīng)用文文體的寫作模板,并按系統(tǒng)的要求制作成格式模板庫和格式模板文件,同時(shí)也允許用戶自定義應(yīng)用文文體的格式模板及格式模板文件;內(nèi)容模板維護(hù)子系統(tǒng)允許用戶把收集到的素材添加到內(nèi)容模板庫中;用戶通過檢索子系統(tǒng)可按照不同的檢索途徑來搜索內(nèi)容模板庫,檢索出符合要求的范例,目前該子系統(tǒng)主要提供了文種、標(biāo)題、關(guān)鍵詞、行業(yè)性質(zhì)等檢索途徑,同時(shí)考慮到基于關(guān)鍵詞的檢索可能會(huì)檢索出大量無關(guān)的案例,因此也提供一種基于案例內(nèi)容的文本模糊檢索方法;文檔生成子系統(tǒng)主要實(shí)現(xiàn)一篇應(yīng)用文的生成過程.2系統(tǒng)格式模板實(shí)現(xiàn)途徑應(yīng)用文寫作過程要求具有格式規(guī)范、用語恰當(dāng)以及多方面的專門知識(shí),既是具有一定創(chuàng)造性的活動(dòng),同時(shí)又包含許多重復(fù)而繁瑣的工作,這類工作對(duì)于人是不勝其煩的,而對(duì)計(jì)算機(jī)卻可以通過模板技術(shù)輕易實(shí)現(xiàn).應(yīng)用文格式模板是對(duì)每一種應(yīng)用文文體的各組成部分及其格式進(jìn)行定義的一種填充框架.系統(tǒng)對(duì)格式模板的實(shí)現(xiàn)有兩種途徑:(1)自動(dòng)生成格式模板文件.通過如表1所示結(jié)構(gòu)的數(shù)據(jù)表來存儲(chǔ)應(yīng)用文文體的各組成部分及格式定義,然后根據(jù)這些定義自動(dòng)生成格式模板文件.這主要是開發(fā)工具可以通過OLE對(duì)象直接對(duì)文檔(如Word文檔等)進(jìn)行格式設(shè)置和添加內(nèi)容.(2)預(yù)先設(shè)置格式模板文件.用戶預(yù)先把應(yīng)用文文體的格式設(shè)置好,并把其每一組成部分存儲(chǔ)在數(shù)據(jù)表中.系統(tǒng)運(yùn)行時(shí),可以利用OLE對(duì)象中的替換功能把格式模板文件中的各組成部分用內(nèi)容替換掉.采用兩種途徑主要是因?yàn)橛行└袷胶茈y通過VBA來實(shí)現(xiàn),這時(shí)通過預(yù)設(shè)的格式模板文件可以減輕系統(tǒng)的開發(fā)難度,同時(shí)又能滿足用戶的需要.格式模板實(shí)現(xiàn)途徑(1)的關(guān)鍵代碼如下:3文本處理及安全學(xué)習(xí)應(yīng)用文正文內(nèi)容撰寫是應(yīng)用文寫作的核心,有針對(duì)性地選擇范例、充實(shí)素材是提高應(yīng)用文質(zhì)量,保證其內(nèi)容準(zhǔn)確規(guī)范的重要途徑5.在應(yīng)用文計(jì)算機(jī)機(jī)輔作寫作系統(tǒng)中,需要從內(nèi)容模板庫中檢索出所需的寫作材料,并以此為參照完成應(yīng)用文寫作.對(duì)內(nèi)容模板庫分類的傳統(tǒng)方式是按照名稱定義的,這樣定義是不完整的,有時(shí)使用者并不知道所需的應(yīng)用文在內(nèi)容模板庫中屬于哪種類型,只知道何種用戶所用,或者用于何種用途,并且有時(shí)用戶檢索的用途與內(nèi)容模板庫中定義的用途不一致,造成檢索失敗.而出現(xiàn)在文摘中的詞要比未出現(xiàn)在文摘中的詞更能表達(dá)文章的主題,因而對(duì)檢索貢獻(xiàn)更大,因此,本系統(tǒng)在內(nèi)容模板庫的基礎(chǔ)上又定義了包括用戶、用途、自動(dòng)文摘3種類型的檢索形式,便于用戶對(duì)內(nèi)容模板庫進(jìn)行檢索.其中,應(yīng)用文范例的用戶及用途是比較明確的,而如何有效生成自動(dòng)文摘,以便提高用戶檢索的速度和準(zhǔn)確性是本系統(tǒng)研究的一個(gè)重要內(nèi)容.傳統(tǒng)的自動(dòng)文摘的方法主要有基于統(tǒng)計(jì)的機(jī)械式摘要和基于語法語義分析的理解式摘要.機(jī)械式摘要在技術(shù)上易于實(shí)現(xiàn),應(yīng)用領(lǐng)域廣泛,但生成的文摘不連貫、不簡(jiǎn)潔、內(nèi)容不全面.基于理解方法生成的文摘可讀性好,但由于自然語言處理技術(shù)至今不成熟,若想獲取高質(zhì)量的摘要,必須將待處理的語料限制在某個(gè)領(lǐng)域內(nèi).而考慮到應(yīng)用文的特殊性,即大多數(shù)應(yīng)用文都有幾個(gè)主題詞,因此可以直接把這些主題詞作為特征信息.應(yīng)用文內(nèi)容模板庫中的自動(dòng)文摘是為檢索服務(wù)的,因此文摘的抽取方法是面向檢索的,本系統(tǒng)采用的是直接抽取句子或詞組組成文摘.筆者認(rèn)為,用戶在檢索文檔時(shí),如果一個(gè)句子包含用戶提交的查詢?cè)~,那么用戶很可能認(rèn)為這個(gè)文檔是與自己的查詢相關(guān),因此經(jīng)過分析多種比較適合應(yīng)用文內(nèi)容的自動(dòng)文摘生成方法68,本系統(tǒng)先用文獻(xiàn)SQL模型方法生成粗略的自動(dòng)文摘,然后用文獻(xiàn)的方法減小文摘冗余度.SQL模型的的基本思想是對(duì)集合中的每個(gè)文檔建立一個(gè)語言模型S,然后基于產(chǎn)生查詢概率對(duì)文檔進(jìn)行排序.在內(nèi)容核模板的構(gòu)建中,假定查詢句是由一系列相互獨(dú)立的詞構(gòu)成(甚至可以進(jìn)一步簡(jiǎn)化為應(yīng)用文的關(guān)鍵詞),于是查詢概率PQS可以用每個(gè)查詢?cè)~概率的乘積估算出來其中qi是查詢句中第i個(gè)關(guān)鍵詞,PqiS是指文摘語言模型.P(wS)=λPMLwS+(1-λ)PML(wColl),是平滑系數(shù),可以簡(jiǎn)單取0~1之間的任意數(shù);PMLwS是w出現(xiàn)在文檔S中的極大似然估計(jì),可以通過w出現(xiàn)在文摘中的次數(shù)來計(jì)算.各句的查詢概率計(jì)算出來后,依據(jù)其值將各句降序排列.摘要構(gòu)造方法是依次將概率最大的句子抽取出來,直到摘要達(dá)到指定的長度,摘要的長度是通常是原文的5%~25%(可由用戶設(shè)置),接著將這些從原來抽取的文摘句重新組織,按其在原文中的順序排列,這樣文檔的粗文摘就生成了.生成的粗文摘中往往會(huì)出現(xiàn)文摘冗余的問題,因?yàn)槌槿〉奈恼渥佣际呛苤匾木渥?但文檔中經(jīng)常會(huì)有關(guān)于某一方面重復(fù)描述的一些句子,所以要通過句子的相似度計(jì)算減少文摘中這樣的句子,但是出現(xiàn)查詢關(guān)鍵詞的語句不予考慮,對(duì)于相似度大于指定閾值的文摘句,只保留重要度高的一句,丟棄另一句.4web內(nèi)容模板整合算法格式模板與內(nèi)容模板的整合主要體現(xiàn)在兩個(gè)方面:(1)在設(shè)置應(yīng)用文內(nèi)容模板時(shí),可以根據(jù)對(duì)應(yīng)的應(yīng)用文文體的格式表中的各組成部分輸入相應(yīng)的內(nèi)容.(2)當(dāng)通過檢索子系統(tǒng)找到對(duì)應(yīng)的內(nèi)容模板時(shí),按照格式模板的定義先設(shè)置格式后輸出內(nèi)容.其算法流程圖如圖2所示.應(yīng)用文格式與內(nèi)容模板的結(jié)合主要體現(xiàn)在文檔生成子系統(tǒng),文檔生成子系統(tǒng)主要有兩種方式:一種是通過檢索子系統(tǒng)找到內(nèi)容模板,然后按照格式模板的定義先設(shè)置格式后輸出內(nèi)容;另一種是用戶按照格式模板中定義的組成部分的內(nèi)容,然后利用OLE對(duì)象和VBA技術(shù)生成應(yīng)用文,在這個(gè)過程中,用戶可以隨時(shí)參考內(nèi)容模板和寫作幫助,從而寫出格式規(guī)范及用語準(zhǔn)確的應(yīng)用文.5文本處理及應(yīng)用還處于開發(fā)階段,使用者一般在文本文介紹了筆者自主開發(fā)的應(yīng)用文計(jì)算機(jī)輔助寫作系統(tǒng)的總體結(jié)構(gòu)及實(shí)現(xiàn)方法,經(jīng)用戶試用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論