TRS產(chǎn)品與技術(shù)體系總體介紹課件_第1頁(yè)
TRS產(chǎn)品與技術(shù)體系總體介紹課件_第2頁(yè)
TRS產(chǎn)品與技術(shù)體系總體介紹課件_第3頁(yè)
TRS產(chǎn)品與技術(shù)體系總體介紹課件_第4頁(yè)
TRS產(chǎn)品與技術(shù)體系總體介紹課件_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

TRS產(chǎn)品技術(shù)體系總體介紹1交流要點(diǎn)TRS總體產(chǎn)品與技術(shù)體系介紹TRS技術(shù)解決方案介紹(部分)企業(yè)搜索、內(nèi)容管理解決方案知識(shí)管理解決方案內(nèi)網(wǎng)門(mén)戶解決方案TRS相關(guān)產(chǎn)品Demo演示2企業(yè)的信息管理現(xiàn)狀企業(yè)應(yīng)用系統(tǒng)20%80%數(shù)據(jù)倉(cāng)庫(kù)非結(jié)構(gòu)化資源管理各種關(guān)鍵業(yè)務(wù)數(shù)據(jù)各種文本、圖片、郵件等其他未管理但有用的各種信息缺失3TRS公司愿景和技術(shù)理念自主創(chuàng)新搜索整合發(fā)現(xiàn)海量非結(jié)構(gòu)化信息處理TRS產(chǎn)品具有100%的自主知識(shí)產(chǎn)權(quán)現(xiàn)實(shí)世界中80%的信息是非結(jié)構(gòu)化的每18個(gè)月新增的存儲(chǔ)量等于有史以來(lái)存儲(chǔ)量之和!企業(yè)搜索引擎讓人們像使用互聯(lián)網(wǎng)搜索引擎那樣搜索復(fù)雜的企業(yè)信息內(nèi)容管理技術(shù)實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化信息的全生命周期管理(采集、生產(chǎn)、存貯、檢索、發(fā)布、利用)智能挖掘技術(shù)通過(guò)知識(shí)提取和內(nèi)容之間關(guān)系的挖掘,發(fā)現(xiàn)內(nèi)容的新價(jià)值面向全球競(jìng)爭(zhēng)

目標(biāo)是成為中國(guó)和亞洲非結(jié)構(gòu)化信息處理技術(shù)的領(lǐng)導(dǎo)者。4TRS行業(yè)技術(shù)地位自主核心技術(shù)搜索內(nèi)容管理文本挖掘的知識(shí)管理國(guó)家科技進(jìn)步二等獎(jiǎng)為全文檢索和非結(jié)構(gòu)化數(shù)據(jù)庫(kù)第一品牌中文內(nèi)容管理的首倡者國(guó)內(nèi)內(nèi)容管理市場(chǎng)占有率第一覆蓋從內(nèi)容采集、創(chuàng)建、傳遞到分析完整的內(nèi)容全生命周期管理在多次權(quán)威評(píng)測(cè)中名列前茅率先實(shí)現(xiàn)文本挖掘技術(shù)的產(chǎn)品化和實(shí)用化5TRS市場(chǎng)地位

2007年中國(guó)企業(yè)搜索市場(chǎng)主力廠商份額結(jié)構(gòu)2007年中國(guó)內(nèi)容管理市場(chǎng)主力廠商份額結(jié)構(gòu)

2007年中國(guó)Web內(nèi)容管理市場(chǎng)主力廠商份額結(jié)構(gòu)企業(yè)搜索軟件第一名Web內(nèi)容管理軟件第一名主要競(jìng)爭(zhēng)對(duì)手均為國(guó)際知名大廠商

數(shù)據(jù)來(lái)源:賽迪顧問(wèn)2008,36TRS產(chǎn)品架構(gòu)總圖7公司業(yè)務(wù)和主要產(chǎn)品應(yīng)用領(lǐng)域產(chǎn)品類別文本挖掘全文檢索內(nèi)容管理核心技術(shù)結(jié)構(gòu)化信息(20%)非結(jié)構(gòu)化信息(80%)數(shù)據(jù)庫(kù)Oracle/SQLServer/DB2/…置標(biāo)信息XML/網(wǎng)頁(yè)郵件/群件/即時(shí)消息/…Domino/SharePoint/…格式文檔TXT/Office/PDF/PS/音視頻/…紙質(zhì)資源公文/報(bào)告/圖書(shū)/…業(yè)務(wù)應(yīng)用系統(tǒng)OA/ERP/CRM…互聯(lián)網(wǎng)/內(nèi)聯(lián)網(wǎng)專有電子資源光盤(pán)/期刊…桌面數(shù)據(jù)信息源細(xì)分市場(chǎng)網(wǎng)站及內(nèi)容管理市場(chǎng)企業(yè)及垂直搜索市場(chǎng)文本分析與挖掘市場(chǎng)知識(shí)管理和門(mén)戶市場(chǎng)內(nèi)容管理軟件企業(yè)搜索軟件互聯(lián)網(wǎng)信息服務(wù)文本挖掘軟件知識(shí)管理與門(mén)戶信息類型主營(yíng)業(yè)務(wù)與目標(biāo)市場(chǎng)關(guān)系圖企業(yè)內(nèi)容管理電子政務(wù)知識(shí)管理企業(yè)搜索互聯(lián)網(wǎng)垂直搜索輿情監(jiān)控門(mén)戶網(wǎng)站群數(shù)字媒體競(jìng)爭(zhēng)情報(bào)數(shù)字圖書(shū)館8TRS主要產(chǎn)品列表企業(yè)搜索相關(guān)產(chǎn)品TRSDatabaseServer、Cluster、API、GateWayTRSWAS、TRSCDS內(nèi)容管理相關(guān)產(chǎn)品TRSWCM、TRSEKP門(mén)戶及應(yīng)用整合相關(guān)產(chǎn)品TRSPortal、TRSIDS互聯(lián)網(wǎng)信息服務(wù)相關(guān)產(chǎn)品TRSInforadar、TRSCIS、TRSOM文本挖掘基礎(chǔ)產(chǎn)品TRSCKM知識(shí)挖掘工具包9企業(yè)信息化相關(guān)解決方案企業(yè)搜索解決方案網(wǎng)站內(nèi)容管理解決方案企業(yè)知識(shí)管理解決方案企業(yè)內(nèi)網(wǎng)門(mén)戶解決方案10TRS企業(yè)搜索解決方案WorldResearchBlogsNewsProductsTheWebImagesPrintContentEnterpriseFileSharesEnterpriseApplicationIntranetSecureContentDatabasesContentMgmtCRMCorporateWebSiteSpreadsheetsDesktopPresentationsReportsIMChatsDocumentsWebPagesEmail搜索的對(duì)象與范圍12應(yīng)用場(chǎng)景互聯(lián)網(wǎng)搜索垂直搜索服務(wù)企業(yè)內(nèi)部統(tǒng)一檢索服務(wù)某系統(tǒng)內(nèi)部全文檢索服務(wù)13TRS企業(yè)搜索總體架構(gòu)數(shù)據(jù)庫(kù)Web應(yīng)用文件系統(tǒng)多媒體郵件系統(tǒng)Notes等系統(tǒng)檢索入口數(shù)據(jù)庫(kù)網(wǎng)關(guān)網(wǎng)絡(luò)雷達(dá)文件采集郵件采集Notes等網(wǎng)關(guān)擴(kuò)展采集統(tǒng)一身份及單點(diǎn)登錄智能分析與挖掘自動(dòng)分類聚類分析關(guān)聯(lián)分析排重分析分類匯總知識(shí)發(fā)現(xiàn)拼音檢索語(yǔ)義分析全文檢索引擎索引庫(kù)存儲(chǔ)全文檢索引擎檢索集群服務(wù)用戶權(quán)限服務(wù)關(guān)鍵詞檢索語(yǔ)義檢索高級(jí)檢索結(jié)果命中結(jié)果排序14

軟件技術(shù)架構(gòu)15TRS搜索引擎集群架構(gòu)16TRS搜索集群擴(kuò)展機(jī)制17搜索引擎接口體系18基于自然語(yǔ)言特點(diǎn)的索引策略(中文)漢語(yǔ)分詞及字詞混合索引采用語(yǔ)料統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法+歧義規(guī)則實(shí)例知識(shí)庫(kù)的漢語(yǔ)分詞解決方案,切分正確率達(dá)到99.1%。由于漢語(yǔ)分詞不能達(dá)到100%準(zhǔn)確,所以中文檢索系統(tǒng)需要提供一種索引方式(字詞混合索引),保證一定查準(zhǔn)率的同時(shí)提供100%查全的手段。為了兼顧中文檢索的查全和查準(zhǔn),索引程序也要做適應(yīng)性調(diào)整。國(guó)外檢索產(chǎn)品只是簡(jiǎn)單地內(nèi)嵌一個(gè)好的分詞軟件并不能解決問(wèn)題(英文)

英文詞根英文詞根采用”詞典+算法”結(jié)合的解決方案,準(zhǔn)確率達(dá)到99.999%。支持中英文以及其它幾十種主流語(yǔ)言的混合檢索。19支持各種檢索高級(jí)應(yīng)用組合檢索以及屬性字段檢索和全文檢索的聯(lián)合查詢各種邏輯表達(dá)式檢索提供了多達(dá)48種檢索運(yùn)算符多字段相關(guān)性排序支持相關(guān)性排序,并且可以設(shè)置文檔的不同字段以不同的權(quán)重,提升關(guān)鍵字段的權(quán)重分類匯總檢索結(jié)果的分類統(tǒng)計(jì),支持用正則表達(dá)式來(lái)篩選分類統(tǒng)計(jì)的目標(biāo)字段值,并支持抽取部分子串組成新的類別。20檢索的智能語(yǔ)義擴(kuò)展語(yǔ)義分析檢索提供基于短語(yǔ)、句子、段落的模糊檢索

英文大小寫(xiě)敏感檢索、中文簡(jiǎn)繁體擴(kuò)展檢索。支持簡(jiǎn)繁擴(kuò)展檢索,且簡(jiǎn)繁對(duì)照是基于詞語(yǔ)級(jí)語(yǔ)境的,例如:恢復(fù)復(fù)員報(bào)復(fù)復(fù)議:恢復(fù)復(fù)員報(bào)復(fù)復(fù)議

復(fù)雜復(fù)查復(fù)制重復(fù):複雜複查複制重複

檢索時(shí)能夠應(yīng)用同義詞典和主題詞典進(jìn)行擴(kuò)展檢索,并且詞典可維護(hù)拼音檢索、相似檢索21技術(shù)性能優(yōu)勢(shì)實(shí)時(shí)動(dòng)態(tài)索引

索引空間膨脹率小,一般在100%內(nèi)。

提供分布式檢索和負(fù)載均衡集群,以及二級(jí)集群。千萬(wàn)級(jí)數(shù)據(jù)秒級(jí)響應(yīng)支持主流的開(kāi)發(fā)平臺(tái),提供CAPI、JavaBeans和ADO.NET二次開(kāi)發(fā)接口。22企業(yè)搜索應(yīng)用舉例:搜索的應(yīng)用集成檢索結(jié)果的展現(xiàn),建議先作檢索結(jié)果匯總的展現(xiàn)

點(diǎn)擊進(jìn)入各系統(tǒng)結(jié)果界面展現(xiàn)具體列表可以避免異構(gòu)數(shù)據(jù)在統(tǒng)一界面展現(xiàn)的繁瑣23結(jié)果的智能化組織熱點(diǎn)詞自動(dòng)追蹤用戶搜索行為掌握用戶搜索熱點(diǎn)相關(guān)文章推薦1、利用TRSCKM的關(guān)鍵詞抽取+TRSlike函數(shù)檢索實(shí)現(xiàn)

對(duì)于所有文章抽取5個(gè)關(guān)鍵詞,作為另一個(gè)字段存儲(chǔ),每次取得文章后根據(jù)關(guān)鍵詞進(jìn)行如下檢索:keyword=like(‘本文關(guān)鍵詞’,60)。2、可以根據(jù)關(guān)鍵字定義相關(guān)檢索結(jié)果

同音字推薦搜索24結(jié)果的智能化組織信息來(lái)源標(biāo)注,幫助用戶迅速判斷文檔是否所要相關(guān)短語(yǔ)1、預(yù)置數(shù)十萬(wàn)的主題詞庫(kù)提供關(guān)聯(lián)2、提供用戶檢索關(guān)鍵字自動(dòng)采集、關(guān)聯(lián)相關(guān)度模型cosine向量空間模型簡(jiǎn)單講:1、根據(jù)關(guān)鍵字在文章出現(xiàn)的頻度自動(dòng)匹配2、關(guān)鍵字與主題的相關(guān)性3、剔除貢獻(xiàn)較小的虛詞、助詞等25結(jié)果的人性化展現(xiàn)26TRS內(nèi)容管理解決方案TRSWCM簡(jiǎn)介T(mén)RSWCM是TRS內(nèi)容管理產(chǎn)品家族中的核心成員國(guó)內(nèi)首款基于SOA架構(gòu)的內(nèi)容管理平臺(tái)產(chǎn)品可以輕松創(chuàng)建內(nèi)部門(mén)戶、外部門(mén)戶、媒體門(mén)戶、信息共享平臺(tái)、組織工作協(xié)作平臺(tái)等等TRSWCM的功能集成文字庫(kù)、圖片庫(kù)、視頻庫(kù)、資源庫(kù),四位一體,構(gòu)成業(yè)界最為強(qiáng)大、完善的內(nèi)容管理應(yīng)用平臺(tái);集成強(qiáng)大的工作流引擎與基于表單的網(wǎng)上辦事功能,突破并豐富了內(nèi)容管理內(nèi)涵擴(kuò)展提供內(nèi)容評(píng)論、問(wèn)卷調(diào)查、智能處理、在線訪談、博客、廣告管理、可視化模板等的即插即用的功能選件,極大擴(kuò)展了內(nèi)容管理外延全面支持Web

Service,具有靈活的擴(kuò)展集成應(yīng)用與二次開(kāi)發(fā)功能系統(tǒng)與TRS全文檢索、信息采集、信息分發(fā)、單點(diǎn)登錄等產(chǎn)品無(wú)縫集成應(yīng)用,為用戶提供最為完善、先進(jìn)的內(nèi)容管理解決方案28定位:一套系統(tǒng)實(shí)現(xiàn)多種應(yīng)用一套內(nèi)容管理平臺(tái),就可以建立外部大型站點(diǎn)、內(nèi)部信息門(mén)戶、內(nèi)部辦公平臺(tái),部署不同的內(nèi)容管理應(yīng)用。TRSWCM外部網(wǎng)站內(nèi)部門(mén)戶辦公平臺(tái)通訊平臺(tái)29網(wǎng)站群的管理模式30TRS知識(shí)管理解決方案TRS內(nèi)網(wǎng)門(mén)戶解決方案TRS產(chǎn)品相關(guān)演示TRSWCMDemo演示TRS檢索Demo演示TRS知識(shí)管理Demo演示TRS內(nèi)網(wǎng)門(mén)戶Demo演示33TRS重點(diǎn)產(chǎn)品介紹TRSCKM產(chǎn)品介紹其他(根據(jù)現(xiàn)場(chǎng)要求)34TRS中文知識(shí)管理工具包(TRSCKM)主要功能是為中文文本應(yīng)用提供開(kāi)發(fā)工具箱。它集成了TRS公司最新推出的多項(xiàng)中文處理技術(shù)。工具包組成

TRS文本分類工具TRS文本摘要工具TRS文本聚類工具

TRS相似性檢索工具TRS文本分詞工具TRS政治常識(shí)校對(duì)工具

TRS信息過(guò)濾工具TRS相關(guān)短語(yǔ)檢索工具TRS拼音同音檢索工具調(diào)用

各功能模塊均提供ANSIC和webservice標(biāo)準(zhǔn)接口,可以輕松地嵌入到各種編程環(huán)境中。目前已經(jīng)被TRS網(wǎng)絡(luò)雷達(dá)系統(tǒng)等多個(gè)TRS產(chǎn)品及項(xiàng)目采用。35功能模塊簡(jiǎn)介自動(dòng)分詞

可以對(duì)文本進(jìn)行分詞,識(shí)別文本中的人名、地名、組織機(jī)構(gòu)名等信息,是各種文本應(yīng)用的基礎(chǔ)。自動(dòng)分類

可以自動(dòng)地對(duì)文檔進(jìn)行分類,賦予文檔一個(gè)預(yù)先定義的類別主題詞,便于文檔的組織,不需人工干預(yù)。自動(dòng)摘要+主題詞標(biāo)引

可以提取文本的主題,自動(dòng)生成文本摘要,為用戶快速瀏覽信息提供快捷有效的方式。36功能模塊簡(jiǎn)介自動(dòng)聚類可以自動(dòng)對(duì)文檔進(jìn)行歸類,把內(nèi)容相近的文檔歸為一類,并自動(dòng)為該類生成主題詞。

相似性檢索(自動(dòng)排重)

可以幫助用戶檢索與給定文檔相似的文檔,可以應(yīng)用于文檔查重等諸多領(lǐng)域。(政治)常識(shí)校對(duì)

可以對(duì)文章中敏感的政治內(nèi)容進(jìn)行校對(duì),是審稿,校對(duì)過(guò)程的有效工具。37功能模塊簡(jiǎn)介自動(dòng)過(guò)濾

識(shí)別和過(guò)濾各種有害文本信

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論