版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)圖新服務(wù)研發(fā)關(guān)鍵技術(shù)技術(shù)與產(chǎn)品中心1為啥要講點技術(shù)?2關(guān)鍵技術(shù)領(lǐng)域3主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務(wù)相關(guān)技術(shù)規(guī)范與標準 4文本數(shù)據(jù)庫數(shù)據(jù)庫是什么?GoogleBaidu萬方數(shù)據(jù)知識服務(wù)平臺他們是數(shù)據(jù)庫嗎?他們的底層系統(tǒng)是數(shù)據(jù)庫技術(shù)嗎?5文本數(shù)據(jù)庫存儲對象:文獻等文本內(nèi)容:期刊論文、學位論文、會議論文、專利特點:文本數(shù)據(jù)特有的結(jié)構(gòu)關(guān)系:重復、層級 刪改少,增加、檢索操作(對應(yīng)CRUD四個計算機操作)海量數(shù)據(jù)的處理能力B*樹索引結(jié)構(gòu)與算法6WFIRC存儲XML格式支持文本、數(shù)值、日
2、期、貨幣等數(shù)據(jù)類型索引全文索引:權(quán)重、分詞策略整字段索引稀疏值索引檢索表達式CQL檢索結(jié)果自動聚類檢索結(jié)果文獻的學科、期刊、時間等分布情況秒級響應(yīng)7WFIRC在知識服務(wù)平臺的應(yīng)用特色多指標綜合排序相關(guān)度標題、關(guān)鍵詞、摘要、其他文獻質(zhì)量被引次數(shù)、核心刊、瀏覽次數(shù)、下載次數(shù)文獻新舊程度論文發(fā)表時間根據(jù)經(jīng)驗在知識服務(wù)平臺推薦使用的三種排序方式新論文優(yōu)先相關(guān)度優(yōu)先經(jīng)典論文優(yōu)先8WFIRC在知識服務(wù)平臺的應(yīng)用特色檢索結(jié)果聚類查全查準的特色考慮“和服”問題的處理9主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式
3、服務(wù)相關(guān)技術(shù)規(guī)范與標準10自動標引、自動分類人工智能、機器學習學什么?怎么學?學習成果什么?如何應(yīng)用學習成果進行工作?1112萬方數(shù)據(jù)知識服務(wù)平臺標引與分類工具特色基于共現(xiàn)詞的相關(guān)詞網(wǎng)絡(luò)基于最長詞優(yōu)先的分詞策略基于千萬級文獻語料的學習13主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務(wù)相關(guān)技術(shù)規(guī)范與標準WIKI知識分享與管理 14用戶的期望與失望所得所想所看15用戶研究和交互設(shè)計用戶研究用戶的目標用戶的行為模型交互設(shè)計系統(tǒng)與用戶交互的流程信息設(shè)計何時何地何信息?視覺設(shè)計強調(diào)、弱化結(jié)構(gòu)、關(guān)系16矛
4、盾用戶希望付出少、得到多需要展示的信息量多、界面有限界面信息量多、用戶關(guān)注點少17萬方數(shù)據(jù)知識服務(wù)平臺交互式檢索與頁面信息揭示交互式檢索:一框式進入交互反饋啟發(fā)式信息提供頁面精簡顯示、重點突出18主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務(wù)相關(guān)技術(shù)規(guī)范與標準WIKI知識分享與管理 19知識脈絡(luò)客觀事實的展示基于海量文獻的分析共現(xiàn)詞、引用關(guān)系的應(yīng)用20主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式
5、服務(wù)相關(guān)技術(shù)規(guī)范與標準21技術(shù)方案檢測算法基于數(shù)字指紋 基于詞頻統(tǒng)計 基于VSM的方法基于文本序列模式的方法22萬方數(shù)據(jù)知識服務(wù)平臺-論文相似性檢測服務(wù)基于文本序列模式的方法特點:速度快精準23主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務(wù)相關(guān)技術(shù)規(guī)范與標準24訪問量大了怎么辦?舉例25優(yōu)化軟件添加硬件架構(gòu)支持能力本地服務(wù)集群多節(jié)點IDC機房26萬方數(shù)據(jù)知識服務(wù)平臺集群與分布式方案優(yōu)化軟件支持擴展的架構(gòu):SOALTM管理GTM管理27主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務(wù)相關(guān)技術(shù)規(guī)范與標準28Html、xmlhttp、httpsRSS、ATOMZ39.50、S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度專業(yè)牧場代牧服務(wù)標準合同4篇
- 2025年度臨時停車場帳篷搭建施工合同范本3篇
- 2024物流包裝與裝卸合同
- 2025年度智慧家居產(chǎn)品研發(fā)承包經(jīng)營合同書范文4篇
- 2025年度桉樹種植與生物質(zhì)能利用技術(shù)研發(fā)合同3篇
- 2025年個人汽車抵押貸款抵押權(quán)設(shè)立及轉(zhuǎn)讓合同4篇
- 2025年度住宅小區(qū)地下車庫車位使用權(quán)購買合同范本4篇
- 2025年度文化產(chǎn)業(yè)園開發(fā)承包合同股東內(nèi)部合作協(xié)議4篇
- 2024年甲乙雙方石材供需合同
- 2025年度新能源項目地質(zhì)鉆孔工程承包協(xié)議4篇
- 中國大百科全書(第二版全32冊)08
- 初中古詩文言文背誦內(nèi)容
- 天然氣分子篩脫水裝置吸附計算書
- 檔案管理項目 投標方案(技術(shù)方案)
- 蘇教版六年級上冊100道口算題(全冊完整版)
- 2024年大學試題(宗教學)-佛教文化筆試考試歷年典型考題及考點含含答案
- 計算機輔助設(shè)計智慧樹知到期末考試答案章節(jié)答案2024年青島城市學院
- 知識庫管理規(guī)范大全
- 電腦耗材實施方案、供貨方案、售后服務(wù)方案
- 環(huán)衛(wèi)項目年終工作總結(jié)
- 弘揚教育家精神爭做四有好老師心得10篇
評論
0/150
提交評論