數據科學導引10.9預處理_第1頁
數據科學導引10.9預處理_第2頁
數據科學導引10.9預處理_第3頁
數據科學導引10.9預處理_第4頁
數據科學導引10.9預處理_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、DataDataSignalHowtosingogtoDigitalDataDataSignalHowtosingogtoDigitalleacontinuousThephenomenonofFastFourieristicalDefinitionofleandleisticsandfeatureFeatureMissingobservationandr數據科學導引,歐高炎 et數統(tǒng),et抽樣:數據科學導引,歐高炎 et數統(tǒng),et抽樣:論與應用,勇The1972WaldLecture,Robustistics: etSisticalSourceofrandomnessinSisticalSou

2、rceofrandomnessinWhenthepopulationislarge,needtoleWhenthereisun-controlledorun-controllableerrorin the experiment.Effectivelytocollect 抽樣論,試驗設計EffectivelytousetheExtractinformation,makeinferenceandaccurateandrobustScientificWhatisPopulation(總體 在WhatisPopulation(總體 在統(tǒng)計中,常把研究問題中所關心的對象全le(樣本由于人物的限制,無法對

3、總體所有的對逐個進觀WhatisInformalathematicalWhatisInformalathematicalistics:theleoffiniterealizationsofarandom如:在同一架天平上將一個物體秤n次,得到數據則它們的全體,X=(X1,Xn),稱為樣本。n稱為樣本大小WhatisleofWhatisleofrepresentsoneX(!)21, ,6 , Aleconsistsoftwoindependent(X1,X2)=(X(!1),X(!2)Demo:tosimulateusingcomputerinaidofthe pseudo random nu

4、mber generatorSisticsofGivenSisticsofGivenx1,x9,howtoestimatetheirUse(x1+x2+x3+Sortinincreasingorder:x(1)=x(2)=x(3)= ?2!)D=0!&($ ).+ 8 0?2 B! &+?2!/4%!&+(&?20 : 5#!&-&.(Minkowskidistancein!M&Minkowskidistancein!M&!#$%&$%()$%*+ ,#$-&$-()$-*.+ 0)%$!-1 . ,(lcase:Minkowskidistancein!# &*+Minkowskidistan

5、cein!# &*+,-./0-1/,2,-.30-13,242,-.50-15 !,-./0-1/,32,-.30-13,3242,-.50-&( *+ !8%!Minkowskidistancein! ! ! % Minkowskidistancein! ! ! % % % 特征特征12352045Distancen2ImageSearch(informationDistancen2ImageSearch(informationext,distancentwooftwolanguagesExtractfeatures,computeEuclideandistance/ cosine sim

6、ilarityMysteryofdeepconvolutionalneuralIEEEIEEEStandardfor Floating-Arithmetic(IEEEWhy nP4r7IZob$ Why nP4r7IZob$ 2SiK,-c$_ Y3neOZ XSsa+em*fsa GjnPt2So .01t2S! 2S8 2 0Standardization: Z-MotivedbyGaussianStandardization: Z-MotivedbyGaussianNormalizethefeaturespacetobe+D2 GA 9SC & 1M ? G7 G9SStandardiz

7、ation:MotivedbyUniform methefeaturespaceis$nP6H!a.a5HStandardization:MotivedbyUniform methefeaturespaceis$nP6H!a.a5H! H !_1K9 =:x=)K9O&7+!#$%i -()Oa5*+a &0&,#R#,=C3GTJ8EAB(V12WK9Oa./+PU H WhyWhykv JAfnp+, 1zztr !& 9 # 3 $ 0! .9D: 3 5 9# 1393 : 1& #D:$ 535&$& #D:$ 55:$ # :*:!%: !D. D4 34 / 2-4# D.4 *

8、 6) 00=E$ &FA B814 (!D.6E!#$% 4 &F14 : !DC4 / $1? 5) DifferentwaysofFixed-unsigned:AnN-bitbinaryword,DifferentwaysofFixed-unsigned:AnN-bitbinaryword,retedasunsignedfixed-rational,cantakeonvaluesfromsubsetPofthenon-negativerationalsgivenb=p/2 1,p2PpFloat-Exercise:HowmanydistinctnumbersarethereineachB

9、asicmethodsofBasicmethodsofChallenge: 高維情! $ # % % ) ! MissingandrInprobability(largedeviation)MissingandrInprobability(largedeviation)theor,observeanrisarareArareeventcanhaveabigAlewhohasmissingfeaturecanregardedasanr Butthereasonwhyafeatureismissingcanbe very different.WhythereismissingWhythereism

10、issing!# $ WhythereismissingWhythereismissing叼啄,造成某些產數據缺失DealwithMissingIfsomedataismissing,DealwithMissingIfsomedataismissing,howcanweion(插補法MeanNearestneighborOtherCollaborative Bayesian(HMM,KalmanMean?4% 7# + 4% + K+ 4% 2 +/ The Mean?lWf1 0= Y JM ?:mOW Lo ?: H YJMX;QGb5(3Qkn+QKdJMKdJMUVH%cF.le: N

11、ew impact on stock ImpactofImpactofrr !r !r # r # (G+F!%95 EB4A36!c67*1- +F6 $O6!7*? ? :;=& *EB6e78196e8?a *? 8?C*?IrherhestockrhestockrhestockIn IEEE Standard for Floating-Po Arithmetic(IEEE754In IEEE Standard for Floating-Po Arithmetic(IEEE754),WhatisthemachineHowto(machinethestockDemoofPseudorandomnumberrand():uniformDemoofPseudorandomnumberrand():uniformnDemois a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論