1、協方差矩陣中的每一個元素是表示的隨機向量X的不同分量之間的協方差,而不是不同樣本之間的協方差,如元素Cij就是反映的隨機變量Xi, Xj的協方差。
2、2、協方差是反映的變量之間的二階統計特性,如果隨機向量的不同分量之間的相關性很小,則所得的協方差矩陣幾乎是一個對角矩陣。
(資料圖)
3、對于一些特殊的應用場合,為了使隨機向量的長度較小,可以采用主成分分析的方法,使變換之后的變量的協方差矩陣完全是一個對角矩陣,之后就可以舍棄一些能量較小的分量了(對角線上的元素反映的是方差,也就是交流能量)。
4、特別是在模式識別領域,當模式向量的維數過高時會影響識別系統的泛化性能,經常需要做這樣的處理。
5、3、必須注意的是,這里所得到的式(5)和式(6)給出的只是隨機向量協方差矩陣真實值的一個估計(即由所測的樣本的值來表示的,隨著樣本取值的不同會發生變化),故而所得的協方差矩陣是依賴于采樣樣本的,并且樣本的數目越多,樣本在總體中的覆蓋面越廣,則所得的協方差矩陣越可靠。
6、4、如同協方差和相關系數的關系一樣,我們有時為了能夠更直觀地知道隨機向量的不同分量之間的相關性究竟有多大,還會引入相關系數矩陣。
7、 在概率論和統計學中,相關或稱相關系數或關聯系數,顯示兩個隨機變量之間線性關系的強度和方向。
8、在統計學中,相關的意義是用來衡量兩個變量相對于其相互獨立的距離。
9、在這個廣義的定義下,有許多根據數據特點而定義的用來衡量數據相關的系數。
10、對于不同數據特點,可以使用不同的系數。
11、最常用的是皮爾遜積差相關系數。
12、其定義是兩個變量協方差除以兩個變量的標準差(方差)。
13、皮爾遜積差系數數學特征其中,E是數學期望,cov表示協方差。
14、因為μX = E(X),σX2 = E(X2) ? E2(X),同樣地,對于Y,可以寫成當兩個變量的標準差都不為零,相關系數才有定義。
15、從柯西—施瓦茨不等式可知,相關系數不超過1. 當兩個變量的線性關系增強時,相關系數趨于1或-1。
16、當一個變量增加而另一變量也增加時,相關系數大于0。
17、當一個變量的增加而另一變量減少時,相關系數小于0。
18、當兩個變量獨立時,相關系數為0.但反之并不成立。
19、 這是因為相關系數僅僅反映了兩個變量之間是否線性相關。
20、比如說,X是區間[-1,1]上的一個均勻分布的隨機變量。
21、Y = X2. 那么Y是完全由X確定。
22、因此Y 和X是不獨立的。
23、但是相關系數為0。
24、或者說他們是不相關的。
25、當Y 和X服從聯合正態分布時,其相互獨立和不相關是等價的。
26、當一個或兩個變量帶有測量誤差時,他們的相關性就受到削弱,這時,“反衰減”性(disattenuation)是一個更準確的系數。
本文分享完畢,希望對大家有所幫助。
關鍵詞: