文档库 最新最全的文档下载
当前位置:文档库 › 第四章实证结果与分析第一节敍述统计分析

第四章实证结果与分析第一节敍述统计分析

第四章实证结果与分析第一节敍述统计分析
第四章实证结果与分析第一节敍述统计分析

第四章實證結果與分析

第一節敍述統計分析

由Scholes and Wolfson(1992)的模型可得知,總稅率為有效稅率與隱含稅率之和。表4-1列示本研究迴歸式中各變數之敘述性統計量,其中有效稅率之平均值約為22.53%,低於中國大陸企業所得稅之名目稅率33%,顯示整體上市公司普遍享有優渥的租稅優惠。雖然上市公司之有效稅率未達稅法上名目稅率,但隱含稅率之平均值約為18.33%,實際總稅率已達40.86%(18.33%+22.53%),大於稅法上名目稅率,符合隱含稅理論之預期,亦即繳納較低名目稅率者,仍須負擔隱含稅,兩者合計數並不低於法定之名目稅率。至於實際總稅率大於名目稅率的原因,本文認為係因稅法對於部分支出及費用設有扣除標準,以致於依據稅務會計所計算的課稅所得額高於財務會計所計算的稅前淨利,造成實際總稅率大於名目稅率。

股東權益稅前報酬率之平均值為0.12425,表示公司平均而言股東權益之報酬率為12.43%,但是股東權益稅前報酬率最小值為-0.1768、最大值為0.67033,顯示上市公司間股東權益稅前報酬率差異相當大。公司成長機會替代變數TobinQ 之平均值約5.43,反映中國大陸整體上市公司市值約為其帳面值之五倍,即平均而言上市公司市價高於其財務上之帳面價值,且上市公司TobinQ最小值為1.209,表示全體上市公司之市值皆高於其帳面值,反映中國大陸上市公司目前為一個成長型的市場。產業虛擬變數之平均值,表示該產業上市公司家數占總產業上市公司家數之比例,如製造業之虛擬變數I_MFG平均值為0.58038,表示上市公司中有58.04%之公司為製造業,充分反映中國大陸目前是世界生產重鎮。

表4-1 樣本各變數之敘述性統計值(N=6,208家)

變數平均值標準差最小值最大值IMPRATE (隱含稅率)0.18330 0.17583 0 1 ETR (有效稅率)0.22532 0.16220 0 1 PTROE (股東權益稅前報酬率)0.12425 0.12443 -0.17680 0.67033 CR (市場集中度)0.24474 0.19108 0.09308 0.94990 MS (市場占有率)0.00727 0.01578 0.00007 0.10632 SIZE (公司規模) 6.20412 0.37317 5.42181 7.27277 TobinQ (公司成長機會) 5.42596 5.10143 1.20919 30.57824 I_AGRI(農林牧漁業)0.01949 0.13825 0 1

I_MINING(採掘業)0.01514 0.12213 0 1

I_GAS(煤氣與水供應業)0.04301 0.20289 0 1

I_BUILD(建築業)0.02159 0.14534 0 1

I_TRANS(交通運輸業)0.04398 0.20506 0 1

I_RETAIL(批發零售業)0.07668 0.26610 0 1

I_ESTATE(房地產業)0.04462 0.20648 0 1

I_SERVICE(社會服務業)0.03125 0.17401 0 1

I_MEDIA(傳播文化業)0.00467 0.06819 0 1

I_CONGLOM(綜合業)0.06089 0.23915 0 1

I_INFO(信息技術業)0.05831 0.23435 0 1

I_MFG(製造業)0.58038 0.493540 1

註:1.為避免極端值影響研究結果,故將ETR的上限設為1,其餘變數小於第一分位值及大於第九十九分位值之極端值,分別改以第一分位值及第九十九分位值設定之。

2.各變數之定義及衡量,請參見表3-1。

表4-2為各產業樣本公司之主要變數平均值,其中隱含稅率最高者為農林漁牧業,約為22.74%,次之為綜合業及信息技術業,各約為22.5%及22.31%,這結果顯示農林漁牧業享有的租稅優惠最高,所以負擔的隱含稅也最高。各產業中隱含稅率最低者為採掘業,僅8.99%,顯示採掘業所享有之租稅優惠最低,所以負擔的隱含稅成本也最低。以上部分也可由有效稅率之高低分析得知,有效稅率最高之產業為房地產業,約為27.99%,次之為批發零售業及採掘業,各約為27.47%及27.23%,這結果顯示有效稅率較高之產業,其隱含稅率相對於其他產業而言較低,即該產業適用之租稅優惠較少。

就總稅率而言,各行業總稅率皆高於名目稅率33%,尤其以綜合業之總稅率46.57%為最高,採掘業之總稅率36.22%為最低,兩者總稅率相差10.35%。股東權益稅前報酬率最高者為採掘業,約為19%,股東權益稅前報酬率最低者為農林漁牧業,約為8.16%。從總稅率與股東權益稅前報酬率之比較分析,採掘業之股東權益稅前報酬率為各行業中最高者,但其總稅率為各行業中最低者,顯示中國大陸上市公司之租稅負擔並未達到租稅垂直公平(tax vertical equity),即負擔能力高者並未有相對較高的租稅負擔。

表4-3為製造業樣本公司各分類主要變數之平均值,隱含稅率最高者為木材傢俱類及電子類,分別為22.34%與21.52%,有效稅率最低者亦為木材傢俱類及電子類,分別為13.79%與17.9%,顯示此二分類所享有之租稅優惠較其他分類優渥,所以負擔之隱含稅也較其他分類高。

表4-2 各產業主要變數之平均值

產業個數隱含稅率有效稅率總稅率稅前報酬率

I_AGRI(農林牧漁業)121 0.2274 0.1476 0.3750 0.0816

I_MINING(採掘業)94 0.0899 0.2723 0.3622 0.1900

I_GAS(煤氣與水供應業)267 0.1718 0.2239 0.3957 0.1531

I_BUILD(建築業)134 0.1612 0.2342 0.3954 0.1100

I_TRANS(交通運輸業)273 0.1681 0.2004 0.3685 0.1399

I_RETAIL(批發零售業)476 0.1755 0.2747 0.4502 0.1407

I_ESTATE(房地產業)277 0.1709 0.2799 0.4508 0.1264

I_SERVICE(社會服務業)194 0.1727 0.2328 0.4055 0.1298

I_MEDIA(傳播文化業)29 0.1830 0.2691 0.4521 0.0890

I_CONGLOM(綜合業)378 0.2250 0.2407 0.4657 0.1477

I_INFO(信息技術業)362 0.2231 0.1890 0.4121 0.1148

I_MFG(製造業)3,603 0.1813 0.2189 0.4002 0.1173

總計6,208 0.1791 0.2320 0.4111 0.1284

表4-3 製造業各分類主要變數之平均值

個數隱含稅率有效稅率總稅率稅前報酬率產業

C0(食品、飲料)250 0.1579

0.4029 0.1339

0.2450

C1(紡織、服裝、皮毛) 283 0.1744

0.4159 0.1073

0.2415

C2(木材、傢俱)15 0.2234

0.3613 0.0899

0.1379

C3(造紙、印刷)115 0.1839

0.3994 0.1015

0.2155

C4(石油、化學、塑膠)681 0.1748

0.4178 0.1117

0.2429

C5(電子)170 0.2152

0.3942 0.0874

0.1790

C6(金屬、非金屬)607 0.1770

0.3909 0.1337

0.2139

C7(機械、設備、儀表)954 0.1986

0.3943 0.1177

0.1958

C8(醫藥、生物製品)431 0.1620

0.3955 0.1203

0.2334

C9(其他製造業) 97 0.1840

0.3811 0.0976

0.1970

總計3,603 0.1851

0.3953 0.1101

0.2102

表4-4為各產業於2000至2006年間各年度之隱含稅率、有效稅率及股東權益稅前報酬率之平均值,其結果可顯示各產業主要變數之變動趨勢(橫切面),以及當年度與其他產業之比較(縱切面)。從表4-4可看出,2000年及2001年上市公司平均有效稅率均低於20%,但2002年至2006年有效稅率均高於24%,顯示上市公司平均有效稅率逐漸升高的趨勢。其中批發零售業與房地產業2000年之有效稅率分別為19%與19.1%,到2005年分別已成長至34%與31.6%,成長幅度約為1.7倍,但相對而言農林漁牧業2000年之有效稅率約為13.9%,到2005年其有效稅率約為13.1%,其間差異並不大,由此可見整體上市公司有效稅率雖逐漸升高,但各產業因適用之租稅優惠不同,有效稅率之趨勢亦有所差異。

從表4-4亦可看出,2000年隱含稅率最高者依序為綜合業、農林漁牧業與信息技術業,分別為23.8%、22.7%及22.1%,之後2001年至2006年最高者雖略有變動,仍可看出農林漁牧業與信息技術業之隱含稅率多為該年度之前三名,且其該年度之有效稅率通常較低,此結果反映農林漁牧業與信息技術業享受較多之租稅優惠。

表4-4 各產業年度主要變數之平均值

年度(家數) 2000 (788) 2001 (784) 2002 (842) 2003 (894) 2004 (969) 2005 (908) 2006 (1,023)

產業Imprate ETR PTROE Imprate ETR PTROE Imprate ETR PTROE Imprate ETR PTROE Imprate ETR PTROE Imprate ETR PTROE Imprate ETR PTROE I_AGRI 0.227 0.139 0.071 0.174 0.167 0.040 0.198 0.158 0.084 0.243 0.190 0.087 0.239 0.139 0.101 0.240 0.131 0.113 0.278 0.106 0.090 I_MINING 0.141 0.217 0.112 0.186 0.167 0.127 0.069 0.287 0.123 0.060 0.297 0.128 0.074 0.298 0.205 0.063 0.304 0.262 0.084 0.279 0.264 I_GAS 0.175 0.203 0.146 0.203 0.183 0.146 0.173 0.248 0.135 0.141 0.211 0.165 0.139 0.222 0.148 0.230 0.259 0.145 0.150 0.229 0.181 I_BUILD 0.173 0.178 0.126 0.205 0.152 0.101 0.188 0.258 0.066 0.214 0.226 0.083 0.177 0.236 0.095 0.133 0.267 0.120 0.098 0.259 0.150 I_TRANS 0.178 0.154 0.106 0.218 0.155 0.098 0.161 0.193 0.138 0.161 0.229 0.138 0.145 0.210 0.165 0.141 0.217 0.169 0.183 0.220 0.146 I_RETAIL 0.215 0.190 0.100 0.191 0.206 0.108 0.173 0.278 0.118 0.162 0.283 0.124 0.164 0.307 0.160 0.164 0.340 0.184 0.159 0.321 0.192 I_ESTATE 0.217 0.191 0.090 0.196 0.234 0.137 0.175 0.304 0.114 0.161 0.252 0.127 0.182 0.305 0.156 0.153 0.316 0.111 0.124 0.330 0.142 I_SERVICE 0.220 0.161 0.101 0.212 0.147 0.104 0.148 0.232 0.130 0.243 0.265 0.108 0.120 0.282 0.144 0.128 0.281 0.157 0.161 0.239 0.155 I_MEDIA 0.087 0.214 0.089 0.163 0.221 0.087 0.174 0.321 0.072 0.134 0.188 0.090 0.269 0.300 0.074 0.278 0.354 0.067 0.127 0.270 0.149 I_CONGLOM 0.238 0.159 0.136 0.200 0.185 0.154 0.180 0.223 0.138 0.216 0.263 0.146 0.249 0.264 0.153 0.224 0.311 0.145 0.266 0.287 0.164 I_INFO 0.221 0.137 0.108 0.226 0.163 0.113 0.224 0.188 0.125 0.233 0.217 0.108 0.207 0.206 0.124 0.210 0.225 0.106 0.237 0.181 0.116 I_MFG 0.192 0.166 0.111 0.204 0.185 0.103 0.161 0.233 0.106 0.183 0.232 0.116 0.179 0.230 0.126 0.181 0.243 0.120 0.174 0.230 0.132 平均值0.190 0.176 0.108 0.198 0.180 0.110 0.169 0.244 0.112 0.179 0.238 0.118 0.179 0.250 0.138 0.179 0.271 0.142 0.170 0.246 0.157

主要變數包含隱含稅率(IMPRATE)、有效稅率(ETR)以及股東權益稅前報酬率(PTROE)。

產業變數為 I_AGRI(農林牧漁業);I_MINING(採掘業);I_GAS(電力、煤氣及水的生產和供應業);I_BUILD(建築業);I_TRANS(交通運輸、倉儲業); I_RETAIL(批發和零售貿

易業);I_ESTATE(房地產業);I_SERVICE(社會服務業);I_MEDIA(傳播與文化產業);I_CONGLOM(綜合業);I_INFO(信息技術業);I_MFG(製造業)。

41

第二節相關係數分析

表4-5為本文主要變數間之相關係數分析,其結果顯示IMPRATE與ETR之相關係數為負值,且p-value小於0.001,符合本文假說H1之預期,並與國外文獻發現一致 (Scholes and Wolfson, 1992),即有效稅率與隱含稅有相對之替換關係。此外,IMPRATE與PTROE之相關係數為顯著負相關,且p-value小於0.001,符合本文假設H2,表示負擔隱含稅較高的公司,其股東權益稅前報酬率通常較低,與Callihan and White(1999)之研究結果相同。IMPRATE與CS、MS之相關係數雖與本文假設H3、H4相符,但其負向關係皆不顯著,可能是因為上市公司普遍呈現低度市場占有率,且市場集中度各產業差異過大,造成IMPRATE與CS、MS 間之關係相互抵消。

表4-5亦顯示IMPRATE與SIZE間之相關係數為負值,且其負向關係為顯著,表示當公司規模越大時,企業因租稅優惠產生之隱含稅越低,與本研究之預期相符,符合政治權利假說,即大企業有較多資源參與政治活動,藉以在立法過程中爭取對大企業有利之租稅措施。IMPRATE與TobinQ之相關係數為顯著之正值,表示當公司市值為帳面值之倍數越高時,公司因租稅優惠產生之隱含稅越低,符合本研究之預期。IMPRATE與PTROE×CR及IMPRATE與PTROE×MS之相關係數皆為負值,且p-value皆小於0.01顯著,與本研究假說H5及H6相反,反映股東權益稅前報酬率與隱含稅間的負向關係,並不會因市場集中度提高或市場占有率提高,而削弱其負向關係。

從表4-5亦可觀察上市公司有效稅率與其他變數之關係,如ETR與PTROE 為顯著負向關係,顯示當公司股東權益稅前報酬率越高時,公司當期所需負擔之有效稅率越低,反映中國大陸租稅制度可能存在租稅不公平之情形,所得能力高者繳納之稅捐反而較低。相同情形亦反映在ETR與TobinQ之相關係數上,兩者

之相關係數為顯著之負值,即公司市值為帳面值之倍數越高時,公司所需負擔之有效稅率反而較低。

值得注意的是,ETR及PTROE雖然皆與IMPRATE呈顯著負相關,但ETR 與PTROE兩者間之相關係數卻為負值,且p-value小於0.001,顯示有效稅率與股東權益稅前報酬率皆會影響隱含稅率之高低,但兩者間具有某種程度之替代關係。以上變數間相關係數分析之結果,雖然初步上支持本文之預期,但這些變數單變量間的關係並未控制潛在的其他干擾因素,故本文將於迴歸模式中進行研究假說之檢定分析。

表4-5 各變數之皮爾森相關係數(括弧內為p-value)

IMPRATE ETR PTROE CR MS SIZE TobinQ PTROE×CR PTROE×MS

IMPRATE 1 -0.1747 -0.1475 -0.0213 -0.0132 -0.0632 0.1074 -0.1268 -0.0425

(<.0001)(<.0001)(-0.0940)(-0.2993) (<.0001)(<.0001)(<.0001)(-0.0008)

ETR 1 -0.0704 0.0246 -0.0013 0.0299 -0.1712 -0.0121 -0.0106

(-0.0186)(<.0001)(<.0001)(-0.4024)

(<.0001)(-0.0531)(-0.9196)

PTROE 1 0.0648 0.1682 0.2108 0.0012 0.7176 0.4249

(<.0001)(<.0001)(<.0001)(<.0001)

(<.0001)(<.0001)

0.5610

0.1943

0.0581

0.3573

0.0967

CR 1

(<.0001)(<.0001)(<.0001)(<.0001) (<.0001)

0.7432

0.2941

MS 1

0.3427

-0.0157

(<.0001)(<.0001)(<.0001)(<.0001) SIZE 1

0.2746

0.1933

-0.3766

(0.5314)(<.0001)(<.0001)

-0.0113 TobinQ 1

0.0212

(<.0001)(<.0001) PTROE×CR 1

0.4687

(<.0001) PTROE×MS 1

公司年度營業收入 ÷ 該公司所屬產業之年度總營業收入

(1)隱含稅率(IMPRATE) = 取得租稅有利資產所隱含之稅負(5)市場占有率(MS) =

以當期所得稅費用除以公司稅前淨利衡量(6)公司規模(SIZE) =

以總資產取自然對數衡量

(2)平均有效稅率(ETR) =

(普通股市價+特別股市價+長期負債+短期負債) ÷ 有形資產

(3)稅前報酬率(PTROE)= 企業稅前所得 ÷ 公司股東權益(7)公司成長力(TobinQ) =

企業所屬產業年度銷售量前四大之公司之之重置成本。

(4)市場集中度(CR) =

銷貨額除以該產業年度總銷貨額合計數

44

第三節實證結果分析

(一)整體樣本

1. 模型一(Model 1)

此模型主要探討中國大陸上市公司隱含稅率與企業股東權益稅前報酬率及市場架構因素之關係,表4-6實證結果顯示有效稅率之迴歸係數為負值,且p-value小於0.01,支持本文H1之假說,顯示控制公司規模及TobinQ等變數後,中國上市公司之有效稅率與隱含稅率呈顯著正向關係,即當有效稅率提高時,隱含稅率將會相對降低。股東權益稅前報酬率之迴歸係數為負值,且達顯著水準0.05,表示上市公司中享受租稅優惠較多者,股東權益稅前報酬率較低,故負擔之隱含稅較高,與本文H2之假說相符。

市場集中度為代表市場結構的變數之一,當市場集中於某幾家供應商時,則該供應商足以影響市場競爭及內部訂價原則,可減少隱含稅之成本。實證結果顯示市場集中度之迴歸係數為0.02,與本研究假說H3之預期方向不同,但迴歸係數並不顯著。市場占有率為本研究另一個市場結構變數,本文預期企業的市場占有率越高時,企業對於市場的操控能力與議價能力也越強,降低其隱含稅之能力也越高,實證結果發現,市場占有率與隱含稅率之迴歸係數與預期相符,但未達傳統0.05之顯著水準,故沒有證據支持本研究之假說H4。

公司規模之實證迴歸係數為0.001,但未達顯著水準0.05,表示沒有證據支持公司規模愈大者,其所需負擔之隱含稅率也相對較高。而公司成長能力之替代變數TobinQ之迴歸係數為正值0.002,且p-value小於0.01,即當企業市價高於其帳面價值一倍時,將使公司之隱含稅率提升0.2%,顯示大陸成長能力越佳的公司,負擔的隱含稅成本也愈高。

股東權益稅前報酬率與市場集中度之交乘項(PTROE×CR)的迴歸係數為負值-0.242,且已達傳統0.05之顯著水準,實證結果與本研究之假說H5相反。股東權益稅前報酬率與市場占有率之交乘項(PTROE×MS)的迴歸係數為正值 2.440,

且p-value小於0.01,表示市場占有率越高時,隱含稅率與股東權益稅前報酬率之負向關係會越明顯,此結果與本研究假說H6相符。

2. 模型二(Model 2-1)-含整體解釋變數

本研究將中國大陸上市公司之行業別依據中國證券監督管理委員會所發布之《上市公司行業分類指引》進行分類,分別為I_AGRI(農林牧漁業)、I_MINING(採掘業)、I_GAS(電力、煤氣及水的生產和供應業)、I_BUILD(建築業);I_TRANS(交通運輸、倉儲業)、I_RETAIL(批發和零售貿易業)、I_ESTATE(房地產業)、I_SERVICE(社會服務業)、I_MEDIA(傳播與文化產業)、I_INFO(信息技術業)、I_MFG(製造業)與I_INFO(信息技術業)等十二個產業,以探討產業別對中國上市公司隱含稅率之影響。藉由以上產業別之分類,將中國大陸上市公司之產業別納入模型一(Model 1)之變數做參考,得到模型二(Model 2)之迴歸結果。

表4-6實證結果顯示模型一與模型二之迴歸係數並無太大差異,且各變數之顯著水準除MS及PTROE×CR外,並無重大改變。市場占有率MS之迴歸係數於考量產業別後,顯著性高於該變數於模型一之迴歸係數,顯示考量公司所屬產業後,公司之市場占有率的確與其隱含稅率具有顯著之反向關係。交乘項PTROE ×CR之顯著性則較模型一低,本研究認為可能是因為市場集中度之計算方式為各產業前四大企業銷售額除以產業總銷售額,屬於該產業之各公司計算出的CR皆相同,所以市場集中度本身已反映公司所屬之產業別,造成加入產業別虛擬變數後,解釋變數之顯著性反而降低。

模型二之實證結果顯示,11個產業虛擬變數之迴歸係數中,採掘業、煤氣與水供應業、建築業、交通運輸業與社會服務業,其虛擬變數之迴歸係數為負數且達傳統5%顯著水準,顯示屬於該產業之公司之隱含稅率較低,可能享有租稅優惠亦較少。

3. 模型二(Model 2-2)-不含CR及PTROE×CR交乘項

由於市場集中度之計算方式為各產業前四大企業銷售額除以產業總銷售額,屬於該產業之各公司計算出的CR皆相同,所以市場集中度本身已反映公司所屬之產業別,造成加入產業別虛擬變數後,解釋變數之顯著性反而降低,所以本研究將迴歸模型二(Model 2)中主要變數CR及PTROE×CR剔除,並將其餘變數與隱含稅率進行迴歸分析,結果如表4-6之模型二(MODEL 2-2)。

實證結果發現,剔除CR與PTROE×CR等變數後之模型二(Model 2-2),其迴歸係數與模型二(Model 2-1)之迴歸係數並無太大差異,且各變數之顯著水準並無重大改變。採掘業、建築業、交通運輸業與製造業,其虛擬變數之迴歸係數為負數且達傳統5%顯著水準,而煤氣與水供應業、社會服務業與綜合業,其虛擬變數之迴歸係數為負數且達傳統10%顯著水準,顯示屬於該產業之公司之隱含稅率較低,可能享有租稅優惠亦較少。

表4-6 隱含稅率迴歸模式實證結果(N=6,208)-整體樣本

解釋變數 Model(1) Model(2-1) Model(2-2) 預期

方向

係數t值係數t值係數t值

截距項0.228 5.26 0.208 3.75 0.215 4.72

ETR(有效稅率) --0.186 -13.68 *** -0.189 -13.76 *** -0.189 -13.83 ***

PTROE(股東權益稅前報酬率) -

-0.190 -6.07

*** -0.213 -6.75

*** -0.248 -12.26 ***

CR(市場集中度) -0.020 1.07 0.025 0.38 -- --

MS(市場占有率) --0.255 -1.07 -0.550 -1.88

* -0.498 -1.74

* SIZE(公司規模) -0.001 0.19 0.008 1.16 0.009 1.21 TobinQ(公司成長機會) +0.003 5.84

*** 0.002 4.78

*** 0.002 4.78

*** PTROE×CR +-0.242 -2.48

** -0.144 -1.44 -- --PTROE×MS + 2.440 2.75

*** 2.306 2.49

** 1.948 2.20

**

I_AGRI(農林牧漁業)0.001 0.07 0.001 0.07 I_MINING(採掘業)-0.087 -2.48

** -0.091 -4.53

*** I_GAS(煤氣與水供應業)-0.025 -1.73

* -0.027 -1.90

*

I_BUILD(建築業)-0.042 -2.09

** -0.041 -2.33

**

I_TRANS(交通運輸業)-0.038 -2.70

*** -0.038 -2.77

*** I_RETAIL(批發零售業)-0.016 -0.92 -0.018 -1.47 I_ESTATE(房地產業)-0.020 -1.13 -0.021 -1.55 I_SERVICE(社會服務業)-0.028 -1.64

* -0.029 -1.86

*

I_MEDIA(傳播文化業)-0.004 -0.09 -0.001 -0.04 I_CONGLOM(綜合業)0.024 1.20 0.023 1.80

*

I_MFG(製造業)-0.024 -0.84 -0.028 -2.85

***

Adj. R2 = 0.0631 Adj. R2 = 0.0686 Adj. R2 = 0.0686

F值= 53.22 F值= 25.05 F值= 27.87

(p-value < .0001) (p-value < .0001) (p-value < .0001) 註:1.「***」表示達1%顯著水準;「**」表示達5%顯著水準;「*」表示達10%顯著水準。

2. 各變數之定義及衡量,請參見表3-1。

(二)製造業樣本

1. 模型一(Model 1)

由於中國大陸上市公司中,依中國證監會公布的《上市公司行業分類指引》歸類為製造業者占半數以上,其解釋變數可能因企業屬於製造業產生重要影響,如解釋變數市場占有率之計算方式為該公司之銷貨額除以產業總銷貨額,若屬於該產業之公司家數較多時,可能造成屬於該產業之公司市場占有率相對較低,所以若將屬製造業之企業與屬其他產業之公司相比較,可能造成研究結果偏誤。再者,由於製造業占中國上市公司半數以上,且上市公司生產值多來自於製造業,故本研究以製造業之樣本公司獨立進行迴歸模型測試,探討屬製造業之上市公司隱含稅率與企業股東權益稅前報酬率及市場架構因素之關係。

表4-7為製造業之迴歸實證結果,結果顯示樣本公司僅包含製造業公司時,模型一各解釋變數之迴歸係數方向與整體樣本相比皆未改變,有效稅率之迴歸係數為負值-0.205,且p-value小於0.01,顯示控制公司規模及TobinQ等其他因素後,上市公司屬製造業者之有效稅率與隱含稅率呈顯著正向關係,即當有效稅率提高時,隱含稅率將會相對降低,此結果與本文假說H1相符。股東權益稅前報酬率之迴歸係數為負值-0.150,顯著水準達0.05,顯示上市公司中,享受租稅優惠較多者,未必比享有較少租稅優惠的公司,可以從租稅優惠中獲得更多的利潤與報酬,此結果與本研究假說H2相符。

代表市場結構之主要變數為市場集中度與市場占有率,由於樣本僅為屬於製造業之公司,所以市場集中度之計算方式為製造業中各該分類前四大公司之銷售額除以該分類總銷售額,市場占有率之計算方式為各公司之銷售額除以公司所屬之製造業分類總銷售額。實證結果發現,市場集中度之迴歸係數為正值0.025,與本研究之假說H3不同,但由於其未達5%顯著水準,故無實證證據顯示製造業之樣本下,市場集中度與公司負擔之隱含稅率間之關係。市場占有率之迴歸係數為負值-0.097,但其t值未達傳統5%顯著水準,顯示市場占有率與隱含稅率間

之負向關係並不顯著,沒有證據支持製造業樣本符合本研究之假說H4。

製造業樣本之交乘項PTROE×CR及PTROE×MS迴歸係數,其顯著性明顯低於整體樣本之顯著性,且未達5%顯著水準,故沒有證據支持本研究H5及H6假說。控制變數TobinQ之迴歸係數為0.002,且p-value<0.001,即公司計算出之市值高於其帳面價值一倍時,其隱含稅率將增加0.2%,此結果與本研究對於該變數之預期相符。

2. 模型三(Model 3)

由於中國證監會公布的《上市公司行業分類指引》將各種製造業皆分類為製造業,造成製造業本身之屬性相當分歧,故本研究將屬於製造業之樣本公司重新依《上市公司行業分類指引》做更細部的行業區分,將製造業分為以下十類:C0(食品、飲料)、C1(紡織、服裝、皮毛)、C2(木材、傢俱)、C3(造紙、印刷)、C4(石油、化學、塑膠)、C5(電子)、C6(金屬、非金屬)、C7(機械、設備、儀表)、C8(醫藥、生物製品)及C9其他製造業。如之前所述,市場集中度之計算方式為各分類前四大企業銷售額除以該分類總銷售額,屬於該分類之各公司計算出的CR皆相同,所以市場集中度本身已反映公司所屬之製造業分類,造成加入產業別虛擬變數後,解釋變數之顯著性反而降低,所以本研究將迴歸模式第一式(Model 1)中主要變數CR及PTROE×CR剔除,並加入製造業分類八個虛擬變數,形成模型三(Model 3)。

表4-7實證結果顯示,製造業樣本模型一與模型三之迴歸係數並無太大差異,但模型三將公司所屬之製造業類別納入考量後,除有效稅率之t值略微降低外,其餘各係數之顯著程度多有明顯提升。模型三中主要變數有效稅率之迴歸係數為負值-0.196,顯示屬製造業之公司於考量其產業分類後,其有效稅率提高時隱含稅率相對降低,即製造業公司之有效稅率與隱含稅率間具有反向關係,且迴歸係數之p-value低於0.01,與本研究之假說H1相符。股東權益稅前報酬率之迴歸係數為負值-0.203,且p-value小於0.01,顯示中國上市製造業公司之股東權益稅

前報酬率與隱含稅率間具有顯著反向關係,此結果與本研究假說H2之預期相同。

市場占有率與交乘項PTROE×MS之迴歸係數分別為負值-0.156與正值0.559,且皆未達傳統顯著水準,即沒有足夠證據支持市場占有率較高之公司,其隱含稅率較低,也沒有足夠證據支持中國大陸上市公司股東權益稅前報酬率與其隱含稅率之負向關係,會因市場占有率提高而削弱其負向關係之幅度,故無足夠證據持本研究之假說H4與H6。因市場集中度及其與股東權益稅前報酬率交乘項PTROE ×CR,兩者之計算方式與製造業之類別分類相似,加入迴歸式可能造成共線性過高,所以本迴歸式模型三將CR與PTROE×CR兩個變數排除,並且不檢測本研究之假說H3及H5。

中國上市製造業公司經本研究依《上市公司行業分類指引》做細部分類之後,實證結果顯示C0至C9各虛擬變數之迴歸係數皆為正值,顯示無論公司屬製造業中何種分類,皆對公司之隱含稅率有正向之影響,其中以木材傢俱類之迴歸係數0.088為最高,其次為電子類之迴歸係數0.038及機械設備儀表類之迴歸係數0.029,電子類及機械設備儀表類迴歸係數之p-value小於0.01,顯示電子類及機械設備儀表類產業之公司負擔之隱含稅成本較高。

表4-7 隱含稅率迴歸模式實證結果(N=3,603)-製造業樣本

解釋變數Model(1)-製造業樣本 Model(3)-製造業樣本

預期方向係數t值係數t值

截距項0.180 3.36 0.153

2.74 ETR(有效稅率) --0.205 -12.08

*** -0.196 -11.47 ***

PTROE(股東權益稅前報酬率) -

-0.150 -2.28

** -0.203 -7.31 ***

CR(市場集中度) -0.025 0.74 -- --

MS(市場占有率) --0.097 -0.97 -0.156

-1.33

SIZE(公司規模) -0.008 1.01 0.011

1.21

TobinQ(公司成長機會) +0.002 3.56

*** 0.002 3.61

***

PTROE×CR +-0.210 -0.92 -- --

PTROE×MS +0.550 0.85 0.559

0.92

C0(食品、飲料) 0.001

0.09 C1(紡織、服裝、皮毛) 0.015

1.28 C2(木材、傢俱) 0.088

1.53 C3(造紙、印刷) 0.023

1.37 C4(石油、化學、塑膠) 0.016

1.64 C5(電子) 0.038

2.65

***

C6(金屬、非金屬) 0.016

1.54 C7(機械、設備、儀表) 0.029

3.13

***

C9(其他製造業) 0.016

0.86

Adj. R2 = 0.0561 Adj. R2 = 0.0587

F值= 27.77 F值= 15.98

(p-value < .0001) (p-value < .0001)

註:1.「***」表示達1%顯著水準;「**」表示達5%顯著水準;「*」表示達10%顯著水準。

2. 各變數之定義及衡量,請參見表3-1。

(三)非製造業樣本

1. 模型一(Model 1)

由於中國大陸上市公司中,半數以上之公司屬於製造業,其餘分屬於11種行業,本研究針對非製造業之公司進行實證分析,以瞭解將樣本公司排除製造業公司後,對實證結果之影響,如表4-8。實證結果顯示,有效稅率之迴歸係數為負值-0.179,且其p-value小於0.01,表示有效稅率與隱含稅率間具有顯著負向關係,此實證結果與本研究之假說H1相符。股東權益稅前報酬率之迴歸係數為負值-0.363,已達顯著水準0.01,此實證結果與整體樣本及製造業樣本之實證結果相同,符合本研究之假說H2。

市場集中度變數CR之迴歸係數為負值-0.110,且顯著水準達0.01,表示公司所屬市場之市場集中度越高時,其相對之公司隱含稅率較低,即市場集中度高時該產業係由少數廠商主導市場之運作,造成廠商藉由市場機制將隱含稅轉由消費者負擔,使公司負擔之隱含稅較低,此實證結果與本研究之假說H3相符。公司股東權益稅前報酬率與市場集中度之交乘項PTROE×CR之迴歸係數為正值0.143,但p-value未達傳統5%顯著水準。控制變數TobinQ之迴歸係數為0.002,且p-value<0.001,即公司計算出之市值高於其帳面價值一倍時,其隱含稅率將增加0.2%,此結果與本研究對於該變數之預期相符。

2. 模型二(Model 2)

由於市場集中度之計算方式為各產業前四大企業銷售額除以產業總銷售額,屬於該產業之公司計算出的CR皆相同,所以市場集中度本身已反映公司所屬之產業別,造成加入產業別虛擬變數後,解釋變數之顯著性反而降低,所以本研究將迴歸模式第二式(model 2)中主要變數CR及PTROE×CR剔除,並將其餘變數與隱含稅率進行迴歸分析,如表4-8。實證結果顯示,非製造業樣本公司之模型二與模型一之結果並無太大差異,其中有效稅率之迴歸係數為顯著負值-0.172、股東權益稅前報酬率之迴歸係數顯著負值-0.302,與本研究假說H1及H2相符。

市場占有率之迴歸係數為負值-0.394,其雖未達顯著標準,在考量企業所屬之產業變數後其t值些微提高,表示考量產業因素後公司之市場占有率與隱含稅率之負向關係更為明顯,此結果與本研究之假說H4部分相符。股東權益稅前報酬率與市場占有率之交乘項PTROE×MS之迴歸係數為正值2.481,且已達顯著水準0.05,表示市場占有率之提升會削弱股東權益稅前報酬率與隱含稅率間之負向關係,此結果與本研究之假說H6相符。

實證結果顯示,10個產業虛擬變數之迴歸係數除綜合業為正值0.022外,其餘9個產業虛擬變數之迴歸係數皆為負數,但由於綜合業之t值僅為1.56,表示無實證證據支持綜合業之產業別與隱含稅率間具有正向關係。而採掘業、煤氣與水供應業、建築業、交通運輸業與社會服務業,其虛擬變數之迴歸係數皆為負數,且其迴歸係數皆達顯著水準,顯示屬於該產業之公司之隱含稅率會因屬於該產業而有反向關係。整體而言,產業虛擬變數之迴歸係數半數以上達顯著水準,故以各產業之變數來看,非製造業之產業樣本實證結果支持「中國大陸上市公司所屬產業與其隱含稅負之高低有關」,與本研究之假說H7部分相符。

表4-8 隱含稅率迴歸模式實證結果(N=2,605)-非製造業樣本

註:1.「***」表示達1%顯著水準;「**」表示達5%顯著水準;「*」表示達10%顯著水準。 2. 各變數之定義及衡量,請參見表3-1。

解釋變數

Model(1)-非製造業樣本 Model(2)-非製造業樣本 預期方向

係數 t 值 係數 t 值 截距項 0.363

4.69

0.281

3.38

ETR(有效稅率) - -0.179 -8.04 *** -0.172 -7.63 *** PTROE(股東權益稅前報酬率)

- -0.363 -4.44 *** -0.302 -9.05

*** CR(市場集中度) - -0.110 -3.12

*** -- -- MS(市場占有率) - -0.292 -1.06 -0.394 -1.15 SIZE(公司規模) - -0.010 -0.85 -0.001 -0.09

TobinQ(公司成長機會) + 0.002 3.40

*** 0.002 2.60

*** PTROE ×CR + 0.143

0.80

-- --

PTROE ×MS +

2.479 2.40 ** 2.481 2.31

** I_AGRI (農林牧漁業) -0.007 -0.36

I_MINING (採掘業) -0.086 -3.82 *** I_GAS (煤氣與水供應業)

-0.026 -1.66 * I_BUILD (建築業) -0.044 -2.25 ** I_TRANS (交通運輸業) -0.036 -2.34

** I_RETAIL (批發零售業) -0.020 -1.46 I_ESTATE (房地產業) -0.025 -1.61

I_SERVICE (社會服務業)

-0.033 -1.90

* I_MEDIA (傳播文化業) -0.017 -0.39 I_CONGLOM (綜合業)

0.022 1.56

Adj. R 2 = 0.0737 Adj. R 2 = 0.0787 F 值= 26.90 F 值= 14.90

(p-value < .0001)

(p-value < .0001)

多元统计分析课后习题解答_第四章

第四章判别分析 简述欧几里得距离与马氏距离的区别和联系。 答:设p维欧几里得空间中的两点X= 和Y=。则欧几里得距离为 。欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。 设X,Y是来自均值向量为,协方差为 的总体G中的p维样本。则马氏距离为D(X,Y)= 。当 即单位阵时,

D(X,Y)==即欧几里得距离。 因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。 试述判别分析的实质。 答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,…,Rk是p维空间R p的k个子集,如果 它们互不相交,且它们的和集为,则称为的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间 构造一个“划分”,这个“划分”就构成了一个判别规则。 简述距离判别法的基本思想和方法。 答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。

①两个总体的距离判别问题 设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是 1 和 2, 对于一个新的样品X ,要判断它来自哪个总体。计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2(X ,G 2),则 X ,D 2(X ,G 1)D 2(X ,G 2) X ,D 2(X ,G 1)> D 2(X ,G 2, 具体分析, 2212(,)(,) D G D G -X X 111122111111 111222********* ()()()() 2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2() 22()2() ---''=-++-' +? ?=--- ??? ''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为 X ,W(X)

多元统计分析第三章假设检验与方差分析

第3章 多元正态总体的假设检验与方差分析 从本章开始,我们开始转入多元统计方法和统计模型的学习。统计学分析处理的对象是带有随机性的数据。按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。 所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。 统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。参数估计问题回答诸如“未知参数θ的值有多大?”之类的问题,而假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断, 两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。 3.1一元正态总体情形的回顾 一、 假设检验 在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为0H 和1H 。 1、显著性检验 为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2 σμN 的样本,我们要检验假设 100:,:μμμμ≠=H H (3.1) 原假设0H 与备择假设1H 应相互排斥,两者有且只有一个正确。备择假设的意思是,一旦否定原假设0H ,我们就选择已准备的假设1H 。 当2 σ已知时,用统计量n X z σ μ -=

应用多元统计分析习题解答_朱建平_第七章

Abbo无私奉献,只收1个金币,BS收5个金币的… 何老师考简单点啊……

第七章 因子分析 7.1 试述因子分析与主成分分析的联系与区别。 答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。 因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。 7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。 7.3 简述因子模型中载荷矩阵A 的统计意义。 答:对于因子模型 1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p = 因子载荷阵为1112 121 2221212 (,,,)m m m p p pm a a a a a a A A A a a a ????? ?==?? ?? ?? ? ? A i X 与j F 的协方差为: 1Cov(,)Cov(,)m i j ik k i j k X F a F F ε==+∑ =1 Cov( ,)Cov(,)m ik k j i j k a F F F ε=+∑ =ij a 若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了

多元统计分析课后习题解答_第四章知识讲解

第四章判别分析 4.1 简述欧几里得距离与马氏距离的区别和联系。 答:设p维欧几里得空间中的两点X=和Y=。则欧几里得距离为 。欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。 设X,Y是来自均值向量为,协方差为 的总体G中的p维样本。则马氏距离为D(X,Y)= 。当 即单位阵时, D(X,Y)==即欧几里得距离。 因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。 4.2 试述判别分析的实质。

答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,…,Rk 是p 维空 间R p 的k 个子集,如果它们互不相交,且它们的和集为,则称为的一 个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p 维空间构造一个“划 分”,这个“划分”就构成了一个判别规则。 4.3 简述距离判别法的基本思想和方法。 答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。 ①两个总体的距离判别问题 设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是μ1和μ 2,对于一个新的样品X , 要判断它来自哪个总体。计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2 (X ,G 2),则 X ,D 2 (X ,G 1) D 2(X ,G 2) X ,D 2(X ,G 1)> D 2 (X ,G 2, 具体分析, 2212(,)(,) D G D G -X X 111122111111 111222********* ()()()() 2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2() 22()2() ---''=-++-' +? ?=--- ?? ?''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为

多元统计分析-第三章 多元正态分布

第三章 多元正态分布 多元正态分布是一元正态分布在多元情形下的直接推广,一元正态分布在统计学理论和应用方面有着十分重要的地位,同样,多元正态分布在多元统计学中也占有相当重要的地位。多元分析中的许多理论都是建立在多元正态分布基础上的,要学好多元统计分析,首先要熟悉多元正态分布及其性质。 第一节 一元统计分析中的有关概念 多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,学习多元统计分析,首先要对随机向量和随机矩阵有所把握,为了学习的方便,先对一元统计分析中的有关概念和性质加以复习,并在此基础上推广给出多元统计分析中相应的概念和性质。 一、随机变量及概率分布函数 (一)随机变量 随机变量是随机事件的数量表现,可用X 、Y 等表示。随机变量X 有两个特点:一是取值的随机性,即事先不能够确定X 取哪个数值;二是取值的统计规律性,即完全可以确定X 取某个值或X 在某个区间取值的概率。 (二)随机变量的概率分布函数 随机变量X 的概率分布函数,简称为分布函数,其定义为: )()(x X P x F ≤= 随机变量有离散型随机变量和连续型随机变量,相对应的概率分布就有离散型概率分布和连续型概率分布。 1、离散型随机变量的概率分布 若随机变量X 在有限个或可列个值上取值,则称X 为离散型随机变量。 设X 为离散型随机变量,可能取值为1x ,2x ,…,取这些值的概率分别为1p ,2p ,…, 记为 k k p x X P ==)((Λ,2,1=k ) 称k k p x X P ==)((Λ,2,1=k )为离散型随机变量X 的概率分布。 离散型随机变量的概率分布具有两个性质: (1) 0≥k p ,Λ,2,1=k (2)11 =∑ ∞ =k k p 2、连续型随机变量的概率分布 若随机变量X 的分布函数可以表示为 dt t f x F x ?∞-=)()( 对一切R x ∈都成立,则称X 为连续型随机变量,称 )(x f 为X 的概率分布密度函数,简

应用多元统计分析习题解答 第七章讲解学习

应用多元统计分析习题解答第七章

第七章 因子分析 7.1 试述因子分析与主成分分析的联系与区别。 答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。 因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。 7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。 7.3 简述因子模型中载荷矩阵A 的统计意义。 答:对于因子模型 1122i i i ij j im m i X a F a F a F a F ε=++++ ++ 1,2,,i p = 因子载荷阵为1112 12122 21212(,,,)m m m p p pm a a a a a a A A A a a a ??????==????????A i X 与j F 的协方差为: 1Cov(,)Cov(,)m i j ik k i j k X F a F F ε==+∑ =1Cov(,)Cov(,)m ik k j i j k a F F F ε=+∑ =ij a

最新多元统计分析第三章 假设检验与方差分析

多元统计分析第三章假设检验与方差分析

第3章 多元正态总体的假设检验与方差分析 从本章开始,我们开始转入多元统计方法和统计模型的学习。统计学分析处理的对象是带有随机性的数据。按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。 所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。 统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。参数估计问题回答诸如“未知参数θ的值有多大?”之类的问题,而假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断, 两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。 3.1一元正态总体情形的回顾 一、 假设检验 在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为0H 和1H 。 1、显著性检验 为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2 σμN 的样本,我们要检验假设 100:,:μμμμ≠=H H (3.1) 原假设0H 与备择假设1H 应相互排斥,两者有且只有一个正确。备择假设的意思是,一旦否定原假设0H ,我们就选择已准备的假设1H 。 当2 σ已知时,用统计量n X z σ μ -=

多元统计分析讲义(第四章)

Equation Chapter 1 Section 1 Array《多元统计分析》 Multivariate Statistical Analysis ; ^ ) 主讲:统计学院许启发() 统计学院应用统计学教研室 School of Statistics 2004年9月

第三章 主成分分析 【教学目的】 1.让学生了解主成分分析的背景、基本思想; 2.掌握主成分分析的基本原理与方法; 3.掌握主成分分析的操作步骤和基本过程; 4.] 5.学会应用主成分分析解决实际问题。 【教学重点】 1.主成分分析的几何意义; 2.主成分分析的基本原理。 §1 概述 一、什么是主成分分析 1.研究背景 在实际问题的研究中,为了全面分析问题,往往涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同。实际上,在很多情况下,众多变量间有一定的相关关系,人们希望利用这种相关性对这些变量加以“改造”,用为数较少的新变量来反映原变量所提供的大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析及典型相关分析便是在这种降维的思维下产生的处理高维数据的统计方法。本章主要介绍主成分分析。 主成分分析的基本方法是通过构造原变量的适当的线性组合,以产生一系列互不相关的新变量,从中选出少数几个新变量并使它们含有尽可能多的原变量带有的信息,从而使得用这几个新变量代替原变量分析问题和解决问题成为可能。当研究的问题确定之后,变量中所含“信息”的大小通常用该变量的方差或样本方差来度量。 > 概括地说,主成分分析(principal component analysis )就是一种通过降维技术把多个指标约化为少数几个综合指标的综合统计分析方法,而这些综合指标能够反映原始指标的绝大部分信息,它们通常表现为原始几个指标的线性组合。主成分概念最早是由Karl Parson 于1901年引进的,1933年Hotelling 把这个概念推广到随机向量。在实践中,主成分分析既可以单独使用,也可和其它方法结合使用,如主成分回归可克服多重共线性。 2.基本思想及意义 哲学理念:抓住问题的主要矛盾。 主成分分析将具有一定相关性的众多指标重新组合成新的无相互关系的综合指标来代替。通常数学上的处理就是将这p 个指标进行线性组合作为新的综合指标。问题是:这样的线性组合会很多,如何选择 如果将选取的第一个线性组合即第一个综合指标记为1F ,希望它能尽可能多地反映原来指标的信息,即1()Var F 越大,1F 所包含的原指标信息①就越多,1F 的方差应该最大,称1F 为第一主成分。 如果第一主成分1F 不足以代表原来p 个指标的信息,再考虑选取2F 即选择第二个线性组合。为了有效地反映原来的信息,1F 中已包含的信息,无须出现在2F 中,即12(,)0Cov F F ,称2F 为第二主成分。 仿此可以得到p 个主成分。 ① 度量信息最经典的方差是方差。

《应用多元统计分析》第七章因子分析实验报告.doc

《应用多元统计分析》第七章因子分析实验报告 第七章因子分析实验报告实验项目 名称 因子分析的上机实现 实验 目的及要求 SPSS 软件中 factor analysis的计算机操作及结果分析,使 学生能熟练应用计算机软件进行因子分析与结果分析,培养 实际应用能力。 实验 内容 对企业经济效益体系的 8 项指标建立因子分析模型(附表数据)。这 8 项指标分别为: x1- 固定资产利税率, x2- 资金利税率, x3- 销售收入利税率, x4- 资金利润率, x5- 固定资产利润

率, x6- 资金周转天数, x7- 万元产值能耗, x8- 全员劳动生产率。 在分析过程中,提取因子的方法为“主成分”法,并以数据的“相关阵”为分析矩阵,并且提取 3 个因子,采用“最大方差旋转法”进行因子旋转。 (1)则这 3 个因子的累积方差贡献率为多少? (2)请写出原始变量 x1 和 x2 的因子表达式; (3)所提取的 3 个公共因子分别在 8 个指标中的哪些指标上 有较大载荷?并据此说明所提取的公因子概括了企业的 何种能力? (4)分别写出因子得分表达式,并计算“大同”企业的综合因子得分。 实验步骤 实验环境

Windows xp 、Windows vista、Windows 7等,软件SPSS 11.0 版本及以上。 实验结果与 分析 1 .选择菜单项 Analyze → Data Reduction → Factor。, 2 .打开 Factor Analysis 对话框,将原始变量“固定资产利税率”到“全员劳动生产率”移入Variables列表框中。如下图。 3、单击点击 Extraction 按钮,打开 Extraction 子对话框,如错误!未找到引用源。,设置有关因子提取的选项。如果选 择相关系数矩阵,则表示首先对原始数据进行标准化,然后 再进行因子分析;如果选择协方差矩阵,则表示直接对原始 数据进行因子分析。这里我们选择默认的相关系数矩阵。因 子碎石图其实就是样本协差阵的特征根按大小顺序排列 的折线图,可以用来帮助确定提取多少个因子。提取的 3 个公共因子,所以我们在Mumber of factors中输入3即可。 4.点击 Rotation 按钮,打开 Rotation 子对话框,如图 7-4 ,设置有关因子旋转的选项。

第三章 多元统计分析(3)

第三章多元统计分析 §4 聚类分析 分类是人类认识世界的方式,也是管理世界的有效手段。在科学研究中非常重要,许多科学的研究都是从分类研究出发的。没有分类就没有效率;没有分类,这个世界就没有秩序。瑞典博物学家林奈(Carl von Linnaeus, 1707-1778)因为对植物的分类成就被后人誉为“分类学之父”,后人评价说“上帝创世,林奈分类”——能与上帝的名字并列的人不多,另一个著名的科学家是牛顿。由此可见分类成果的重要性。最初分类都是定性了,后来随着科学的发展产生了定量分类技术,包括基于统计学的聚类方法和基于模糊数学的聚类技巧。本节主要讲述统计学意义的数字分类方法思想和过程。 1 聚类的分类 分类研究的成果的重要性决定了方法的重大实践意义。在任何一门语言的语法学中,都要对词词汇进行分类,词汇分类可以根据词性:名词,动词,形容词……;英文还可以根据首字母分类:ABCD……;汉字则还可以根据笔划,如此等等。在生物学中,将生物划分为:界,门,纲,目,科,属,种。例如白菜(种)属于油菜属、十字花科、十字花目、双子叶植物纲、被子植物亚门、种子植物门、植物界;老虎(种)则属于猫属、猫科、食肉目、哺乳动物纲、脊椎动物亚门、脊索动物门、动物界。这样,整个世界的生物就可以建立一个等级谱系,根据这个谱系,我们可以比较容易地判断那些生物已经认识了,哪些生物尚未发现,哪些生物已经灭绝了。如果发现了新的生物,就可以方便地将其归类。在天文学中,天体可以根据视觉区域分类,也可以根据发光性质与光谱特征进行分类。在地理学中,城市既可以根据地域空间分类,也可以根据城市的职能进行分类。 表3-3-1 各种生物在分类学上的位置举例 位置白菜虎 界植物界动物界 门种子植物门脊索动物门 亚门被子植物亚门脊椎动物亚门 纲双子叶植物纲哺乳动物纲 目十字花目食肉目 科十字花科猫科 属油菜属猫属 种白菜虎 当我们走进一家图书馆,如果它们的图书没有分类编目,我们要找到一本图书与大海捞针没有什么区别。分类的方式也会影响工作的效率。书店的图书一般根据科学门类进行分类摆设,但有一段时间一家书店改为按照出版单位进行分类排列,结果读者很难找到所需图书,这家原本效益挺好的书店很快收到了消极影响。 早期的分类,一般根据事物的属性与特征进行划分,属于定性分类的范畴。随着人们认识的深入和研究对象复杂程度的增加,单纯的定性分类方法就不能满足要求了,于是产生了定量分类技术,即所谓数字分类。本节要讲述的就是根据多个指标进行数字分类的一种多元

多元统计分析应用 第四章课后习题

第四章判别分析 习题4.8 (1)根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。 (2)现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味评分为8,信任度评分平均为5,试预测该饮料的销售情况。 将数据导入SPSS,分析得到以下结果: 1.典型判别函数的特征函数的特征值表 表1-1 特征值表 表1-1所示是典型判别函数的特征值表,只有两个判别函数,所以特征值只有2个。函数1的特征值为17.791,函数2的特征值为0.720,判别函数的特征值越大,说明函数越具有区别判断力。函数1方差的累积贡献率高达96.1%,且典型相关系数为0.973,而函数2方差的贡献率仅为3.9%,典型相关系数为0.647。由此,说明函数1的区别判断力比函数2的强,函数1更具有区别判断力。 2.Wilks检验结果 表1-2 Wilks 的Lambda 上表中判别函数1和判别函数2的Wilks’Lambda值为0.031,判别函数2的Wilks’Lambda值为0.581。“1到2”表示两个判别函数的平均数在三个类间的差异情况,P值=0.002<0.05表示差异达到显著水平“2”表示在排除了第一个判别函数后,第二个判别函数在三个组别间的差异情况,P值=0.197>0.05表示判别函数2未达到显著水平。 3.建立贝叶斯判别函数

表1-3 贝叶斯判别法函数系数 上表为贝叶斯判别函数的系数矩阵,用数学表达式表示各类的贝叶斯判别函数为: 第一组: F1=-81.843-11.689X1+12.97X2+16.761X3 第二组: F2=-94.536-10.707X1+13.361X2+17.086X3 第三组: F3=-17.499-2.194X1+4.960X2+6.447X3 将新品牌饮料样品的自变量值分别代入上述三个贝叶斯判别函数,得到三个函数值为: F1=65.271,F2=65.661,F3=47.884 比较三个值,可以看出F2=65.661最大,据此得出新品牌饮料样品应该属于第二组,即该饮料的销售情况为平销。 4.个案观察结果表 表1-4 个案观察结果表

应用多元统计分析课后答案 (2)

2.1.试叙述多元联合分布和边际分布之间的关系。 解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密 度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度 函数的维数小于p 。 2.2设二维随机向量1 2()X X '服从二元正态分布,写出其联合分布。 解:设1 2()X X '的均值向量为()1 2μμ'=μ,协方差矩阵为21 122212σσσσ?? ? ?? ,则其联合分布密度函数为 1/2 12 2 2112112222122121()exp ()()2f σσσσσσσσ--???????? '=---?? ? ??? ?????? x x μx μ。 2.3已知随机向量12()X X '的联合密度函数为 12121222 2[()()()()2()()] (,)()()d c x a b a x c x a x c f x x b a d c --+-----= -- 其中1a x b ≤≤,2c x d ≤≤。求 (1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断 1X 和2X 是否相互独立。 (1)解:随机变量 1X 和2X 的边缘密度函数、均值和方差; 11212122 2[()()()()2()()] ()()()d x c d c x a b a x c x a x c f x dx b a d c --+-----=--? 1221222222 2()()2[()()2()()]()()()() d d c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----? 121 222202()()2[()2()]()()()() d d c c d c x a x b a t x a t dt b a d c b a d c ------= +----? 221212222 2()()[()2()] 1()()()()d c d c d c x a x b a t x a t b a d c b a d c b a ------=+= ----- 所以 由于1X 服从均匀分布,则均值为2b a +,方差为 ()2 12 b a -。

第四章 SPSS基本统计分析

第四章 SPSS基本统计分析 ——描述性统计分析 描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,包括: ●Frequencies:频数分析过程,特色是产生频数表(主要针对分类变量) ●Descriptives:数据描述过程,进行一般性的统计描述(主要针对数值型变量) ●Explore:数据探察过程,用于对数据概况不清时的探索性分析 ●Crosstabs:多维频数分布交叉表分析(列联表分析) ●Ratio statistics:比率分析 4.1 频数分析 4.1.1 频数分析的目的和基本任务 1、目的 基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。 2、基本任务 (1)频数分析的第一个基本任务是编制频数分布表。 ●频数(Frequency):即变量值落在某个区间(或某个类别)中的次数 ●百分比(Percent):即各频数占总样本数的百分比 ●有效百分比(Valid Percent):即各频数占有效样本数的百分比,这里有效样本数 =总样本-缺失样本数 ●累计百分比(Cumulative Percent):即各百分比逐级累加起来的结果。最终取值 为100。 (2)频数分析的第二个任务是绘制统计图 ●条形图(Bar Chart):用宽度相同的条形的高度或长短来表示频数分布变化的图形, 适用于定序和定类变量的分析。 ●饼图(Pie Chart):用圆形及圆内扇形的面积来表示频数百分比变化的图形,以利 于研究事物内在结构组成等问题。 ●直方图(Histograms):用矩形的面积来表示频数分布变化的图形,适用于定距型 变量的分析。 注:变量的计量尺度: a 定类(Category Scale):只能计次 b 定序(Ordinal Scale):计次、排序 c 定距(Interval Scale):计次、排序、加减 d 定比(Ratio Scale):计次、排序、加减、乘除 4.1.2 频数分析的基本操作 ●(1)选择菜单Analyze—Descriptive Statistics—Frequencies。 ●(2)将若干频数分析变量选择到Variable(s)框中。 ●(3)单击Chart按钮选择绘制统计图形,在Chart Values框中选择条形图中纵坐标(或 饼图中扇形面积)的含义,其中Frequencies表示频数;Percentages表示百分比。

多元统计分析 第四章至第九章 课后题数据

4.8 某超市经销十种品牌饮料,其中四种畅销,三种平销,三种滞销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。 销售情况 产品序号 销售价格 口味评分 信任度评分 畅销 1 2. 2 5 8 2 2.5 6 7 3 3 3 9 4 3.2 8 6 平销 5 2.8 7 6 6 3.5 8 7 7 4. 8 9 8 滞销 8 1.7 3 4 9 2.2 4 2 10 2.7 4 3 (1) 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。 (2) 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。 4.9 银行的贷款部门需要判别每个客户的信用好坏(是否为履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄(1X )、受教育程度(2X )、现在所从事工作的年数(3X )、未变更住址的年数(4X )、收入(5X )、负债收入比例(6X )、信用卡债务(7X )、其他债务(8X )等来判断其信用情况。下表是从银行的客户资料中抽取的部分数据,(1)根据样本资料分别用距离判别法、贝叶斯判别法和费希尔判别法建立判别函数和判别规则。(2)某客户的如上情况资料为(53,1,918,50,11.20,2.02,3.58),对其进行信用好坏的评。 目前信用好坏 客户序 号 X1 X2 X3 X4 X5 X6 X7 X8 已履行还贷责任 1 23 1 7 2 31 6.6 0.34 1.71 2 34 1 17 3 59 8 1.81 2.91 3 42 2 7 23 41 4.6 0.9 4 0.94 4 39 1 19 5 48 13.1 1.93 4.3 6 5 35 1 9 1 34 5 0.4 1.3 未履行还贷责任 6 3 7 1 1 3 24 15.1 1. 8 1.82 7 2 9 1 13 1 42 7.4 1.46 1.65 8 32 2 11 6 75 23.3 7.76 9.72 9 28 2 2 3 23 6.4 0.19 1.29 10 26 1 4 3 27 10.5 2.47 0.36 5.8 下表是15个上市公司2001年的一些主要财物指标,使用系统聚类法和K 均值法分别对这些公司进行聚类,并对结果进行比较分析。 公司编号 净资产收益率 每股 净利润 总资产周转率 资产负债率 流动负债比率 每股 净资产 净利润增长率 总资产增长率 1 11.09 0.21 0.05 96.98 70.53 1.86 -44.04 81.99 2 11.96 0.59 0.74 51.78 90.73 4.95 7.02 16.11

应用多元统计分析SAS作业第三章

3-8假定人体尺寸有这样的一般规律,身高(X 1),胸围(X 2)和上半臂围(X 3)的平均尺寸比例是6:4:1,假设()()1,,X n αα=L 为来自总体()123=,,X X X X '的随机样本,并设()~,X N μ∑。试利用表3.4中男婴这一数据来检验其身高、胸围和上半臂围这三个尺寸变量是否符合这一规律(写出假设H 0,并导出检验统计量)。 解:设32,~(,),~(,)Y CX X N Y N C C C μμ'=∑∑。 121231233106,,,,,014C X X X μμμμμμμ??-?? ? == ? ?-?? ? ??其中,分别为 的样本均值。则检验三个变量是否符合规律的假设为 0212:,:H C O H C O μμ=≠。 检验统计量为 2 1(1)1~(1,1) (3,6)(1)(1) n p F T F p n p p n n p ---+= --+==--, 由样本值计算得:=(82,60.2,14.5)X ',及 15840.2 2.5=40.215.86 6.552.5 6.559.5A ?? ? ? ??? , 2-1(1)()()()=47.1434T n n CX CAC CX ''=-,

221(1)12 =18.8574(1)(1)5 n p F T T n p ---+= ?=--, 对给定显著性水平=0.05α,利用软件SAS9.3进行检验时,首先计算p 值: p =P {F ≥18.8574}=0.0091948。 因为p 值=0.0091948<0.05,故否定0H ,即认为这组男婴数据与人类的一般规律不一致。在这种情况下,可能犯第一类错误·且犯第一类错误的概率为0.05。 SAS 程序及结果如下: prociml ; n=6;p=3; x={7860.616.5, 7658.112.5, 9263.214.5, 815914, 8160.815.5, 8459.514 }; m0={00,00}; c={10 -6,01 -4}; ln={[6]1}; x0=(ln*x)`/n; print x0; mm=i(6)-j(6,6,1)/n; a=x`*mm*x; a1=inv(c*a*c`); a2=c*x0; dd=a2`*a1*a2; d2=dd*(n-1); t2=n*d2; f=(n+1-p)*t2/((n-1)*(p-1)); print x0 a d2 t2 f; p0=1-probf(f,p-1,n-p+1); fa=finv(0.95,2,4); print p0; run ;

第4章 SPSS基本统计分析(课后练习参考)

第三章 1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。 第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。 第二份文件:选取数据数据——选择个案——随机个案样本——输入70。 2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。 排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。 3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。 计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。 4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。同时,计算男生和女生各科成绩的平均分。 方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定 5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。 根据存款金额排序,观察其最大值与最小值,算出组数和组距。转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值. 6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。 转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。 7、对习题二第5题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。 数据——加权个案——点击加权个案——将人数作为频率变量——确定。 第四章

多元统计分析第四章至第九章课后题数据

某超市经销十种品牌饮料,其中四种畅销,三种平销,三种滞销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。 销售情况 产品序号 销售价格 口味评分 信任度评分 畅销 1 5 8 2 6 7 3 3 3 9 4 8 6 平销 5 7 6 6 8 7 7 9 8 滞销 8 3 4 9 4 2 10 4 3 (1) 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。 (2) 现有一新品牌的饮料在该超市试销,其销售价格为,顾客对其口味的评分平均为8,信 任评分平均为5,试预测该饮料的销售情况。 银行的贷款部门需要判别每个客户的信用好坏(是否为履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄(1X )、受教育程度(2X )、现在所从事工作的年数(3X )、未变更住址的年数(4X )、收入(5X )、负债收入比例(6X )、信用卡债务(7X )、其他债务(8X )等来判断其信用情况。下表是从银行的客户资料中抽取的部分数据,(1)根据样本资料分别用距离判别法、贝叶斯判别法和费希尔判别法建立判别函数和判别规则。(2)某客户的如上情况资料为(53,1,918,50,,,),对其进行信用好坏的评。 目前信用好坏 客户序 号 X1 X2 X3 X4 X5 X6 X7 X8 已履行还贷责任 1 23 1 7 2 31 2 34 1 17 3 59 8 3 42 2 7 23 41 4 39 1 19 5 48 5 35 1 9 1 34 5 未履行还贷责任 6 3 7 1 1 3 24 7 29 1 13 1 42 8 32 2 11 6 75 9 28 2 2 3 23 10 26 1 4 3 27 下表是15个上市公司2001年的一些主要财物指标,使用系统聚类法和K 均值法分别对这 些公司进行聚类,并对结果进行比较分析。 公司编号 净资产收益率 每股净利 总资产周转率 资产负债流动负债比率 每股净资净利润增长率 总资产增长率

多元统计分析-第三章 多元正态分布

第三章 多元正态分布 多元正态分布是一元正态分布在多元情形下的直接推广,一元正态分布在统计学理论和应用方面有着十分重要的地位,同样,多元正态分布在多元统计学中也占有相当重要的地位。多元分析中的许多理论都是建立在多元正态分布基础上的,要学好多元统计分析,首先要熟悉多元正态分布及其性质。 第一节 一元统计分析中的有关概念 多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,学习多元统计分析,首先要对随机向量和随机矩阵有所把握,为了学习的方便,先对一元统计分析中的有关概念和性质加以复习,并在此基础上推广给出多元统计分析中相应的概念和性质。 一、随机变量及概率分布函数 (一)随机变量 随机变量是随机事件的数量表现,可用X 、Y 等表示。随机变量X 有两个特点:一是取值的随机性,即事先不能够确定X 取哪个数值;二是取值的统计规律性,即完全可以确定X 取某个值或X 在某个区间取值的概率。 (二)随机变量的概率分布函数 随机变量X 的概率分布函数,简称为分布函数,其定义为: )()(x X P x F ≤= 随机变量有离散型随机变量和连续型随机变量,相对应的概率分布就有离散型概率分布和连续型概率分布。 1、离散型随机变量的概率分布 若随机变量X 在有限个或可列个值上取值,则称X 为离散型随机变量。 设X 为离散型随机变量,可能取值为1x ,2x ,…,取这些值的概率分别为1p ,2p , …,记为 k k p x X P ==)(( ,2,1=k ) 称k k p x X P ==)(( ,2,1=k )为离散型随机变量X 的概率分布。 离散型随机变量的概率分布具有两个性质: (1) 0≥k p , ,2,1=k (2)11 =∑∞ =k k p 2、连续型随机变量的概率分布 若随机变量X 的分布函数可以表示为 dt t f x F x ?∞-=)()( 对一切R x ∈都成立,则称X 为连续型随机变量,称 )(x f 为X 的概率分布密度函数,简

(整理)多元统计分析各章的电子版数据

第二章数据

第三章数据 例3-1 X1 职工标准工资收入 X5 单位得到的其他收入 X2 职工奖金收入 X6 其他收入 X3 职工津贴收入 X7 性别 X4 其他工资性收入 X8 就业身份 X1 X2 X3 X4 X5 X6 X7 X8 540.00 0.0 0.0 0.0 0.0 6.00 男国有1137.00 125.00 96.00 0.0 109.00 812.00 女集体1236.00 300.00 270.00 0.0 102.00 318.00 女国有1008.00 0.0 96.00 0.0 86.0 246.00 男集体1723.00 419.00 400.00 0.0 122.00 312.00 男国有1080.00 569.00 147.00 156.00 210.00 318.00 男集体1326.00 0.0 300.00 0.0 148.00 312.00 女国有1110.00 110.00 96.00 0.0 80.00 193.00 女集体1012.00 88.00 298.00 0.0 79.00 278.00 女国有1209.00 102.00 179.00 67.00 198.00 514.00 男集体1101.00 215.00 201.00 39.00 146.00 477.00 男集体 例3-3 English Norwegian Danish Dutch German French One En en een ein un Two To to twee zwei deux Three Tre tre drie drei trois Four Fire fire vier vier quatre Five Fem fem vijf funf einq Six Seks seks zes sechs six seven Sju syv zeven siebcn sept Eight Ate otte acht acht huit Nine Ni ni negen neun neuf Ten Ti ti tien zehn dix Spanish Italian Polish Hungarian Finnish Uno uno jeden egy yksi Dos due dwa ketto kaksi Tres tre trzy harom kolme cuatro quattro cztery negy neua Cinco cinque piec ot viisi Seix sei szesc hat kuusi Siete sette siedem het seitseman Ocho otto osiem nyolc kahdeksau nueve nove dziewiec kilenc yhdeksan Diez dieci dziesiec tiz kymmenen

相关文档
相关文档 最新文档