From 2f8427cd0eb023e8c958915e813157d19a2bf0ba Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E6=BD=98=E6=98=8E=E6=98=8E?= <8155660+pan-mingming@user.noreply.gitee.com> Date: Thu, 8 Oct 2020 15:19:19 +0800 Subject: [PATCH] 111 --- ...\347\273\203\344\271\240\351\242\2304.Rmd" | 68 +++++++++---------- 1 file changed, 34 insertions(+), 34 deletions(-) diff --git "a/exer/\345\244\232\345\205\203\347\273\203\344\271\240\351\242\2304.Rmd" "b/exer/\345\244\232\345\205\203\347\273\203\344\271\240\351\242\2304.Rmd" index 750a19c..4a46413 100644 --- "a/exer/\345\244\232\345\205\203\347\273\203\344\271\240\351\242\2304.Rmd" +++ "b/exer/\345\244\232\345\205\203\347\273\203\344\271\240\351\242\2304.Rmd" @@ -1,141 +1,141 @@ --- -title: "4 多元相关与回归分析" -author: "王斌会" -date: "2020年2月1日" +title: "4 澶氬厓鐩稿叧涓庡洖褰掑垎鏋" +author: "鐜嬫枌浼" +date: "2020骞2鏈1鏃" output: word_document --- ```{r setup} -rm(list=ls()) #清理内存 -options(digits=4) #输出结果位数 -par(mar=c(4,4,2,1)) #设置图片输出位置 +rm(list=ls()) #娓呯悊鍐呭瓨 +options(digits=4) #杈撳嚭缁撴灉浣嶆暟 +par(mar=c(4,4,2,1)) #璁剧疆鍥剧墖杈撳嚭浣嶇疆 library(openxlsx) library(knitr) library(leaps) ``` ## 4.1 - **一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了该公司每周加班工作时间y(小时)的数据和签发的新保单数目x(张),数据见下表。**    + **涓瀹朵繚闄╁叕鍙稿崄鍒嗗叧蹇冨叾鎬诲叕鍙歌惀涓氶儴鍔犵彮鐨勭▼搴︼紝鍐冲畾璁ょ湡璋冩煡涓涓嬬幇鐘躲傜粡杩10鍛ㄦ椂闂达紝鏀堕泦浜嗚鍏徃姣忓懆鍔犵彮宸ヤ綔鏃堕棿y锛堝皬鏃讹級鐨勬暟鎹拰绛惧彂鐨勬柊淇濆崟鏁扮洰x锛堝紶锛夛紝鏁版嵁瑙佷笅琛ㄣ**銆銆銆 ```{r read4.1,comment=''} -d4.1=read.xlsx('mvexer5.xlsx',sheet='E4.1') #读取数据 -kable(d4.1) #显示数据 +d4.1=read.xlsx('mvexer5.xlsx',sheet='E4.1') #璇诲彇鏁版嵁 +kable(d4.1) #鏄剧ず鏁版嵁 ``` ### 4.1.1 -  **绘制散点图,并以此判断$x$与$y$之间是否大致呈线性关系。** +銆銆**缁樺埗鏁g偣鍥撅紝骞朵互姝ゅ垽鏂$x$涓$y$涔嬮棿鏄惁澶ц嚧鍛堢嚎鎬у叧绯汇** ```{r block4.1.1,comment=''} ``` ### 4.1.2 -  **计算$x$与$y$的相关系数。** +銆銆**璁$畻$x$涓$y$鐨勭浉鍏崇郴鏁般** ```{r block4.1.2,comment=''} ``` ### 4.1.3 -  **用最小二乘估计法求回归方程。** +銆銆**鐢ㄦ渶灏忎簩涔樹及璁℃硶姹傚洖褰掓柟绋嬨** ```{r block4.1.3,comment=''} ``` ### 4.1.4 -  **求随机误差$\varepsilon$的方差$\sigma^2$的估计值。** +銆銆**姹傞殢鏈鸿宸$\varepsilon$鐨勬柟宸$\sigma^2$鐨勪及璁″笺** ```{r block4.1.4,comment=''} ``` ### 4.1.5 -  **计算$x$与$y$的决定系数。** +銆銆**璁$畻$x$涓$y$鐨勫喅瀹氱郴鏁般** ```{r block4.1.5,comment=''} ``` ### 4.1.6 -  **对回归方程作方差分析。** +銆銆**瀵瑰洖褰掓柟绋嬩綔鏂瑰樊鍒嗘瀽銆** ```{r block4.1.6,comment=''} ``` ### 4.1.7 -  **对回归方程作残差图并作一些分析。** +銆銆**瀵瑰洖褰掓柟绋嬩綔娈嬪樊鍥惧苟浣滀竴浜涘垎鏋愩** ```{r block4.1.7,comment=''} ``` ### 4.1.8 -  **计算$x_0=1000(张)$时需要的加班时间是多少?** +銆銆**璁$畻$x_0=1000(寮)$鏃堕渶瑕佺殑鍔犵彮鏃堕棿鏄灏戯紵** ```{r block4.1.8,comment=''} ``` ## 4.2 -  **某房地产公司的总裁想了解为什么公司中的某些分公司比其他分公司表现出色,他认为决定总年销售额(以百万元计)的关键因素是广告预算(以千元计)和销售代理的数目。为了分析这种情况,他抽取了八家分公司作为样本,收集了下表所示的数据。** +銆銆**鏌愭埧鍦颁骇鍏徃鐨勬昏鎯充簡瑙d负浠涔堝叕鍙镐腑鐨勬煇浜涘垎鍏徃姣斿叾浠栧垎鍏徃琛ㄧ幇鍑鸿壊锛屼粬璁や负鍐冲畾鎬诲勾閿鍞(浠ョ櫨涓囧厓璁)鐨勫叧閿洜绱犳槸骞垮憡棰勭畻(浠ュ崈鍏冭)鍜岄攢鍞唬鐞嗙殑鏁扮洰銆備负浜嗗垎鏋愯繖绉嶆儏鍐碉紝浠栨娊鍙栦簡鍏鍒嗗叕鍙镐綔涓烘牱鏈紝鏀堕泦浜嗕笅琛ㄦ墍绀虹殑鏁版嵁銆** ```{r read4.2,comment=''} ``` ### 4.2.1 -  **准备一回归模型并解释各系数。** +銆銆**鍑嗗涓鍥炲綊妯″瀷骞惰В閲婂悇绯绘暟銆** ```{r block4.2.1,comment=''} ``` ### 4.2.2 -  **试用5%的显著性水平,确定每一解释变量与依赖变量间是否呈线性关系。**   +銆銆**璇曠敤5%鐨勬樉钁楁ф按骞筹紝纭畾姣忎竴瑙i噴鍙橀噺涓庝緷璧栧彉閲忛棿鏄惁鍛堢嚎鎬у叧绯汇**銆銆 ```{r block4.2.2,comment=''} ``` ### 4.3.1 -  **计算相关系数和复相关系数。** +銆銆**璁$畻鐩稿叧绯绘暟鍜屽鐩稿叧绯绘暟銆** ```{r block4.2.3,comment=''} ``` ## 4.3 -  **预测一学校毕业生的起始工资的变化是否能用学生的平均成绩点数(GPA)和毕业时的年龄来解释。下表所示为其学校办公室提供的样本数据。** +銆銆**棰勬祴涓瀛︽牎姣曚笟鐢熺殑璧峰宸ヨ祫鐨勫彉鍖栨槸鍚﹁兘鐢ㄥ鐢熺殑骞冲潎鎴愮哗鐐规暟(GPA)鍜屾瘯涓氭椂鐨勫勾榫勬潵瑙i噴銆備笅琛ㄦ墍绀轰负鍏跺鏍″姙鍏鎻愪緵鐨勬牱鏈暟鎹** ```{r read4.3,comment=''} ``` ### 4.3.1 -  **准备一回归模型并解释各系数。** +銆銆**鍑嗗涓鍥炲綊妯″瀷骞惰В閲婂悇绯绘暟銆** ```{r block4.3.1,comment=''} ``` ### 4.3.2 -  **确定学生的GPA和年龄是否能真正用来解释起始工资样本的变化。** +銆銆**纭畾瀛︾敓鐨凣PA鍜屽勾榫勬槸鍚﹁兘鐪熸鐢ㄦ潵瑙i噴璧峰宸ヨ祫鏍锋湰鐨勫彉鍖栥** ```{r block4.3.2,comment=''} ``` ### 4.3.3 -  **预测某GPA为3.00、年龄为24岁的毕业生的起始工资。** +銆銆**棰勬祴鏌怗PA涓3.00銆佸勾榫勪负24宀佺殑姣曚笟鐢熺殑璧峰宸ヨ祫銆** ```{r block4.3.3,comment=''} ``` ## 4.4 -  **研究货运总量y(万吨)与工业总产值$x_1$(亿元)、农业总产值$x_2$(亿元)、居民非商品支出$x_3$(亿元)的关系。有关数据见下表。** +銆銆**鐮旂┒璐ц繍鎬婚噺y(涓囧惃)涓庡伐涓氭讳骇鍊$x_1$(浜垮厓)銆佸啘涓氭讳骇鍊$x_2$(浜垮厓)銆佸眳姘戦潪鍟嗗搧鏀嚭$x_3$(浜垮厓)鐨勫叧绯汇傛湁鍏虫暟鎹涓嬭〃銆** ```{r read4.4,comment=''} ``` ### 4.4.1 -  **计算出$y$、$x_1$、$x_2$、$x_3$相关系数矩阵并绘制矩阵散点图。** +銆銆**璁$畻鍑$y$銆$x_1$銆$x_2$銆$x_3$鐩稿叧绯绘暟鐭╅樀骞剁粯鍒剁煩闃垫暎鐐瑰浘銆** ```{r block4.4.1,comment=''} ``` ### 4.4.2 -  **求$y$关于$x_1$、$x_2$、$x_3$的多元线性回归方程。** +銆銆**姹$y$鍏充簬$x_1$銆$x_2$銆$x_3$鐨勫鍏冪嚎鎬у洖褰掓柟绋嬨** ```{r block4.2,comment=''} ``` ### 4.4.3 -  **对所求得的方程作拟合优度检验。** +銆銆**瀵规墍姹傚緱鐨勬柟绋嬩綔鎷熷悎浼樺害妫楠屻** ```{r block4.4.3,comment=''} ``` ### 4.4.4 -  **对回归方程及每一个回归系数作显著性检验。** -  在5%的显著水平下,发现只有$x_2$的t检验p值小于0.05,系数是显著的,截距项、$x_1$和$x_3$的p值都大于0.05,系数不显著。而对整个模型的显著性水平检验即方差分析中可以看到$x_1$和$x_2$的p值都小于0.05,说明模型对$x_1$和$x_2$的回归是有意义的。 +銆銆**瀵瑰洖褰掓柟绋嬪強姣忎竴涓洖褰掔郴鏁颁綔鏄捐憲鎬ф楠屻** +銆銆鍦5%鐨勬樉钁楁按骞充笅锛屽彂鐜板彧鏈$x_2$鐨則妫楠宲鍊煎皬浜0.05锛岀郴鏁版槸鏄捐憲鐨,鎴窛椤广$x_1$鍜$x_3$鐨刾鍊奸兘澶т簬0.05锛岀郴鏁颁笉鏄捐憲銆傝屽鏁翠釜妯″瀷鐨勬樉钁楁ф按骞虫楠屽嵆鏂瑰樊鍒嗘瀽涓彲浠ョ湅鍒$x_1$鍜$x_2$鐨刾鍊奸兘灏忎簬0.05锛岃鏄庢ā鍨嬪$x_1$鍜$x_2$鐨勫洖褰掓槸鏈夋剰涔夌殑銆 ### 4.4.5 -  **如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验。** +銆銆**濡傛灉鏈夌殑鍥炲綊绯绘暟娌¢氳繃鏄捐憲鎬ф楠岋紝灏嗗叾鍓旈櫎锛岄噸鏂板缓绔嬪洖褰掓柟绋嬶紝鍐嶄綔鍥炲綊鏂圭▼鐨勬樉钁楁ф楠屽拰鍥炲綊绯绘暟鐨勬樉钁楁ф楠屻** ```{r block4.4.4,comment=''} -fm4_=lm(y~x2-1,data=d4.4);fm4_ #去掉x1、x3和截距项,只留下x2 +fm4_=lm(y~x2-1,data=d4.4);fm4_ #鍘绘帀x1銆亁3鍜屾埅璺濋」锛屽彧鐣欎笅x2 ``` ### 4.4.6 -  **使用变量选择方法获得一个最优回归模型。** +銆銆**浣跨敤鍙橀噺閫夋嫨鏂规硶鑾峰緱涓涓渶浼樺洖褰掓ā鍨嬨** ```{r block4.4.5,comment=''} ``` -- Gitee