一. 利用多元线性回归模型建立房地产公司房屋售价(price单位美元)与房屋面积(sqf单位平方英尺)、房龄(age单位年)、卧房个数(bed)、卫生间个数(bath)和车库车位个数(garage)之间的线性关系。显著性水平为0.05。
SPSS数据结果:
模型摘要 | ||||
模型 | R | R 方 | 调整后 R 方 | 标准估算的错误 |
1 | .903a | .816 | .813 | 27350.252 |
a. 预测变量:(常量), garage, bed, age, bath, sqf |
ANOVAa | ||||||
模型 | 平方和 | 自由度 | 均方 | F | 显著性 | |
1 | 回归 | 1038897292243.098 | 5 | 207779458448.620 | 277.767 | .000b |
残差 | 234135351518.656 | 313 | 748036266.833 | |||
总计 | 1273032643761.754 | 318 | ||||
a. 因变量:price | ||||||
b. 预测变量:(常量), garage, bed, age, bath, sqf |
系数a | ||||||||
模型 | 未标准化系数 | 标准化系数 | t | 显著性 | B 的 95.0% 置信区间 | |||
B | 标准错误 | Beta | 下限 | 上限 | ||||
1 | (常量) | 31127.602 | 9539.669 | 3.263 | .001 | 12357.616 | 49897.588 | |
sqf | 63.066 | 4.017 | .623 | 15.700 | .000 | 55.162 | 70.969 | |
age | -1144.437 | 112.780 | -.299 | -10.148 | .000 | -1366.340 | -922.534 | |
bed | -8410.379 | 3002.511 | -.101 | -2.801 | .005 | -14318.036 | -2502.722 | |
bath | 3521.954 | 1580.997 | .080 | 2.228 | .027 | 411.229 | 6632.679 | |
garage | 28203.542 | 2858.692 | .298 | 9.866 | .000 | 22578.859 | 33828.225 | |
a. 因变量:price |
对于SPSS数据结果的分析:
(1)回归方程:
y=31127.602+63.066X1-1144.437X2-8410.379X3+3521.954X4+28203.542X5
(2)拟合优度检验:
R^2=0.816,拟合效果较好。说明房地产公司房屋售价的变差中有81.6%是由于屋面积、房龄、卧房个数、卫生间个数和车库车位个数的线性关系引起的。
(3)回归方程做显著性检验:
由于房地产公司房屋售价与房屋面积、房龄、卧房个数、卫生间个数和车库车位个数之间的线性关系显著性p值均小于0.05,拒绝原假设H0:β1= β2= β3= β4=β5=0说明回归方程显著。
显著性检验:回归方程的显著性P值小于0.05,拒绝原假设,说明回归方程是显著的。
(4)每个回归系数的显著性检验:
(1)房屋面积显著性P<0.05,则拒绝原假设,说明房屋面积对房屋售价有显著的线性关系;其他条件不变的情况下,系数63.066表示房屋面积每增加1平方英尺,房屋售价平均增加63.066美元。
(2)房龄age的显著性P<0.05,则拒绝原假设,说明房龄对房屋售价有显著的线性关系;其他条件不变的情况下,系数1144.437表示房龄每增加1年,房屋售价平均减少1144.437美元。
(3)卧房个数bed的显著性P<0.05,则拒绝原假设,说明卧房个数对房屋售价有显著的线性关系;其他条件不变的情况下,系数8410.379表示卧房个数每增加1个,房屋售价平均减少8410.379美元。
(4)卫生间个数bath的显著性P<0.05,则拒绝原假设,说明卫生间个数对房屋售价有显著的线性关系;其他条件不变的情况下,系数3521.954表示卫生间个数每增加1个,房屋售价平均增加3521.954美元。
(5)车库车位个数garage的显著性P<0.05,则拒绝原假设,说明车库车位个数对房屋售价有显著的线性关系;其他条件不变的情况下,系数28203.542表示车库车位个数每增加1个,房屋售价平均增加28203.542美元。
(5)置信区间:
X1置信区间:(55.162, 70.969)
X2置信区间:(-1366.340, -922.534)
X3置信区间:(-14318.036, -2502.722)
X4置信区间:(411.229, 6632.679)
X5置信区间:(22578.859, 33828.225)
(6)标准化回归方程及贡献状况:
Y=0.623X1-0.299X2-0.101X3+0.08X4+0.298X5
由于0.623>0.298>0.08,则各变量之间对房地产公司房屋售价的具有正向显著影响的各变量的贡献状况由高到低依次为:房屋面积>车库车位个数>卫生间个数
二.某自行车租用公司利用多元线性回归模型研究每天cnt(临时用户和注册用户人数之和)与可能对其产生影响的因素之间的关系,可能影响的因素有mnth(月,1-12),holiday(是否节假日,0=否,1=是),workday(是否工作日,1=不是周末或节假日,0=是周末或节假日),weathsit(天气情况,1=晴,无云或少云或局部多云,2=有雾或多云,3=小雪或小雨,4=大雪或大雨或大雾或冰雹),temp(0-1,标准化后的摄氏温度),hum(0-1,标准化后的湿度),windspd(0-1,标准化后的风速)。显著性水平为0.05。
SPSS数据结果:
模型汇总 | ||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 |
1 | .802a | .644 | .637 | 1078.155 |
a. 预测变量: (常量), windspd, holiday, weathsit, mnth, workday, temp, hum。 |
Anovaa | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 751610407.993 | 7 | 107372915.428 | 92.370 | .000b |
残差 | 416146042.433 | 358 | 1162419.113 | |||
总计 | 1167756450.426 | 365 | ||||
a. 因变量: cnt | ||||||
b. 预测变量: (常量), windspd, holiday, weathsit, mnth, workday, temp, hum。 |
系数a | ||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | B 的 95.0% 置信区间 | |||
B | 标准 误差 | 试用版 | 下限 | 上限 | ||||
1 | (常量) | 4297.819 | 401.223 | 10.712 | .000 | 3508.768 | 5086.870 | |
mnth | 97.757 | 16.905 | .189 | 5.783 | .000 | 64.512 | 131.002 | |
holiday | -953.807 | 343.355 | -.091 | -2.778 | .006 | -1629.053 | -278.560 | |
workday | 211.286 | 125.661 | .055 | 1.681 | .094 | -35.840 | 458.413 | |
weathsit | -697.796 | 144.477 | -.201 | -4.830 | .000 | -981.927 | -413.666 | |
temp | 6413.272 | 342.021 | .632 | 18.751 | .000 | 5740.649 | 7085.896 | |
hum | -1701.671 | 576.551 | -.128 | -2.951 | .003 | -2835.523 | -567.818 | |
windspd | -3621.827 | 778.546 | -.158 | -4.652 | .000 | -5152.924 | -2090.729 | |
a. 因变量: cnt |
对于SPSS数据结果的分析:
(1)回归方程:
Y=4297.819+97.757X1-953.807X2+211.286X3-697.796X4+6413.272X5-1701.671X6-3621.827X7
(2)拟合优度检验:
R2=0.644,拟合效果较好,自行车租用的临时用户和注册用户人数之和的变差中有64.4%是由于月、是否节假日、是否工作日、天气情况、温度、湿度和风速的线性关系引起的。
(3)显著性检验:
由于P=0<0.05,则拒绝原假设H0:β1=β2=β3=β4=β5=β6=β7=0,说明回归方程是显著的。
(4)每个回归系数的显著性检验:
(1)月mnth的P值<0.05,则拒绝原假设,说明月对自行车租用的临时用户和注册用户人数之和有显著的线性关系;其他条件不变的情况下,系数97.757表示月每增加1,自行车租用的临时用户和注册用户人数之和平均增加97.757。
(2)节假日holiday的P值<0.05,则拒绝原假设,说明节假日对自行车租用的临时用户和注册用户人数之和有显著的线性关系;其他条件不变的情况下,系数953.807表示节假日每增加1,自行车租用的临时用户和注册用户人数之和平均减少953.807。
(3)工作日workday的P值>0.05,则接受原假设,说明工作日对自行车租用的临时用户和注册用户人数之和无显著的线性关系。
(4)天气情况weathsit的P值<0.05,则拒绝原假设,说明天气情况对自行车租用的临时用户和注册用户人数之和有显著的线性关系;其他条件不变的情况下,系数697.796表示天气情况每增加1,自行车租用的临时用户和注册用户人数之和平均减少697.796。
(5)温度temp的P值<0.05,则拒绝原假设,说明温度对自行车租用的临时用户和注册用户人数之和有显著的线性关系;其他条件不变的情况下,系数6413.272表示温度每增加1,自行车租用的临时用户和注册用户人数之和平均增加6413.272。
(6)湿度hum的P值<0.05,则拒绝原假设,说明湿度对自行车租用的临时用户和注册用户人数之和有显著的线性关系;其他条件不变的情况下,系数1701.671表示湿度增加1,自行车租用的临时用户和注册用户人数之和平均减少1701.671。
(7)风速windspd的P值<0.05,则拒绝原假设,说明风速对自行车租用的临时用户和注册用户人数之和有显著的线性关系;其他条件不变的情况下,系数3621.827表示风速每增加1,自行车租用的临时用户和注册用户人数之和平均减少3621.827。
(5)置信区间:
(1)回归系数0的置信区间为[3508.768,5086.870];
(2)回归系数1的置信区间为[64.512,131.002];
(3)回归系数2的置信区间为[-1629.053,-278.560];
(4)回归系数3的置信区间为[-35.840,458.413];
(5)回归系数4的置信区间为[-981.927,-413.666];
(6)回归系数5的置信区间为[5740.649,7085.896]
(7)回归系数6的置信区间为-2835.523,-567.818]
(8)回归系数7的置信区间为[-5152.924,-2090.729]
(6)各变量的贡献状况:
标准化回归方程:
ŷ=0.189x1-0.091x2+0.055x3-0.201x4+0.6322x5-0.128x6-0.158x7
月、工作日、温度具有正向显著影响,其中温度贡献状况最大,其次是月,最后是工作日。