新车定价问题数学模型探讨
新车定价问题数学模型探讨 1、多元线性回归模型 (1)主成分分析。指把多个指标通过线性变换选出较 少个数相互独立同时包含原来指标大部分信息的一种多元 统计分析方法。对于n个样本资料,观察每个样本p个变量(指 标)x1,x2,Lxp,那么构成了nXp阶的矩阵X模型必须满足以 下条件:①Fi与Fj互不相关,i≠j,i,j=1,2,Lp;②F1的 方差大于F2的方差,以此类推;
③a21j+a22j+L+a2pj=1 (j=1,2,L,p),从而确定系数aij的值,则F1,F2,LFp分别 是第一、第二L第p个主成分。(2)回归分析。回归分析是 一种处理两个或多个变量之间的相关关系的一种数理统计 方法,用来分析样本数据之间存在的规律,本文采用的是多 元线性回归分析的方法。若有k个自变量(解释变量),多 元线性回归模型可以表示为y=β0+kj=1移βjxj+ε,其中, βi(i=0,1,2,L,k)为待估参数,ε为残差。采用最小 二乘法求解上式中的参数通过MATLAB、SPSS等软件实现。
(3)解释变量的选取。影响新车价格的因素众多,本文主 要考虑新车的产品性能对价格的影响,选取了最高车速、最 大扭矩、最大输出功率、排量、油耗、车重、车身长度七个 影响新车价格的因素作为自变量。(4)模型的建立与求解。
首先,用x1,x2,x3,x4,x5,x6,x7分别表示最大扭矩(N-m)、 最高车速(km/h)、油耗(L/100km)、车身长度mm、车重 (kg)、排量(ml)、最大功率(kw)。①合资新车多元线性回归模型。本文选取了24款在2013年9月份到2014年3月份 上市的新车车型,采用主成分分析法,借助MATLAB软件把多 维数据降维处理,得到的结果如表1所示,前五个主成分的 累积贡献率达到了92.48%,能够反映大部分信息,得到了5 个主成分。表2中列出了样本的主成分系数,第一个主成分 的信息来源于x6,x7;
第二个主成分的信息来源于x4,x5;
第三个主成分的信息来源于x2;
第四个主成分的信息来源于 x3;
第五个主成分的信息来源于x1,x5。可以把本文所选用 的7个自变量视为有效变量,用来建立多元回归模型。本文 采用SPSS软件进行相关的分析,可以看到解释变量之间存在 着多重共线性关系,所以要对价格进行多元线性回归,经过 比较选出了一个最佳回归模型:
y=-4.712+0.053x1+0.071x7+0.004x5-0.026x2根据上式,确 定了新车的最大扭矩、最高车速、最大功率和车重四个参数 的情况下,就可以计算出新车的价格。运行结果中R=0.953, R2=0.908,表明数据之间的回归关系是非常强的,该模型是 合适的。对昕动2014款1.6MT乐享版、马自达62014款2.0自 动经典型和明锐2015款1.4TDSG逸俊版三款新车进行估价, 根据回归模型得到这三款车的价格分别是8.924万元, 13.137万元,16.1万元。表3中列出了误差检验的情况,相 对误差非常小,多元线性回归模型用在合资新车定价是可行 的。②自主品牌新车多元线性回归模型。选取了23款在2013 年10月份到2014年4月份上市的新车型,采用主成分分析方法,借助MATLAB软件把多维数据降维处理,结果如表4所示, 前四个主成分的累积贡献率达到了85.48%,能够反映大部分 信息,得到了4个主成分。表5列出了样本的主成分系数,第 一个主成分的信息来源于x1,x3,x5,x6;
第二个主成分的 信息来源于x2,x4,x7;
第三个主成分的信息来源于x3,x6;
第四个主成分的信息来源于x1。可以认为所选的7个自变量 均为有效变量。各变量之间同样存在着多重共线性关系,可 以用来建立多元线性回归模型。经过比较选出最佳回归模 型:y=-4.780+0.062x1+0.024x7+0.453x3-0.002x6。根据上 式,确定了新车的最大扭矩、最大功率、油耗和排量四个参 数的情况下,可以计算出新车的价格。模型的运行结果中 R=0.970,R2=0.942,表明数据之间的回归关系是非常强的, 该模型是合适的。对奔腾B702014款2.0MT舒适型、奔腾 B702014款1.8T运动豪华型、福美来M52014款1.6MT标准型进 行估价,由回归模型得到三款车的价格分别是9.1178万元, 13.0062万元,7.0366万元。表6中列出了误差检验的情况, 预测值相对误差都没有超过10%,可以认为多元线性回归模 型对自主品牌的新车定价是可行的。
2、BP神经网络模型 通过BP神经网络模型研究新车特性和价格的非线性映 射关系,对新车的价格造成影响的因素作为输入,新车的价 格作为输出,建立BP神经网络模型。本文采用多元回归模型 时的新车作为样本,把合资新车和自主品牌新车分开研究。选取的样本向量的各个分量指标能够充分的反映新车价格 变化的特征,本文选取最大扭矩、最高车速、油耗、车身长 度、车重、排量、最大功率作为定量指标。在研究合资汽车 时,对昕动2014款1.6MT乐享版、马自达62014款2.0自动经 典型和明锐2015款1.4TDSG逸俊版三款待估价车的价格进行 预测,结果见表7,三款新车的相对误差都没有超过2%,说 明模型对合资企业定价来说是可行的。在研究自主品牌汽车 时,对奔腾B702014款2.0MT舒适型、奔腾B702014款1.8T运 动豪华型、福美来M52014款1.6MT标准型三款待估车的价格 进行预测,结果见表8,三款新车的相对误差均未超过7%, 说明模型对自主品牌新车定价来说是可行的。
3、结论:两种定价模型的分析比较 表3、6、7、8统计了对两个模型检验的相对误差,这两 个模型的相对误差都是比较小的,可以认为这两个模型都是 可行的。多元线性回归模型的计算量比较小,但是不容易发 现解释变量之间的多重线性关系。在前面研究了合资和自主 品牌价格在20万以内的新车的多元线性回归模型,该区间模 型估价的误差非常小,其他价格区间如何呢?为此本文探讨 了价格在30~70万元之间的新车的多元线性回归模型,这个 价位的新车相对较少,只选取了14款这个价格区间的新车型, 得到回归方程(建模及求解过程略):
y=22.144+0.122x1+0.025x7,上式的运行结果中,R=0.661, R2=0.437,表明数据之间的回归性不是很强,用多元线性回归模型研究这个价位区间新车的价格不合适。另外,在前面 两个模型中,新车之间的价格间距是比较小的,而30~70万 的新车价格间距很大,这些因素都会影响模型的准确性。多 元线性回归模型适用的价格区间还可以进一步探讨。BP神经 网络模型是解决内部结构复杂问题有效的模型,模型的自学 习和自适应能力很强;
但其缺点也是十分明显的,当数据少 的时候,误差比较大;
收敛速度慢。高的价格区间新车样本 比较少,而BP神经网络模型需要足够的样本数据,因此,本 文没有再探讨其他价格区间BP神经网络模型的效果。但是, 和多元线性回归模型一样,BP神经网络模型也需要进一步探 讨适合的价格区间。在两个模型的改进中,应该全面考虑解 释变量。如果变量过多,可以用主成分分析法对解释变量进 行降维处理,得到几个少量的能反映绝大部分信息的新的解 释变量,用来研究这两个模型。另外,这两个模型都没有考 虑市场变化等因素对新车价格的影响,还需要完善。