什么是系统动力学基于系统动力学的建筑安全监管博弈研究

基于系统动力学的建筑安全监管博弈研究

基于系统动力学的建筑安全监管博弈研究 0引言建筑业是国民经济的支柱产业之建筑安全生产既是其持续健康发展的必要条件，也是人民安居乐业和社会安定的重要支撑。但是多年来，建筑安全生产基础薄弱，事故易发多发。除了受建筑企业自身生产力水平和从业人员素质等因素的制约和影响外,作为外部约束力量的政府部门的监管也是关键因素。上海“1115”特大火灾等建筑安全事故都警示建筑生产中安全监管的重要性。但是，由于建筑工程涉及到各参与方利益，安全监管常不能有效开展。一方面建筑企业受利益驱使，可能在事故风险与经济利益间进行博弈；
另一方面地方监管部门为了追求更多利益,也可能与企业合谋,从而影响安全监管的执行。为了保证建筑安全生产,必须建立科学的机制约束监管部门和建筑企业的行为。

关于如何建立科学的安全监管机制，国内外学者采用不同的方法进行了研究。IainMacLean通过案例分析了由执行安全监管到放松监管安全状况的变化;ChinShanLu等0采用实证研究的方法探讨了安全监管对生产效率的影响；
李志强H对我国交通建设工程安全监管现状及模式进行探讨，提出全过程动态循环安全监管模式的新思路。事实上，建筑工程的安全状况往往是建筑企业和监管部门之间一系列博弈的结果，博弈论亦是研究安全生产中监管部门与建筑企业行为的有效方法。但是，目前仅有少数学者从博弈的视角研究建筑安全监管,如：申玲等建立静态博弈模型分析监管部门需要关注的影响承包商安全生产投入的因素；
曹冬平等从博弈角度分析得出监管部门的处罚力度、安全检查成本和管理效率对建筑企业安全施工有较大影响；
张飞涟等B]则建立博弈模型确定监察机关对施工单位进行抽检的比例及处罚力度。这些研究多是运用经典博弈理论来分析建筑安全监管行为。经典博弈理论假设博弈双方为完全理性、从静态角度进行研究, 这与实际情况存在差别。因此,有待于采用更科学的理论和方法研究建筑安全监管问题。现实中，监管博弈双方往往不断地获取对方或者外界的信息来改变自己的策略。演化博弈理论从系统论出发,将群体行为的调整过程看作一个动态系统, 以有限理性为基础，突破经典博弈论理性假设的局限,强调动态的均衡M。因此，用演化博弈理论对建筑安全监管问题进行分析,将更接近实际情况。然而,演化博弈中的演化稳定策略(ESS,EvolutionarilyStableStrategy)只能描述系统的局部动态性质，不能表现均衡与动态选择过程之间的关系。系统动力学（SD,SystemDynamics)是研究复杂系统中信息反馈行为的有效仿真方法，它关注系统的动态变化与因果影响，能够在非完备信息状态下分析求解复杂问题。SD为研究不完全信息条件下演化博弈的复杂动态演化过程，提供了一种有效的辅助手段。因此，与已有的研究不同，笔者将把演化博弈与系统动力学相结合,考虑信息不确定的实际情况,对建筑安全监管中的动态博弈进行演化均衡稳定性分析，揭示博弈双方的动态特性,通过建立相应的SD模型和仿真更好地剖析建筑安全的波动规律,为科学的安全监管决策提供依据。

1建筑安全监管的演化博弈模型 1.1模型假设演化博弈论认为，有限理性的经济主体无法准确知道自己所处的利害状态，而是通过最有利的策略逐渐模仿下去,最终达到一种均衡状态2。建筑安全监管主要涉及到政府监管部门和建筑企业2个有限理性的局中人。在建筑安全监管中，监管部门是否监管、建筑企业是否按安全规程运作是一个动态博弈。在有限理性的前提下，建筑企业考虑利益所得及政府的监管惩罚，可以选择的策略假设为小={执行安全规程，不执行安全规程};政府监管部门为确保生命财产安全并考虑监管成本可选择的策略假设为皂={严格监管,不监管}。

假设建筑企业执行安全规程时的经营收益为Na,经监管部门检查为安全施工且无事故发生时,会得到一定的奖励Ra;不执行安全规程时,可节省安全投入G,但被监管部门检查出来后将受到惩罚Pa。

假设监管部门的日常收入（一般指上级的拨款等）为Nb,进行安全施工监管的成本为Cb。考虑到监管部门检查时，如果建筑企业采取不执行安全规程施工的策略，就会采用各种手段来掩盖，这时监管部门会有一定的失误概率（即把不安全施工认定为安全施工的概率）e,监管部门失误时，会受到惩罚（上级部门的直接经济惩罚或失去公众信任的间接声誉损失）Pb,监管部门检查出不安全施工项目时，由于避免了安全事故的发生，会得到一定的奖励（上级部门的直接经济奖励或公众信任提升的间接收益）Rb。监管部门监管不力时，如果建筑企业采取不安全施工且发生安全事故，监管部门也将受到惩罚Pb。

1.2模型求解根据上述假设,建立演化博弈模型的支付矩阵见表1。假设建筑企业采取不执行安全规程策略的比例为采取执行策略的比例为1-监管部门采取监管策略的比例为采取不监管策略的比例为1-；
T。

建筑企业采取不执行策略的期望收益函数E,为：
E1=y“Na+Ga+Ra)+(1-e) (Na+Ga-Pa)]+(1-y)(Na+Ga)(1)建筑企业采取执行策略的期望收益函数 E2为：
E2=y(Na+Ra)+(1-y)Na(2) 建筑企业的平均期望收益函数E为：
E=%EX+(1-x)E2(3) 根据Malthusian动态方程M,建筑企业采取不执行策略的复制动态方程为：
F(x)=字=x(E1-E)=x(1-x)dt1 Ga-(1-e)(Pa+Ra)y](4) 同理,监管部门采取监管策略和不监管策略的期望收益D1、込及平均收益函数珔和复制动态方程为：
(1-2x)Ga-(1-e)(Pa+Ra)y] DetJ)=={(1-2x)Ga-(1-e)(Pa+R,a)y]} {(1-2y)1-e)(Pb+Rb)x-Cb]}+ {x1-x)1-e)(Pa+Ra)} {y1-y)1-e)(Pb+Rb)}10) Tr(J)={(1-2x)Ga-(1-e)(Pa+Ra)y]}+ {(1-2y)[1-e)(Pb+Rb)x-Cb]}(11) J= 雅克比矩阵反映一个可微方程与给定点的最优线性逼近。通过分析系统的雅克比矩阵，可以判断系统稳定点是否为ESS13。通过分析后发现大多数情况下,系统并不存在某一状态使得博弈双方随着博弈次数的增加而逐渐趋于稳定。

因此，下面将在以上演化博弈分析的基础上建立系统动力学模 D1=xe(Nb-Cb-Pb)+(1-e) (Nb-Cb+Rb)]+(1-x)(Nb-Cb)(5)D2=x(Nb-Pb)+(1-x)Nb(6) D=yD1+(1-y)D2(7) F(y)=学=y(1-y)【1-e)(Pb+Rb)x-Cb]dt (8) 令（F(x),F(y))=(空,学）=(0,0),得到 dtdt 系统的5个均衡点为：A=(0,0),^=(0,1), 入3=(1,0),4=(1,1), As=(X,Y)((1-e)(^b+Rb),1-e)(^a+Ra)), 其中，A1,,-A4对应的是纯战略纳什均衡,a5对应的是混合战略纳什均衡。

由式(4)和式(8)可得该系统的雅克比矩阵、行列式和迹分别为：
-x(1-x)(1-e)(Pa+Ra) aa(9) (1-2y)【1-e)(Pb+Rb)x-Cj. 型,描述博弈双方博弈关系的长期动力学趋势,为研究各种不确定因素和制定相关政策提供一个定性与定量相结合的仿真预测平台16。

2SD演化博弈模型的建立结合上述分析，采用VensimPLEVersion5.9c建立建筑安全监管的SD 博弈模型如图1所示。Vensim是一个图形化建模的系统动力学建模软件,具有模型模拟、数组变量、真实性检验、灵敏性测试、模型最优化等强大功能。

该模型主要有4个流位变量、2个流率变量、 9个外部变量和20个中间变量构成。4个流位变量用来表示政府监管部门中采取严格监管策略和不监管策略的部门个数、建筑企业中采取执行安全规程施工和不执行安全规程施工的企业个数;2个流率变量表示政府监管部门采取监管策略的部门数量变化率和采取不执行安全规程施工的企业的变化率；

9个外部变量分别对应表1博弈支付矩阵中的9个变量取值,见表2。

3.1模型仿真分析模型初始值假设为：仿真起始时间INITIALTIME=0,仿真结束时间 FINALTIME=100,仿真步长 TIMESTEP=0.0078125,Na=3,Ga=2,Ra=I,Pa=3,Nb=3=1,Rb=1.5,Pb=2,e=0afl。下面探讨监管部门监管率和建筑企业不执行安全规程施工率,在不同初始值下系统变化的特性。3.1.1博弈双方初始策略均采用纳什均衡博弈双方初始均采用纳什均衡 A1=(0,0), 对于图2中的曲线x=0,=0和曲线x=1,规程施工时,监管部门的最佳策略是不监管；
当所有y=1可理解为：当所有的建筑企业都选择执行安全的建筑企业都选择不执行安全规程施工时，监管部门的最佳策略是监管。

对于图2中的曲线x=1,=0和曲线x=0,y=1可理解为：当所有的建筑企业都选择执行安全规程施工时,监管部门却选择监管;而当所有的建筑企业都选择不执行安全规程施工时,监管部门却选择不监管。也就是说当群体中的所有个体都不采取新策略时,即便先前的策略是不利的,也没有个体会学习新的有利策略,最终群体处于一种稳定的状态。

下面研究有个体采取新策略的情况。假设x=1,=0.01,即初始时所有的建筑企业均采取不执行安全规程施工,而仅有1%的监管部门监管时,博弈的演化过程如图3a所示;假设x=0.99,=1,即初始时监管部门均采取监管策略,而有99%的建筑企业不执行安全规程施工时,如图3b所示。

从图3a可知，当建筑企业总是采取不执行安全规程施工时,尽管开始只有极少的（1%)监管部门采取监管策略,但是通过学习，监管部门很快都采取监管策略,此时系统达到均衡状态A^。从图3b可知，当监管部门总是采取监管策略, 尽管开始有大多数的（99%)建筑企业采取不安全施工策略,但是通过学习，建筑企业很快都采取安全施工,此时系统达到均衡状态A:。

3.1.2博弈至多一方初始时采取混合战略纳什均衡博弈至多一方采用混合战略纳什均衡值时,假设为(0.5,V),(X*,0.9),则演化过程如图4所示。从图4可知，当系统的初始值和混合战略纳什均衡值不等时, 随着时间及博弈次数的增加,博弈双方的策略选择存在着比较大的波动。此时，系统的最终状态并不理想,博弈过程很难被控制。

3.1.3惩罚力度对模型的影响令x=0.5，二Y*时,考察惩罚力度变化对建筑企业安全施工的影响。假设TIME=50时加大对建筑企业的惩罚力度,即Pa由初始假设值3增加到6,此时模型拟合结果如图5a所示；
假设TIME=50时加大对监管部门的惩罚力度，即Pb由初始假设值2增加到4,则模型模拟结果如图5b所示。由图5可看出，加大对建筑企业的惩罚力度,短期内能减小其不执行安全规程施工率，但并不能降低建筑企业的博弈均衡点，所以长期来看并不是有效的策略;但是增加对监管部门的惩罚力度,却能够有效地降低建筑企业不执行安全规程施工的概率。

3.1.4奖励力度对模型的影响令x=0.5,r=Y*时,考察奖励力度的变化对建筑企业安全施工的影响。假设在TIME=50时加大对建筑企业的奖励力度,即R。由初始假设值1增大为3,此时模型拟合结果如图6a所示；
假设TIME=50时加大对监管部门的奖励力度,即Rb由初始假设值1.5增大为5,模型拟合结果如图6b所示。由图6可见,加大对建筑企业的奖励力度,并不能降低建筑企业的博弈均衡点；
但是增加对监管部门的奖励力度，却能够有效地降低建筑企业不执行安全规程施工的概率。

3.1.5监管部门监管失误率对模型的影响令x=0.4,=1时,考察监管部门监管失误率e对建筑企业安全施工的影响，如图7所示。由图7可知，当e比较小（小于50%)时，降低监管部门的失误率能够快速、有效地降低建筑企业的不执行安全规程施工概率。当e比较大（超过50%) 时,尽管监管部门总是检查,但建筑企业通过演化学习发现监管部门多数时候都出错,于是最终都会采取不执行安全规程施工的策略，且随着e的变大学习速度越快。3.1.6安全投入和监管成本对模型的影响令x=0.5,=Y*时,考察建筑企业的安全投入和监管部门的监管成本Cb 对建筑企业不执行安全规程施工率的影响。假设在TIME=50时建筑企业的安全投入增加，即由初始假设值2增大到5,此时模型拟合结果如图8a所示；
假设TIME=50 时监管部门的监管成本减小,即Cb由初始假设值1减小到0.5,模型拟合结果如图8b 所示。由图8可见，高额的安全投入会导致建筑企业不惜被查出罚款的风险,最终总是选择不执行安全规程施工的策略;而减小监管部门的监管成本可有效降低建筑企业不执行安全规程施工的概率。

类似的方法分析该模型的其余外部决策变量发现,Na和Nb的变化对建筑企业不执行安全规程施工率没有明显的影响。

3.1.7惩罚机制对模型的影响通过3.1.3中的分析发现：单纯地加大对建筑企业的惩罚力度并不能有效地防止建筑企业的不安全施工行为。如果采取动态惩罚机制，即对建筑企业的惩罚力度Pa和对监管部门的惩罚力度Pb是随着企业不执行安全规程的严重程度（可通过建筑企业不执行安全规程施工率来衡量）而变化的，那么对整个博弈模型的稳定性会产生如何影响呢？综合考虑获取企业不执行安全规程施工程度这一信息存在着信息延迟等问题,进一步深化图1所示的模型，可得到如图9所示的流图。

通过对图4和图10进行比较发现,通过动态惩罚机制，随着时间及博弈次数的增加,博弈双方的策略选择最终趋向于混合战略纳什均衡值，即动态惩罚机制相对一般惩罚策略,改变了博弈双方的支付矩阵,能够有效地抑制博弈过程的波动性,使博弈趋向于一个稳定的状态。因此，政府上级部门可以通过各种定量的手段获取建筑企业施工时不执行安全规程的程度指标,针对不同程度制定建筑企业和监管部门的处罚规定,有效地控制建筑施工中的安全问题。

3.2基于模型仿真结果的对策建议依据上述模型仿真分析结果，笔者对我国建筑安全监管提出如下建议：
3.2.1加大对监管部门的奖惩力度仿真结果表明，加大对监管部门的奖惩力度可以有效降低建筑企业不安全施工的概率。因此，应当建立针对监管部门及监管人员的奖励与惩罚相结合、问责与事故预防相结合的激励机制，即在评价监管部门和监管人员工作时,既要追究其在安全事故中的监管责任,也要奖励其在事故预防方面的工作业绩。这既可以有效激励监管部门和监管人员的监管力度和积极性,也能促进各级监管部门对建筑安全监管方法由事后追究责任向事前加强防治方面的转变,这是确保各项安全政策和措施有效执行的关键。

3.1.2减少监管部门的监管失误率通过监管失误率对模型影响的仿真分析可知, 监管失误率会对建筑企业的行为产生影响，较高的失误率会导致越来越多的企业不执行安全规程施工。监管部门将不安全施工认定为安全施工一般源自2种情况:一是监管人员自身水平有限未能发现；
二是监管人员与建筑企业之间存在合谋或腐败。因此,减少监管失误率需从2方面着手：_是提高监管人员的专业水平和检查技术手段，二是加强监管人员的职业道德建设，提高监管部门从业人员的素质和责任感。通过减少或避免监管工作中的失误或失职,以达到良好的监督管理效果。

3.1.3降低建筑安全监管成本从模型分析可知，减少监管成本可有效降低建筑企业不执行安全规程施工的概率。因此，监管部门应通过技术创新、加强内部运行控制等手段提高监管效率、降低监管成本,从而降低监管部门采取监管策略的门槛。监管部门采取监管的可能性越大，建筑企业违规操作的可能性相应就越小。降低建筑安全监管成本,既能在一定程度上鼓励建筑企业自我监管,也能体现节约型政府和节约型社会的改革思想。

3.1.4合理控制安全措施投入建筑企业往往为了追求眼前的效益而不愿进行建筑安全措施投入。事实上，建筑安全管理的理想状态应该是政府与企业的“双蠃”即随着建筑安全管理水平的提高，建筑企业的经济效益和建筑安全的社会效益均显著增长17]。因此，一方面，建筑企业应采取科学的安全生产措施，在不影响安全生产的前提下,合理控制安全措施成本；
另一方面，政府相关部门应利用自己的优势组织专家解决建筑安全生产中的关键技术,增强技术能力，研究经济高效的安全防护技术和机具，提高企业安全投入的效果，提高企业增加安全投入的积极性。

3.1.5建立科学的惩罚机制 -个良好的惩罚机制不是单纯依靠提高罚款额度来降低违法行为,而是在合理的水平上既能抑制不安全施工发生,也能避免博弈演化过程的波动性。模型仿真结果表明,加大对建筑企业的惩罚力度对于短期内改善建筑安全施工有一定的效果,但从建立建筑安全管理的长效机制来看,还需要有效的结合动态惩罚政策,即惩罚的力度随企业不安全施工的程度的不同而变化,从而达到稳定地控制安全事故发生的目的。通过建立科学地惩罚机制,使建筑企业将安全施工内在化、自主化，由“要我安全”转变为“我要安全”,从根本上解决建筑安全施工问题。

4结论 1)演化博弈论克服传统博弈论完全理性的局限性,而将演化博弈论与系统动力学相结合，可以更有效地拟合、解释现实中的动态博弈现象,为研究建筑安全监管这一复杂问题提供新的研究思路。

2)通过建立演化博弈的SD模型及数据仿真分析可知,奖惩力度、监管失误率、监管成本、安全投入、惩罚机制等因素会对监管部门和建筑企业的博弈行为产生影响,进而影响建筑安全状况。针对模型仿真结果,笔者提出5项建筑安全长效监管的措施。

综合运用演化博弈论和系统动力学方法研究建筑安全监管问题尽管是一种新的尝试，但研究是在一定的假设条件下进行的，现实中情况常常更为复杂。因此，结合实际深化模型,更好地诠释和仿真现实中的动态博弈现象,将是此类问题进一步研。