大数据视域下网络涉军舆情管控研究
大数据视域下网络涉军舆情管控研究 大数据是相对于一般数据而言的,目前对大数据尚 缺权威的严格定义,较为普遍的解释是指“难以用常规的软 件工具在容许的时间内对其内容进行抓取、管理和处理的数 据集合。”①全球数据每年新增40%,全球信息总量每两年 就可以翻番。2011年全球新产生和复制的数据量达到 1.8ZB(ZB即一千EB或百万PB),如果内存为32G的iPod来存的 话,数量达到575亿个,足以砌起两座长城,由此可见大数 据时代已经到来。大数据不仅是一种资源,也是一种方法, 被视为创新和提升生产力的下一个前沿,正成为国家竞争力 的要素之一,在世界范围内日益受到重视。多国政府加大了 对大数据发展的扶持力度,甚至上升到国家战略的高度。美 国就认为,谁掌握了数字数据传播和控制的主动权和主导权, 谁就能赢得未来。互联网在我国的迅猛发展,极大地丰富了信息传播的 渠道。新闻与评论、搜索引擎、BBS以及网络社区、时事论 坛、博客、维客、即时通信软件、Email和短信等成为民众 对社会当前各种现象和现实问题发表观点、表明立场的多元 化传播渠道。但网络舆情的传播是一把“双刃剑”,在传播 社会正能量的同时,也具备放大负面效应的作用。近年来, 网络涉军舆情层出不穷,既有如“联合军演”“海上争端” 等正面信息,也有如“军车打人事件”“风景区的军车”等 负面信息。无论是正面信息,还是负面信息,如果处理不及时,不加以引导,都会造成难以控制的影响。因此,面对以 量大(Volume)、增长快(Velocity)、多样性(Variety)和高 价值(Value)为特征的网络舆情数据,如何把握网络传播规 律,积极做好网络舆情引导,加强网络涉军舆情管控,大数 据无疑是当前值得高度关注的重要方法手段。
一、大数据为网络涉军舆情管控创造了新机遇 (一)大数据成为社会热度“仪表盘”,为监测预测网 络涉军舆情提供了可能 随着互联网的发展,大众往往选择在网络上发表各自 的看法。大数据可完整记录网络上的这种社会舆情和民意, 网民在网上产生的海量数据,记录着他们的思想、行为乃至 情感,这是信息时代现实社会与网络空间深度融合的产物, 蕴涵着丰富的内涵和很多规律性信息。一定程度上,网络舆 情大数据成了人类生存痕迹和心理变化的记录仪,成为不折 不扣的社会热度“仪表盘”。通过这一指示器,可清楚地记 录当下社会民众的所思所想。利用短信、微博、微信和搜索 引擎可以收集热点事件与挖掘舆情,通过分析相关数据可了 解大众需求、诉求和意见。对于单位时间段内舆情事件的烈 度不断升高的事件,可以通过大数据挖掘找出来,提前提供 预警提示,为监测预测涉军舆情提供了可能。例如,2009年 开始运行的“人大—方正舆情监测分析系统”,依据网络事 件烈度指标定量分析方法,能够将单位时间段内舆情事件的 烈度超过60分以上的热点事件全部找出来。(二)大数据成为社会深度“显微镜”,为洞察挖掘网 络涉军舆情提供了可能 美国麻省理工学院斯隆管理学院的经济学家埃里克· 布吕诺尔夫松(Erik Brynjolfsson)说,要想领会大数据的 潜在影响,你得看看显微镜。②发明于4个世纪之前的显微 镜,使得人们以前所未有的细胞级水平观看和测量事物。这 是测量的一次革命。布吕诺尔夫松教授解释说,数据的测量 正是显微镜的现代等价物。大数据可使对社会舆情的监测和 测量达到个体级水平,而不再是传统web1.0时代舆情监测的 整体性描述,大数据使得细节化、即时化地测量个体的行为 和情绪变成了可能,通过关联时间、空间和社会关系等诸要 素的数据打包分析,并通过一定的隐私保护,借助其“电子 痕迹”对个体进行社会行为刻画,通过巨量搜索数据见微知 著,在此基础上展现出个体的社会心理变化。
(三)大数据成为社会关系“沉淀池”,为关联分析网 络涉军舆情提供了可能 目前,从整体发展来看,社会科学的研究已发生转向, 由原来对“个体属性”的关注转向为对“社会关系”的关注。
大数据不仅仅记录网民的话语和内容,还记录网民之间的社 会互动和社会交往方式,乃至网络族群之间的界限和相互勾 连,可以说大数据是社会关系的“沉淀池”,改变了传统舆 情只见“内容”不见“关系”的境况。通过一定的数据分析 手段,不仅可描绘出网民的“社会话语表达”,且能够清晰地描绘出网民的“社会关系网络”和“心理文化地图”,从 而改变web1.0时代单向度的舆情监测。依托大数据的社会关 系分析,可以将其与情报源进行关联分析,以生产更高价值 的信息。
二、大数据视域下网络涉军舆情管控面临的挑战 (一)舆情管控内容由“单维”向“多维、异构、非结 构化”转变 大数据具有多样性,即数据类型包括结构化数据,也 包括非结构化数据。随着大数据时代的到来,传统舆情研究 只重视网民话语表达的单向度研究的视角必将改变,话语作 为一种外在的社会表达,属于浅表层面,不能够有效窥探出 网民群体的社会行为、社会心理和社会诉求。借助大数据, 舆情研究的视角将更加多元化,未来舆情研究的视角将转向 对社会话语表达、社会关系呈现、社会心理描绘、社会诉求 预测等多方面、多向度的研究,通过这样的研究转型,社会 舆情研究将真正成为一门与多学科交叉的社会科学。但非结 构化数据语音、视频、图片等,仍是网络涉军舆情管控的难 点。根据Cisco公司VNI报告(2012-2017),在2012年末视频 占全球消费者互联网流量57%,预计2017年此值为69%,如 果计入P2P,2017年此值为80%-90%。对非结构化数据的分 析需要有先进的语义技术和基于元数据的标签算法等,尽管 语音的机器翻译有了可喜进展,但视频图像的智能识别仍然 比较遥远。2012年斯坦福大学与谷歌合作建立深度学习网络,对来自YouTube的上千万视频帧自主学习,用10天学会了识 别猫的脸孔,然后从2万张未见过的照片中找猫,准确率只 达到15.8%。
(二)舆情管控手段由“统计”向“挖掘、关联、可视 化”转变 网络舆情是社会舆情在互联网空间的映射,是社会舆 情的一种直接表现形式。过去,舆情只存在于民众的思想观 念和日常街头巷尾的言语谈论中,对这些传统意义上的舆情 的获取、收集只能通过社会调查访问等方式进行,获取效率 低下,样本少且容易有失偏颇。正如人们常常指出的那样, 调查是一种社会学的绞肉机,它把个体从其所在的社会情境 中抽离出来,并确保研究对象之间不存在联系。可以说,传 统的抽样研究很容易只见树木不见森林,相应的社会舆情监 测也只注重网民“说什么”,不重视网民之间的“关系”, 这种舆情监测很可能只抓住比较浅层次的社会语义表达,不 能把握网民“为什么这样说”背后的社会心理和其所处的社 会关系网。随着大数据时代的到来,数据量变大,数据增长 快,数据价值密度变小,从大量信息中获取有价值的信息类 似沙里淘金,依靠传统的抽样研究方法已经无法处理,需要 采用数据挖掘(Data mining)、知识发现等新手段,从数据 库的大量数据中揭示出隐含的、前所未有的并具有潜在价值 的信息,而这些手段涉及人工智能、视觉智能、辅助图像分 析、集成人机推理技术、社会网络分析等多个领域的综合创新。
(三)舆情管控重点由“通报”向“预警、预测、可控 化”转变 传统的舆情管控主要是事后“通报”,而大数据的核 心特点就是能够“预见未来”,防患于未然。在网络社会中, 由于匿名性与互动性,人们表达意见更加快捷,信息传播具 有“碎片化”、互动性、病毒性、多渠道等特点,能够在较 短时间内及时迅速地传播,网民之间相互转发形成的再传播, 会引起很高的舆论关注,产生巨大的传播影响力。网民们更 倾向于“选择”那些与自己的既有立场、态度一致或接近的 内容,往往导致网络舆论从沉默期转入雪崩状态出现一边倒 现象。应对舆情的快速演变,舆情管控不能再局限于个案分 析和情况通报,而是要不断增强舆情信息的关联分析和预测, 需要从以往单纯收集有效数据向对舆情的深入研判拓展,从 注重“静态收集”向注重“动态跟踪”拓展,从致力“反映 问题”到致力“解决问题”拓展,还要辅之以决策参考,能 够做到研判快、预警快、决策快,化解舆情危机,构建和谐 舆情空间。
三、大数据时代提高我军网络涉军舆情管控能力的对 策 (一)树立大数据舆情思维,浓缩海量数据抵抗“数据 爆炸”,强化数据深挖实现“数据增值”,提升网络涉军舆 情管控领域的话语权一是树立大数据舆情思维。英国牛津大学教授维克托 认为,大数据带来的信息风暴正在改变我们的生活、工作和 思维。这颠覆了千百年来人类的思维惯例,对人类的认知和 与世界交流的方式提出了全新的挑战,如在大数据时代,我 们可以分析更多的数据,有时候甚至可以处理和某个特别现 象相关的所有数据,而不再依赖于随机采样;
研究数据如此 之多,以至于我们不再热衷于追求精确度;
我们不再热衷于 因果关系,也就是说只要知道“是什么”,而不需要知道“为 什么”。因此,决策行为将更多地基于数据、分析和事实做 出,“数据到决策”成为新态,而不是像过去更多凭借经验 和直觉做出。二是浓缩海量数据抵抗“数据爆炸”。“信息 爆炸”将人们变为机械的信息查询者。在过剩的信息海洋里, 阅读由享受变为负担。从舆情产品服务的角度看,浓缩海量 信息,同步提高数据抓取能力与舆情解读能力将是未来舆情 分析能力的关键,抵抗“数据爆炸”已成基本要求。为应对 信息过载问题,美国在1996年就启动了话题检测与跟踪 (Topic Detection and Tracking,TDT)系统研究,建立了 英语、汉语和阿拉伯语的大型语料库,能够成功实现发现新 话题、话题跟踪和话题关联分析,对网络舆情起到了事半功 倍的作用。美国国防部目标是利用大数据将分析人员从任意 语言文字资料中提取信息的能力提高100倍。美国中情局要 求利用大数据将分析搜集数据的时间由63天缩短为27分钟。
三是强化数据深挖实现“数据增值”。提高舆情产品质量的关键,在于对数据的加工能力,通过加工实现数据的“增值”。
这就要求分析人员提高对信息的鉴别力、萃取力、掌控力, 对数据进行生产、分析和解读。
(二)推动技术手段建设,加大人才培养力度,形成大 数据分析专业平台和力量,牢牢把握网络涉军舆情管控领域 的主导权 一是加强网络涉军舆情管控手段建设。坚持贯彻“军 民兼容、平战结合”的建设方针,研发军地双方互联的网络 涉军舆情管控的大数据舆情预警手段、大数据舆情传播监控 手段、大数据舆情传播效能评估手段和辅助决策手段等,并 通过手段推动军地双方涉军舆情管控机制。2012年3月29日, 美国奥巴马总统发布《大数据研发倡议》,联邦政府12个部 门18个单位提出了总计89个大数据研发项目清单。二是加大 专业人才队伍建设。由于网络涉军舆情管控专业技术性强, 因此需要着眼未来网络涉军舆情管控的需要,着重培养大数 据挖掘分析专业人才、大数据网络舆情传播效果评估分析专 业人才和大数据网络涉军舆情管控组织指挥专业人才等,做 好专业人才队伍储备。三是培养军方的“意见领袖”。在网 络涉军舆情传播中,“意见领袖”是整个传播路径中的核心 关键点,培养“意见领袖”是网络涉军舆情管控的重要方法。
代表正确舆论方向的“意见领袖”,能起到辨明事实真相, 提升网络涉军舆情管控效果的作用;
相反,代表负面舆论方 向的“意见领袖”能够引发网络舆论动荡,甚至起到引发网络涉军舆情负效应。网络涉军舆情管控部门应积极应对,注 重发现、引导和培养一批思想过硬、政治素质高、说理能力 强、有责任担当的“意见领袖”,约束或铲除负面舆论方向 的“意见领袖”,通过正面和负面的联合作战来掌控网络舆 论话语权。
(三)构建“法制主导型”的运行体系,完善网络涉军 舆情的大数据管理机制,提高网络涉军舆情领域的控制权 一是建立网络涉军舆情管控法制体系。适应网络涉军 舆情管控技术形态特点,要逐步实现网络涉军舆情管控运行 体系由过去的“行政主导型”向“法制主导型”转变,建立 健全网络涉军舆情管控的相关法律制度,包括舆论管制规定、 组织机构和工作职责规定等,以配套执法手段和监督、奖惩 措施为保障进行立法,理顺军地关系,使网络涉军舆情管控 各项工作真正做到有法可依、有章可循。二是建立健全大数 据关联机制消除“信息孤岛”。目前我军舆情管控信息化应 用水平参差不齐,军队内部相关部门、军队与地方政府不同 的部门、军队与媒体企业之间都存在“信息孤岛”,有多少 个部门就有多少个信息系统,每个系统都有自己的数据库、 应用软件和用户界面,完全是独立的体系,阻碍了数据的互 通互联。应充分整合军队、政府和企业的数据资产,搭建关 联领域的数据库、舆情基础数据库等,在舆情预警、研判、 应对、决策等环节,丰富和完善决策参考体系。