数据质量如何描述 [数据质量描述教育资源论文]

数据质量描述教育资源论文

数据质量描述教育资源论文 1数据质量描述框架和数据质量元素的界定 数据质量描述是建立数据质量标准和数据评估体系首 先要解决的问题。姜作勤在《数据质量研究与实践的现状及 空间数据质量标准》一文中列出了国际上一些代表性的描述 框架。联邦政府对联邦机构向公众传播的数据质量描述框架 (OMBGuidelines,2003)为:实用性、客观性、安全性。

国际金融基金会统计部(CarolS.Carson,2000)提出从数 据的完整性、概念一致性、准确度、服务性及可访问性来描 述数据质量。MIT的研究(Wang,R.Y.andStrong,1996)将 数据质量描述分为4大类,包括本征质量描述,如可信度、 准确度、客观性、信誉;
与应用有关的质量描述,如增值、 关联、适时、完整、合适的数据量;
与表达方面有关的质量 描述,如可解释性、易懂性、一致性、简明性;
与可访问性 方面有关的质量描述,如可访问、安全性[5]。黄刚等人在 Alarcos研究团队以及麻省理工大学Richard.Y.Wang教授、 北京大学唐世渭教授等人的研究基础之上,针对大型企业数 据中心的数据质量问题,提出了一个通用的数据质量元模型 框架结构,认为数据质量元素包括完整性(Integrity)、 深度性(Depth)、及时性(Timeliness)、冗余性 (Consistency)、一致性(Consistency)、关联性(Relate)、 准确性(Accuracy)7大类,并在此基础之上构建了企业数 据质量评估体系[4]。2教育资源质量控制与描述框架的研究 为了实现对教育资源的质量控制,很多学者和机构开始 了对于教育资源质量框架和质量评估标准的探索。保罗•川 内受英联邦学习共同体亚洲教育媒体中心的委托,开展了开 放教育资源质量保证准则框架的专项研究,并在《开放教育 资源质量保证准则――TIPS框架》一文中,提交了一份开放 教育资源质量保证准则框架――TIPS框架。该框架涉及学习 的5个领域(认知领域、情感领域、元认知领域、环境领域、 管理领域),覆盖了所有已知的教育目标[6]。王承冰等人 针对我国目前开放教育资源项目过度重视发展规模而忽视 质量保证的问题,开始了对英国开放大学OpenLearn项目的 研究,以期为我国建立精品开放课程的内容质量保证体系提 供启发[7]。乐美儿在《虚拟平台下英语教学信息资源质量 标准体系》一文中讨论了虚拟平台下英语教学信息资源质量 标准体系的构建过程[8]。马玲玲等在《高校机构知识库元 数据质量控制问题研究》一文中提出通过引入OAI-PMH元数 据收割协议和DC元数据来保证元数据的规范性[9]。以上研 究对不同领域数据质量进行了科学的界定和描述,或从用户 使用的角度提出对于教育资源数据质量框架的设计,我们可 以从他们对于数据质量的定义、数据质量描述和数据质量元 素的界定中得到启示,结合我国教育资源建设实践,抽取适 合教育资源数据的质量元素,从教育资源原始数据层(即数 据源)到元数据层形成完整的质量描述框架。3教育资源数据质量元素的确定、定义及描述 3.1原始数据层质量元素、定义、描述 从中外开放教育资源的对比[3]以及国内高校教学资源 库的使用情况来看[10],我国教育资源的使用情况并不是很 理想,其中一个主要的原因是教育资源本身的质量问题。如 目前以精品课程为代表的开放课程资源在对课程的整体设 计、资源与课程内容的耦合度、课程视频录像的表现效果以 及大容量视频资源的可访问性都存在不同程度的问题,而通 过学院呈缴或是网上挖掘的方式也很难保证在目前优质资 源有限的条件下所获取数据源的可靠性。因而,在定义教育 资源的数据质量时,首先应该考虑教育资源数据源质量,即 原始数据层的质量,它是决定数据存在价值的根本。针对目 前我国教育资源建设和使用实际,笔者认为,原始数据层质 量包括数据对象本身所含的本征内容、表达方式、可获取的 技术性质等几个方面,它的数据质量元素可分为内容质量元 素、表达质量元素及技术质量元素(见表1)。

3.2元数据层质量元素、定义、描述 在数据加工时我们会面临很复杂的局面,通过学院呈缴 和网上挖掘所获得的教学资源学科覆盖面广、内容丰富、专 深复杂,资料类型众多,各类型资料特征各异,所提交的基 础信息或对象文件往往很不完整规范,还有由于制作方法和 文件格式多异而无法保证其在不同网络环境下的正常使用, 或是因为版权问题而导致使用上的障碍等。所以需要有规范优质的元数据以实现对资源的准确定位与描述,保证用户对 资源的准确识别与判断,保证用户对资源全面完整的检索, 保证资源正常开放的使用。同时实现对资源的组织与加工、 管理以及长久保存。可以说,元数据质量是决定资源可否实 现其“描述、解释、定位、检索、识别、管理以及保存数据 功能”[11]的关键。因此,我们认为,对于教育元数据质量 元素的界定,主要从可能影响到数据的查找、利用、管理以 及保存的元数据加工管理的规范性、元数据指导标准和编码 体系的权威通用性、元数据标准及数据结构的完整性、元数 据标引与描述的科学性、数据录入的准确性等方面来加以考 虑。我们还可以从国内外元数据质量控制理论[12-13]中寻 求对于各质量元素具体的描述维度及描述方式(见表2)。

4结语 本框架是在已有理论和对教育资源建设的质量反思之 上建立的,希望使用资源的师生能参与资源建设并加入到教 育资源质量标准化的思考中来,希望在他们使用和建设的双 重反馈中修正和完善本框架。我们也希望教育资源建设项目 的承建单位及其中的业务骨干能参与到教育资源数据质量 标准化建设的讨论中来,希望在更为广阔的实践中验证并完 善本框架,在与教育资源建设实践的同步跟进中发挥其基本 的质量保证价值。笔者也希望听取专家学者和学科专家们的 指导意见以使本框架更具权威性和说服力。最后,希望所有 关于数据质量控制和关于教育资源质量控制的讨论能得到行政主管部门和国家标准化组织的重视,通过对于用户、资 源建设者、项目负责人以及专家学者参与的调研会议和学术 讨论,逐步形成关于教育资源建设以及教育产品数据质量的 系列标准,形成完整的教育资源质量验收和量化评估的指导 方法,让大家在对标准的遵循中培植一种自上而下的质量文 化,使我们在一种质量意识的自觉中生产出优质高效的教育 信息化产品。