医药卫生【国内四大文献数据库医药卫生资源状况对比分析】

国内四大文献数据库医药卫生资源状况对比分析

国内四大文献数据库医药卫生资源状况对比分析 l.研究目的 尽管笔者从事医学文献检索、教学和医学科技査新工作数十年,使用 CBM、CNKI、万方、维普数据库也有许多年,知晓CBM是生物医学专业数据库, 其余3个是综合性数据库,CBM收录的生物医学方面的文献量为最多,4个数据 库提供的文献存在较多的重复,但是CBM数据库与CNH、万方、维普以及CNKI、 万方、维普三者之间在收录生物医学期刊数量、重复收录期刊数量方面及收录的 核心期刊数量和核心期刊重复收录数量等方面始终不清楚。对于读者提及上述方 面的问题及文献检索涉及到的数据库选择也无法回答淸楚,在医学科技査新中需 要对上述4个数据库的检索结果进行繁重的去重工作。本研究对4个数据库各库医 药卫生期刊收录数量、核心期刊收录数量及4个数据库之间重复收录状况进行统 计分析,为从事医学文献检索及教学、医学科技査新工作人员及数据库订购人员 提供丰富且详细信息以供参考。

2.研究方法 2.1对数据库医药卫生类期刊分类类目按“中图法”调整 为了得出4个数据库各库及各类所收录的医药卫生期刊总数,同类别 不同数据库期刊收录重复数,对CBM与CNKI、万方、维普以及CNKI、万方、维 普全文库之间的期刊收录重复数据的统计,是以各库分类的期刊为统计基础的。

由于4个数据库的期刊分类类目存在一定的差异,因此,以CBM数据库的“中国 图书馆分类法——医药卫生类”为蓝本,对数据库中医药卫生分类出人较大的类 目进行了适当调整,使其分类基本相近,便于统计分析,得出较可信的结果。

CBM数据库:“生物学”、“生物化学”、“分子生物学”类期刊、“实验 医学、医学实验”及“与医学相关”类期刊归人“基础医学类”。

CNKI数据库:“泌尿科学”并入“外科学”类;“消化医学”、“感染性疾病 及传染病”、“心血管系统疾病”、“呼吸系统疾病”、“消化系统疾病”、“内分泌腺 及全身疾病”均人“内科”;“眼科与耳鼻喉科”分为:“眼科”和“耳鼻喉科”;“军事医学 与卫生”并人“特种医学”;“急救医学”人“临床医学”,属于内科急救的期刊重复人 “内科”。“神经病学”和“精神病学”合并为“神经病与精神病学”;“生物医学工程”入 “基础医学”;“医学卫生方针政策与法律法规研究”和“医学教育与医学边缘学科”均入“医学与其它”;“医药卫生综合”入“综合类医学期刊”;“中药学”和“中西医结 合”均入“中国医学”。万方数据库:“五官科学”分为“耳鼻喉科”、“眼科”和“口腔 医学"类;“妇产科与儿科学”分为“妇产科”和“儿科学”类;“医疗保健”人“预防医学、 卫生学”类。维普数据库:“外国民族医学”入“综合类医学期刊”。“学报及综合类” 中的学报入“大学学报”,综合类入“综合类医学期刊”。

2.2归集各库收录的刊名变更的同一期刊 4个数据库中收录的期刊随着时间的推移,一些期刊的刊名在不断的 变更中,甚至有的刊名变更了数次,出现了同一种期刊有三、四种刊名。为了便 于统计,将不同刊名的同一期刊进行归集统计,即将不同刊名实属同一期刊的归 集为一种期刊进行统计。

2.3采用EXCEL表进行期刊数据的筛选 统计利用EXCEL表,为不同目的对基础数据做多次不同标记的标识,然 后进行数十次的筛选、统计并反复进行核对和修正,力求数据准确。对四库的统 计时间为2012年4月。整个研究过程达1个半月。

2.4采用2008版《中文核心期刊要目总览》——医药卫生类做核心期 刊的统计 根据2008版中文核心期刊要目总览》——医药卫生类的期刊目录,将 四库各库收录的核心期刊筛选统计,然后再进行CBM库与CNKI、万方、维普之 间的重复核心期刊及_、万方、维普之间的重复核心期刊数的统计和比较。

3.四大文献数据库医药卫生期刊资源比较 3.1各库各类期刊收录数及重复状况 3.1.1各库各类期刊收录比较 为了得出较细致的统计数据,笔者从四库各库的医药卫生各类收录的 期刊着手统计,获得各库各类收录期刊数及各库各类收录期刊重复数。根据表1 统计结果得知:在四库所收医药卫生各类期刊中,CBM数据库所收录的期刊在 综合类医学、大学学报、预防医学、卫生学、中国医学、基础医学、内科学、外 科学类数量为最多,维普数据库在临床医学类所收期刊的数量为最多,CNKI数据库在预防医学卫生学收录期刊数量为最少,万方数据库在综合类医学、中国医 学、基础医学、妇产科学、儿科学类所收期刊数量最少,CBM和维普数据库在 特种医学和药学类所收期刊数量较多,CNKI和万方数据库在特种医学和药学类 所收期刊数量要少很多。

3.1.2各库各类期刊收录重复比较 根据表2统计结果得知:CBM与维普数据库在综合类医学期刊、大学 学报、预防医学卫生学、中国医学、临床医学、内科学、外科学、神经病学与精 神病学、皮肤病学与性病学、眼科学、口腔医学、特种医学、药学类所收期刊重 复率均为最髙。CNKI与万方数据库在预防医学卫生学和皮肤病学与性病学类所 收期刊重复率最低。万方与维普数据库在综合类医学期刊重复率最低。CNKI、 万方、维普三库同时收录医药卫生各类期刊重复数量与CBM、_、万方、维普四 库同时收录医药卫生各类期刊重复数量差别很小,但数量均少于各类最低数。

M、CN1Q、万方3数据库所收核心期刊数差别不大,均在94%以上。

维普数据库收录核心期刊数略少一些,为88.8%。

3.3 各库期刊、核心期刊重复收录状况 3.3.1各库收录期刊重复比较 表4的统计数据为各库期刊重复收录数与百分比及核心期刊重复收录 数与百分比,四库收录期刊去重总数为255Sf^,CBM与CNK3收录期刊重复数为 1022种,CBM与万方收录期刊重复数为915种,CBM与维普收录的期刊重复数为 1468种,CNH、万方和维普三库之间的两两重复刊有800多种,CNKI、万方和维 普三库与CBM、CNKI、万方和维普四库同时收录期刊重复数差别不大,重复刊 有700多种。结果是:CBM与维普数据库所收期刊重复量最大,达到57.4%,其次是 CBM与CNKI所收期刊重复量达到40%。_、万方、维普三库间收录期刊重复率与 四库收录期刊重复率均在30%左右(见表4)。

3.3.2各库收录核心期刊重复比较 四库各库核心期刊收录重复情况分别为:CBM与万方、CBM与CNKI、 CNKI与万方重复数差别不大分别是239种、235种、233种,所占比例分别为:95.2%、93.6%、92.8%。CBM与维普、万方与维普、CNKI与维普重复数差别不大,分别 是222种、221种、217种,所占比例分别为:88.4%、88.0%^86.5%。CNKI、万 方、维普三库所收核心期刊重复与四库所收核心期刊重复情况几乎相同(见表4)。

4.四库特点比较 除了上述各库医药卫生期刊资源收录情况各有不同外,各库其它方面 的特点也存在一些差异。

4.1 检索途後比较 CBM数据库的检索界面简洁清楚,主题标引严谨,中医主题词采用 《中国中医药学主题词表》标引,西医主题词采用美国国立医学图书馆编制的 “MeSH”主题词表标弓I,主题词规范,主题检索功能强大,可以减少基本检索同义 词使用不全带来的文献漏检的损失,同时可以通过主题词上下位及同位的关系选 择主题词或进行族性检索。CBM主题检索途径是其最大的优点。万方、维普数 据库未设主题检索途径,CNKI设有主题检索字段,但不规范,检索功能不能与 CBM主题检索功能相提并论。

CBM数据库的主题标引和分类标引通过主题字段和分类字段反映文 献的中心内容,万方、CNKI和维普数据库仅有关键词字段反映文献的关键词, 不能反映文献的中心内容,相比之下该方面差很多。

CBM数据库检索史更加方便检索式之间的灵活组配。万方、CN1Q和 维普数据库没有该方面的功能,万方、维普甚至没有检索史。

CBM、维普分类检索途径采用的是“中图法”,我国许多髙校和科研单 位以及多数图书馆以《中图法》类分图书和文献已有相当长的时间。《中图法》 经过多次修订和完善,分类体系及类目设置更加合理,它的交替类目和复分表使 用更加方便、准确。CBM、维普分类途径因检索的查全率和查准率都较低,所 以较少使用。CNKI虽设置了分类检索途径但很粗略,使用不便。万方未设分类 检索途径。4个库的分类检索功能均需进一步完善。

万方、CNKI和维普数据库之间的检索途径相比,CNH和维普较好, 均有髙级检索,万方所设检索功能稍差一些,期刊论文检索提供的输入框较少, 检索不便。未设髙级检索,虽然设置了专业检索,但当检索式较长时检索会出错, 且一般检索者使用起来有一定难度。维普数据库髙级检索中的关键词字段提供同义词的检索,该功能是 CBM、万方和_数据库所没有的。维普的这一功能能够解决获取同义词的困难, 但是它所提供的同义词不是很全很准确,亦需进一步完善。

CNKI数据库的期刊导航提供核心期刊导航,为读者向核心期刊投稿 提供信息,除此之外还提供 CBM与CNKI都设有文献检索结果分析研究途径,该途径对于从亊文 献检索以及科技工作者对文献信息的分析研究提供了较大的便利,万方和维普未 设该功能。

4.2 文献收录方面比较 CBM数据库收录医药卫生期刊最多(2348种),维普次之(1706#),CNH 为第三(1165种),万方较少(948种)。CBM与维普期刊重复达到57.4%,CBM与 CNKI收录期刊重复达到40%,CBM与万方期刊重复35.8%,CNH、万方和维普三库 之间以及四库重复刊占30%左右。四库所收核心期刊数相差不大,CBM收录的最 多(243种),万方收录次之(241种),CNKI第三(236种)、维普为(223种),但四库所 收核心期刊重复量较大,在217~230种左右。CNH、万方、维普三库与四库所收 核心期刊重复数完全相同,为215种(详情见表4)。

虽然数据库之间收录期刊重复数量较大,但情况不尽相同,在CNKI 数据库中有些刊的收录在近几年停止了,但万方数据库却继续收录。维普数据库 回溯时间最长,这也是它的长处所在。

4.3 提供全文及更新时间方面比较 补充。目前只有将这4个数据库全査,重复文献只有通过查重去除, 尽管给査新工作带来非常麻烦和费时的烦恼,除此之外,未见有何好的方法和捷 径。科技査新工作不仅要检索中文数据库,还要检索博 在数据库建设方面,各数据库商以及数据库的建设工作者应开展联合 协作,加大对数据库的建设和调整力度,尽量减少重复,加快信息更新速度。或 将数据库合并,研究建设信息量更加丰富、检索功能更加强大、服务更加全面和 检索更加准确的数据库。或者数据库商提供一个具有一站式检索功能、可以去除 重复文献信息的平台,使读者和科技査新工作者获取信息更加方便和准确,以推动我国医药卫生科技体系创新和医药卫生改革,开创医学信息服务的新局面。

CBM是文摘型数据库,现虽然有全文推送,但是它毕竟不是全文数 据库,有一定数量的文献未附带全文。CNH、万方和维普是全文数据库,提供的 全文还是较CBM多。

5.研究总结 虽然目前CBM、CNH、万方和维普数据库之间期刊收录和核心期刊 收录重复严重,但四库中没有任何一个数据库可以被替代,因为没有哪两个数据 库期刊收录完全重复。

四库所收期刊总数为2556种,核心期刊总数为251种。截至目前没 有哪一个库是收全的,CBM收录的期刊、核心期刊最多,但期刊缺208种,核心 期刊缺16种。各数据库收录资源既相互重复又有各自的特点和优势,CBM是文 摘型数据库,收录资源的版权受限程度小,有独有的资源获取优势,期刊收录较 多较全面,时间较长,标引质量高,检索功能强,检索途径、检索方法要求严谨, 检索方便、准确,并可使用检索式进行随机组配,是目前查找国内医药卫生文献 最权威的检索工具。

对于一个仅要求获得一定医学文献的检索者,仅使用CBM数据库检 索即可。对于一个在査全和查准方面都有要求的医学文献检索者,除了检索CBM 数据库外,还需检索_、万方和维普数据库,因为CBM数据库更新时间较长,有 少数新发表的生物 在数据库建设方面,各数据库商以及数据库的建设工作者应开展联合 协作,加大对数据库的建设和调整力度,尽量减少重复,加快信息更新速度。或 将数据库合并,研究建设信息量更加丰富、检索功能更加强大、服务更加全面和 检索更加准确的数据库。或者数据库商提供一个具有一站式检索功能、可以去除 重复文献信息的平台,使读者和科技査新工作者获取信息更加方便和准确,以推 动我国医药卫生科技体系创新和医药卫生改革,开创医学信息服务的新局面。