关于我们 收藏
  您当前所在的位置是:主页 > 文献导读 >
 
定期维护书目数据中格式问题的有效方法
更新时间:2017-09-03 12:58  作者:admin  浏览:
导读:关键词:CNMARC数据;数据检查:批处理 摘 要:本文总结了书目数据库中数据的来源及建立,详尽地介绍通过计算机排序方式批检查数据中的错误.以进一步提高书目数据的准确性和一致性。 中图分类号:G254.3 文献标识码:A 文章编号:1003-1588(2009)03-0104-03 书目数据库是图书馆自动化建设的基础和保障,也是文献检索网络化、信息资源共享的重要依据,同时还是图书馆为读者服务的重要途径。馆藏数据库的质量直接代表了图书馆的基础业务水平。书目数据的标准化、规范化

关键词:CNMARC数据;数据检查:批处理

摘 要:本文总结了书目数据库中数据的来源及建立,详尽地介绍通过计算机排序方式批检查数据中的错误.以进一步提高书目数据的准确性和一致性。

中图分类号:G254.3

文献标识码:A

文章编号:1003-1588(2009)03-0104-03

书目数据库是图书馆自动化建设的基础和保障,也是文献检索网络化、信息资源共享的重要依据,同时还是图书馆为读者服务的重要途径。馆藏数据库的质量直接代表了图书馆的基础业务水平。书目数据的标准化、规范化、准确化、一致化是数据库建设的核心问题,定期对数据库中的数据进行批处理检查维护可减少错误率,尤其是采用人工校对在前,批处理检查在后两者相互结合的方式,可以极大地降低书目数据中不必要的错误和不一致的著录问题。作为图书馆的编目部门,应建立起一套书目数据的维护机制,将批处理维护工作纳入日常工作之中。

以首都图书馆具体情况为例,本文所谈到的关于批处理维护的数据主要指经人工审校进入总书目库的数据,其中包括自建数据和套录数据。经过人工审校过的数据一般不存在著录方面的错误,如200字段题名责任者的选取著录、各类附注字段详细著录、名称标目的规范等,但是有不少不一致.不统一的地方,如自建数据与套录数据中丛书与附注著录的不一致,数据各字段相互对应点没有著录一致等问题。通过批处理检查的方式可以快速全面地找到错误点,比起人工翻查数据审校费时、费力是占有绝对优势的。

1 目前数据库中存在的主要问题

1.1丛书著录不一致

丛书著录一致性是最大的问题。首先,由于总书目库中的数据是由自建数据与套录数据共同组成的,审校人员也是分组的,所以就造成了对数据著录理解不一样、著录不一致的问题;其次由于套录数据主要是下载国家图书馆和几大联合编目中心数据.各家数据著录本身就有不一致的问题存在。另外,还有一些比较模糊、难以界定的系列书也是当前编目人员在著录225字段与300字段的疑难点。

1.2数据中对应点的问题

图书馆的编目工作是一项非常重注专业技术和认真负责的工作,一条CNMARC数据小至几百个字节,大至两千多个字节,十几项字段几十个子字段确实需要编目员具备踏实的态度和高度的责任心。从数据检查上来说,数据上的细节问题也是比较重要的,数据中的各字段中有许多与其它字段相互对应的地方,比如说210字段与102字段是相关字段:105字段与215字段、6字段都有相关的对应点,

1.3对于主题字段的检查

相对于数据中的格式检查来说,主题字段的情况比较复杂,但是通过批处理校对,对于主题标引、分类还是可以发现一些一致性的问题。将600、601、602、605 、600、607字段中的子字段$a$x$j$y$z分别抽取出来,并给予排序,可以校对出著录错误的字段,例如600字段错著为606字段等常规性问题.还可以将各字段的主题词与分类号分别给予排序,查找出不规范的用词和同类书著录不一致的问题。

2通过批处理检查数据库中错误的方法

我馆的批处理数据方法主要是对进入总书库的数据进行定期的检查,一般每批的数据在一万至两万种之间比较适宜。在检查时,针对某一方面的问题将字段中的相关子字段按文本文件(TXT文件)抽取出来.导入至EXCLE表格中进行计算机排序。通过排序这种方法,检查人员可以更直观地检查到出现的问题。

流程为:将要检查的子字段抽取至TXT文件



 

     您是第 位访客
    
当日借书数 0 还书数 0 办证数 0 进馆人次 0 查看当年数据
 Copyright © 2002-2017 DEDECMS. 织梦科技 版权所有