论文查重 | 论文文献库 | 使用数据采集器进行图书查重常遇问题探讨

使用数据采集器进行图书查重常遇问题探讨

来源:论文查重 时间:2019-08-13 15:34:21

【摘 要l本文介绍了数据采集器在图书现场采购中的使用,并通过对在使用数据采集器论文查重过程中遇到的 问题的分析讲述了几点体会.
便携式数据采集器,又称数据采集终端(Portable Data Terminal,PDT),是一种条码阅读器与掌上电脑的组合体, 是集激光扫描、汉字显示、数据采集、数据处理、数据通 讯等功能于一体的高科技产品。由于其存储容量大、准确 性高、反映直观、操作简便、方便携带被广泛应用于各行 各业的数据采集工作中。在现场采购已经成为图书采访工 作的重要方式的今天,利用数据采集器套用本馆的数据资 源进行图书的现场查重与筛选,已成为各图书馆一种常用 而有效的方法。我馆于2004年购置了2台型号为CASIO DT一 900的数据采集器,并根据我馆的实际工作要求厂方更新升 级了软件设置,以更好地实现扫描、查重等功能。经过多 次现场采选实践后,数据采集器以其快捷、高效的作用在 图书现场采选的查重作用凸显,但在使用过程中也遇到了 ~些问题,现将两年来的使用体会与图书馆界同行进行交 流和探讨。
1数据采集器在图书现采中的使用
1.1 采集前的准备工作
数据采集器一般是通过图书条码(ISBN号)来进行查 重的,在外出采集图书之前做好相应的准备工作,即把图 书馆馆藏的中央数据库、采访数据库的数据分别提取、合 并,并转换为文本文件,导入到数据采集器中成为基本数 据库。
1.2采集图书
现场选购图书时扫描准备选购图书的条码(ISBN),存有 基本数据库的采集器自动对扫入的ISBN号进行核对,显示 是否有相同记录。如果ISBN号相同,数据采集器将提示已 有馆藏及馆藏复本数,采访人员可根据馆藏复本数决定是 否再次购买;如果无相同记录,采访人员则可以在数据采 集器中输入订数、价钱,将待购图书的简单数据保存。
1.3现采数据的提取
现场采购图书后,通过通讯数据线将采集器与计算机 相连,然后进入数据采集器的系统菜单,将保存在上面的 数据下载在电脑上,并整理转换成EXCEL文件。如果两台 或者更多数据采集器同时采选,可将多份data.txt文件内 容合并,运行数据整理程序,自动除重。
1.4 形成预订购数据
将数据采集器中导出的简单数据(主要为3项:ISBN、 价格、订购数)与书店或者出版社提供的图书MARC数据 或EXCEL数据进行比对提取,形成包括书名、著者、ISBN、 价格、出版社、复本数等完整的订单。
2 使用数据采集器过程中出现的问题
2.1 由于只能进行简易查重,一号多书的丛书及书号未变 的新版次书查重工作无法进行,由此可能会造成部分图书 的漏订。
2.2近年来由于高校的不断扩招以及本科教学评估关于图 书册数的硬性要求,图书馆的采访任务也随之激增,图书 采访人员经常是到一地点现采后又到另一地点进行现采, 与此同时采访人员经常是不止一人,也就是说有2台及多 台数据采集器在同时工作,由于不可能实现在很短的时间 内将数据合并及将现采新书的MARC数据加工处理好并及 时导人图书馆系统,那么采访人员如果在本馆内的计算机 采访子系统中再进行图书的查重预订工作时,就很有可能 会由于采访数据库中现采图书MARC数据的缺乏,而出现 查重不准确,造成同一本书被重复购买的现象。
2.3 尽管数据采集器存储量大,但其不可能将馆藏所有数 据全部导入,只能是将最近几年的数据导人,尽管图书馆 现采的都是一些新书,但一些出版社时隔几年的重印书就 会漏检,这样就会造成图书的重复购买。
2.4 此外,在使用数据采集器查重过程中,我们也发现重 订图书(有两条订购数据或两条编目数据)数据导入过程 中由于系统不能自动合并因此只能导入前一条数据的复本 数,图书采访人员如果盲目依靠数据采集器进行图书复本 的增订往往是造成图书多次的重复订购。
3使用体会
笔者认为,尽管数据采集器在图书现采查重中发挥的 作用是不容置疑的,但对于图书采访人员来说在图书现采 过程中,不是手中握有数据采集器进行查重就万事大吉, 可以放心采购,一些时有发生的图书的漏查漏检现象更应 引起我们的重视。针对以上问题的出现,结合我们在工作 中采取的应对措施,谈几点体会:
3.1 针对一号多书的丛书,我们一般也会在数据采集器中录入,并在输入价格时,在价格的小数点后输入丛书的册 数加以标示,这样只要导出数据的价格中小数点后有数字 的,我们都会特别注意,并利用网络查找相关信息,如此 一来就不会造成系列图书的漏订。
3.2 二次查重后再提交订单。在时间允许的情况下,到出 版社及书市现采结束后,我们将数据采集器中的订购数据 导出交给图书代购商,由他们做好MARC数据后我们在馆 采访数据库中进行二次查重后再发单订购,这样在保证了 订购数据有序全面的基础上确保了资源不会重置,而且也 避免了到书后发现重书退书的麻烦。
二次查重对于采访人员来说比较繁琐,尤其是采购任 务较重的当口,但这些必备的工作会使订购书目数据更为有 序,并为以后数据准确的提取及各项工作的开展带来便利。
3.3此外,图书采访人员还应注意现采结束后书商配送订 购MARC数据的“真空时期”,此时如果在采访系统中订购 图书就可能会出现漏检从而重复订购。我们的做法是将数 据采集器中导出的数据与出版社提供的简易数据合并后, 通过文件转换生成简单MARC数据先导入采访库,尽管数 据比较简洁,但200字段@a(题名)、100字段@a(ISBN)、100 字段@df价格)、210字段@c(出版社)以及订购栏中订购数 等基本数据都有,这些数据能够满足订购查重、数据提取 的基本需求。
3.4数据采集器容错性能较差,对数据格式要求极其严格, 必须按照软件设计要求准确导人数据,否则会影响查重的 准确性,因此对使用人员的熟练程度要求较高。采访人员 应加强学习,数据导入导出各种文本的转换都应该熟悉和 掌握。此外,采访人员还应善于总结和摸索,在使用数据 采集器的过程中及时发现问题,通过与其软件开发商的沟 通解决使其不断满足我们的需求,以此促进数据采集器功 能的进一步完善和图书现采使用效果的进一步提高。
尽管便携式数据采集器在图书馆的应用中仍有不足, 但其在图书现采中的作用和优势是不容置疑的。随着科技 的进一步发展,软件的进一步升级开发,功能的进一步改 进与图书管理系统的进一步完善,便携式数据采集器在图 书馆的应用将会更加广泛、更加深入。

相关文章:利用稿件追踪防止一稿多投的探索