一. 引言
人们早就希望有一种共同的方法来发展检索界面,并建立处理转存书目数据 的标准方法。过去,人们曾经作过一些尝试,以协调、规范和实施共同的“标准” ,使得检索和转存更为方便。尽管许多这样的尝试未能成功,但是由欧共体 七个国家图书馆的人员组成的一个小组却一直在致力于开发只读光盘出版的共同 方法,包括一般的检索界面、试验性UNIMARC只读光盘(它综合了四个国家书目 的数据)的开发以及市场和销售问题的提出。
欧洲的国家图书馆以机读形式销售书目数据大约有20年的历史。在有些 国家中,销售的机制发展得更为完善一些;例如在英国和德国,联机形式的书目 数据已经经历了10多年;在法国,国家书目仅仅到去年才有通过Questel的联机 形式。发展部分在于该国的出版规模,以及对出版信息的需求。某些国家书目的 联机形式(以及磁带形式)倾向于作为印刷形式的补充,而不是取代。
到1987年,只读光盘已蜂拥进入英国和其它地方的图书馆,只读光盘出版的 数量也有了明显增长的迹象。为了对这一变化的环境作出反应,英国国家图书馆 和法国国家图书馆共同合作出版了一种试验性的只读光盘,它于1988年出版并通 过评审。与此同时,德意志图书馆也出版了一种包括其国家书目数据的试验性只 读光盘。而后,这三个国家图书馆继续用同样的软件平台出版国家书目的只读光 盘,它们的许多特点都是相同的。
为了提倡这种合作精神,鼓励进一步的标准化措施,另外四个国家也参与共 同执行一个新的项目,以寻求在只读光盘上出版国家书目的共同方法,并相对不 依赖于任何一种软件平台。这一项目的部分资金来自于欧共体委员会的IMPACT计 划。
二. 主要目标
项目的主要目标在于:
①使更多的用户能更好、更方便地使用欧洲国家书目;
②通过改进欧洲(和非欧洲)国家图书馆之间书目记录的交换(不考虑MARC格式 的不同),提高图书馆编目的经济效率;
③发展导致只读光盘书目数据之战略、应用和格式的共同方法。
前面两个目标范围很广,很大胆;本项目的时间框架只允许我们建立未来可 以借鉴衡量我们达到目标的成功程度的机制。我们的重点是第三个目标——共同 方法的发展。我们相信它是可以达到的,并能促使另两个目标的实现。
三. 项目的范围
直接参与这一项目的图书馆为:
英国国家图书馆(British Library)
德国德意志图书馆(Deutsche Bibliothek)
丹麦皇家图书馆(Royal Library)
葡萄牙国家图书馆(Biblioteca Nacional)
法国国家图书馆(Biblioth鑡ue Nationale)
荷兰皇家图书馆(Royal Library)
意大利佛罗伦萨国立中央图书馆(Biblioteca Nazionale Centrale di Firenze)
这一项目的第一步就是确定九个子项目,以处理发展导致只读光盘书目数据 之战略、应用和格式的共同方法。每个子项目都有助于这一目标的解决,而且子 项目之间还有着互相的联系。每个国家图书馆负责其中一个或多个子项目。
下面,我们将简单讨论每一个子项目,然后回过头来详细介绍其中的两个子 项目。
①检索界面
本项目最重要的结果之一,就是开发用于只读光盘国家书目数据界面的基础广 泛的规范。它的草案正在试验只读光盘项目(参见下文)中接受测试。这一规范 将检索分裂成一系列功能组,其中含有一些子功能,并说明该特定功能为什么是 强制性的。
②MARC转换
书目数据交换的障碍之一就是欧洲各国所使用的MARC格式的不同。本项目试 图开发微基础的转换软件,使得转存下的书目数据能在不同的MARC格式之间互相 转换。本项目考虑使用一些公共流通软件,例如英属哥伦比亚大学( Univeristy of British Columbia)开发的“CCF转换器”。最初的结果很令人 振奋,然而接下来的工作却表明,尽管该软件是CCF与UNIMARC之间转换的一个很好 的模型,但是它很难改造成MARC与MARC之间的转换程序。结果,我们如今采用了 某种原型转换软件,它将利用CCF转换器的某些成分,并以它们为基础;这一项 目将导致一个原型转换器,它能直接体现新的转换表。
③字符集
本项目的目的在于定义一个欧洲字符集,它符合欧洲主要语言的数据表示要 求,并使之适合于微机技术的发展。最初的工作包括对欧洲各国家馆现状的调查 和对最佳标准的考虑。然而,随着项目的继续,我们有必要考虑到新的发展,特 别是UNICODE的发展和ISO 10646的即将出版。有些专家顾问负责帮助我们从事这 项工作,人们所考虑的一些关键问题为:
● ISO 10646和UNICODE的现状;
● 采纳这些新的超级标准对储存要求的影响;
● 解决近似和(或)音译问题的必要性;
● 评价不同类型用户之输出和输入要求的必要性;
● 在过程中适应国家特点的重要性;
● 明确离开现有实践之偏离轨迹的需要。
顾问们的最后报告明确建议,国家图书馆必须向ISO 10646或UNICODE靠近, 以此作为书目信息交换的标准字符集。建议还包括如何走向这些新标准和如何开 发一系列原型模块的方法。这几个国家图书馆正在考虑如何对这些建议作出反应; 因为这些建议尽管不在目前的项目范围内,但却可能作为新项目的基础。
④多文种界面
本项目试图以一些用于只读光盘应用的检索界面中的某些基本术语为基础进行 标准化。一个英语和法语的共同术语表已经形成,所有参加项目的图书馆和其它 图书馆提供了翻译版本。本项目现已完成,并推出一系列文种的共同术语, 它们包括英语、法语、德语、丹麦语、荷兰语、意大利语、葡萄牙语、瑞典语、 芬兰语和西班牙语。本项目还完成了一个报告,讨论了在微机上处理多文种的技 术要求。
⑤与联机系统的连接
只读光盘并非是一种提供最新信息的工具,这是由其性质决定的。一般而言, 只读光盘的国家书目每年更新四次,而联机系统的更新则更频繁一些。本项目考 察了将只读光盘与联机系统尽可能直接地连接起来的方法,以使通过联机可以获 得的最新信息能作为只读光盘中信息之补充。本项目的主要结果之一是如今已完 成的原型软件。它从《只读光盘版英国国家书目》(BNB on CD-ROM)中检索出 信息,将其传送至英国国家图书馆的联机系统BLAISE-LINE,并且从《法国国家 书目》中检索出信息,将其传送至法语主机系统Questel。在这一过程中,检索 句法通过算法转换,使得检索能根据适当的联机文件自动进行。
⑥与局部图书馆系统的连接
只读光盘国家书目的主要应用之一是编目。本项目所进行的一系列详细的案 例研究讨论了某些图书馆将国家书目只读光盘应用于编目的方法,以及转存的记 录与局部图书馆系统接口的方式。
作为案例研究的基础,有一项主要的、范围广泛的调查考察了英、法、德三国 图书馆进行编目的方式以及只读光盘在这一过程中所起作用的程度。
⑦菜单系统/兼容性
当这一项目正在开发时,不同的只读光盘出版物之间的不兼容性是一个主要 的难点,并且导致许多问题。本项目试图明确这样一些问题,并且以菜单是软件 的形式提供解答。最终,许多原先存在的问题不复存在。有一项研究详细考察了 只读光盘的应用,并推荐了一种能保证只读光盘正常可兼容运行的要求最少的配 制。还有一些建议的目的是帮助人们选择商用菜单软件。本项目一部分是技术性 的,它与只读光盘的“背景”运行环境密切相关。与此同时,只读光盘的联网快 速到来,并可能会导致更深一步的和可能更棘手的问题。然而,这不在本项目的 考虑范围内。
⑧试验只读光盘
本项目的主要结果之一就是一张试验光盘。本试验盘用于测试本项目其它部 分所作的一些工作,特别是上述的检索界面。它包括荷、葡、丹、意等四国的国 家书目的一个子集。它由丹麦的一个局制作,并将经受一些严格的评估。项目的 第二阶段所考虑的是只读光盘特许软件(用于内部生产),并将评估其有效性和 国家书目子集只读光盘之生产的方便性。项目的最终结果是一系列书目只读光盘 生产的详细准则,并将其出版成书。
⑨记录交换的框架
本项目考虑了欧共体内书目数据交换的框架,它考虑了其法律内涵和单一市 场的可能影响。人们已经提出了一系列的建议,它们将会在有关的国家图书馆中 继续接受人们的讨论。
以上是九个子项目的一个简介,下面我将详细讨论其中的两个子项目——检 索界面和UNIMARC试验盘的开发。
四. 检索界面
①用户试用
作为确定检索界面的第一步,项目作了一系列用户试用的工作。人 们作了一个详细的调查,以分析四个特定的用户组的检索策略。这些用户组包括 参考图书馆员、采访图书馆员、编目图书馆员和图书馆用户(非图书馆工作人员) 。
参加该调查的有来自四个机构的每一类用户各三名,它们是丹麦皇家图书馆、 法国国家图书馆、英国国家图书馆和荷兰皇家图书馆。
用户被要求检索三种书目光盘,亦即《英国国家书目》(British National Bibliography)、《德国国家书目》(Deutsche Bibliographie)、 《法国国家书目》(Bibliographie de la France)。 每个用户要回答检索上述三个书目中的九个问题(每种书目各三个问题)。
为调查所设计的检索数量有432个,四个机构中的每个机构的12个用户都有9 个问题。每一个用户的每一个检索问题都以用户所熟悉的方式提出。例如,向参 考图书馆员和终端用户所提出的问题之范围比另两组图书馆用户要广。对于参考 图书馆员和终端用户而言,某次检索的成功与否取决于一组书目记录的检索。试 验中每个参与者的检索程序被记录下来,并附有关于检索策略的评价和对检索软 件的反应。
结果表明,检索只读光盘数据库的方法千差万别,但在不同类型的用户之间 也有着明显的共同性。以下是调查的总结:
◆参考图书馆较多检索著者或其它如题名关键词等重要的检索词,然后对检索语 句进行组合。
◆采访图书馆和编目图书馆员较偏好使用国际标准书号(ISBN)检索;如果没有 ISBN,那么他们则偏好重要的题名关键词。有些人熟悉其它系统上的缩略词检索 法,他们也会在只读光盘上用这一方法。
◆终端用户所采用的检索过程与职业图书馆员不同(他们所要回答的问题与参考 图书馆员组一样);他们一般用“快脏”检索法找出许多条目,然后逐个浏览, 找到相关的题名。
试验的主要结论是,不同用户组的检索策略不同;这些不同之处还在于用户 对于MARC的知识而有所不同。这些方法上的不同在很大程度上反映了用户组的不 同需要。特别是如下需要:
◆参考图书馆员经常需要用不完全的或不正确的信息来检索;
◆采访图书馆员需要尽快获得关于某一项目的足够信息,以便能订购——通常这是用 简单检索策略来办到的;
◆编目图书馆员主要用只读光盘来检索已知项目,用于编目参考或复本编目;这 组人经常需要以MARC格式转存记录(个别的或大量的),以便能再作编辑(如附 加馆藏信息等);
◆熟悉联机系统的终端用户的需求与参考馆员类似。然而,非经常的用户一般更 需要屏幕上的帮助信息,特别是在每一菜单上可以得到的与之有关的帮助信息。
人们一般都表明需要有更好的帮助功能。不同类型的用户在完成检索时都作 了许多特定的评估,它们中有很大一部分在以后起草检索规范的过程中被考虑了 进去。
②界面的规范
规范被分成三个主要方面——检索手段、检索功能和显示-输出格式,它们 主要包括:
基本检索手段
◆软件应当使用户能不用索引而直接进行数据检索,也能通过浏览和选择索引词 而进行检索。
◆检索中不考虑标点符号和发音符号,也不考虑大小写。
◆应当有一些索引,其中个别字段的内容被分别索引;还应当有一个缺省(基本) 索引,组合若干字段的索引词。
◆应有AND,OR,NOT等布尔运算符,以组合索引词和前面已建立的文件集。
◆索引浏览途径应能识别缺省(基本)索引和字段专用索引中的完整的或截断的 词。应当能对于任何特定的检索词确定精确的或近似的匹配。
◆应当能在一个检索词末尾截断或在一个检索词中间分离字符。
◆检索手段应包括诸如日期限制等数字范围的运算符。
◆应能用方向键、鼠标或其它指针设备从多命中的显示中选择项目。
◆应能回顾检索历史,重新运行先前的检索,而不用重敲键盘或将其复制到当前 的检索行。
◆软件应能够将各种索引规则应用于不同类型的MARC数据。
◆应能选择用户界面语言。
◆应能上下滚行以及前后翻页。
◆应能在任何一级中放弃上一命令并且能在执行时中断某一操作。
基本检索功能
检索功能被分成一些逻辑上相关的组,亦即“功能组”:
◆寻找(Find)- 在反向索引文件中检索选择的项目
◆浏览(Scan)- 浏览反向索引文件
◆排序(Sort)- 将检索出的文件集进行排序
◆显示(Display)- 将文件集的内容显示于屏幕
◆打印(Print)- 将文件集的内容打印出来
◆转存(Download)- 将文件集的内容拷贝至局部储存媒介以供进一步的处理
◆储存(Save)- 将检索策略或结果进行储存以供再次使用
◆回顾(Review)- 使用已储存的检索策略或结果
◆清除(Clear)- 删除储存项目
这些功能组中还有一系列功能。例如,“寻找”功能组包括“寻找单一索引 词”、“寻找多个索引词”、“寻找索引条目或与不完全索引词相匹配的条目”、 “寻找数值范围”和“限制检索”。而后,这些功能都被分成强制性的和非强制 性的两种;还有一些非强制性的特点以及功能运行及其结果的提示。
检索规范还包括了功能键分配的一些提示,以及关于帮助级别的一些建议, 这些帮助级别既包括系统所有主要功能的综合帮助索引,也包括在检索中特 定点上可以产生的与当前菜单相关的帮助。
显示和输出的格式
人们还提出了显示和输出的格式问题。当我们特别考察国家书目时,应予以 支持的显示格式为:
◆完全的MARC格式显示
◆国际标准书目著录格式显示
◆标签格式(所有的字段都有标识)
◆用户自定义格式
由于设计界面的重要性和图形用户界面的日益重要性,本项目没有作这一方 面的建议。
检索规范在形式上仍然是一个草稿,其建议大部分在下述的试验只读光盘的 开发中得到了采纳。继只读光盘评估以后,本草拟的检索规范可以根据用户的评 价和我们自己的经验作修改。
五. UNIMARC试验盘
在试验盘项目中,我们承接开发一种只读光盘的任务,其数据来自四种国家书目, 目的在于使它们能分别检索,或作为一个单一的数据库来检索。这里所说的国家 书目为荷兰、丹麦、意大利、葡萄牙的国家书目。
这些国家书目的一个子集被写于磁带上,并被传至丹麦的软件局。数据有三 种不同的格式,亦即丹麦的danMARC,荷兰的PICAMARC以及意大利和葡萄牙的 UNIMARC。UNIMARC作为“共同的”格式,使得所有数据都能向其转化,以方便只读 光盘书目记录的合并。
接下来我们所要做的是开发荷兰和丹麦格式至UNIMARC之间的转换表,协调 意大利和葡萄牙用的两种版本的UNIMARC。由于丹麦和荷兰的格式都没有完全成 文而且没有现成的转换表,我们在这方面要化不少的时间和精力。
本项目的副产品之一是可以用于(并已经用于)其它应用中的转换表。
合并数据的一个进一步的先决条件是协调各种国家书目中使用的不同的字符 集。字符转换应分别针对每一个数据库作定义。由于个人计算机上显示用的字符 集应限于国际代码页850的256个字符,许多原数据库中的字符不得不改变或者取 消。对于这四种国家书目中的每一种书目,人们都开发了独立的转换程序:
◆danMARC记录用ISO 2709磁带来传送,并且采用了ISO 646的8位字符集。 其余的128个值作为特殊字符的局部码。带重音的字符和希腊字母用双字节来编码。
◆PICA记录用PICA+格式的磁带(非ISO 2709格式)来传送,并且采用与丹麦类似 的8位码。不过两者也有不同之处,特别是200-255区的字符。带重音的字符也用 双字节来表示,但与danMARC不完全相同。
◆意大利的UNIMARC记录用ISO 2709格式磁带来传送,并用ISO 2022来转换7位基本 ISO 646字符集、ISO 5426(扩展的拉丁)字符集和ISO 6937第2部分(主要是拉 丁字符)。带重音的字符用双字节来表示。
◆葡萄牙的UNIMARC记录用ISO 2709磁带来传送,并用7位基本ISO 646字符集和 双字节来表示带重音的字符。
转换的重要部分所化的时间比先前设想的要长一些,并于去年年底才接近完成。接 下来是数据库的建立和向Quantum Leap软件所要求的内部格式的转换。一系列一 次可写盘被生产出来,以保证转换令人满意并且没有软件故障。经过认真的测试和 与只读光盘局的对话,盘片被压制成型,送至测试场所。
著者:罗伯特·史密斯(英国国家图书馆国家书目服务部主任助理)
《国际图书馆协会联合会第58、59届大会论文选译》,书目文献出版社,1996年,第223-229页