全国图书馆联合编目中心2008年工作会议 / 2008 Annual Meeting of the Online Library Cataloging Center

 

出版界or图书馆界:跨业书目协作与共享

 

  全国图书馆联合编目中心2008年工作会议不久前在安徽合肥召开,会议的焦点是出版界与图书馆界的书目协作与共享。虽然,跨业书目协作与共享是一个老话题,但是其在国内一直是空白。在图书馆业内,全国联合编目中心、CALIS、上海图书馆等大大小小的编目中心合作的时候少,竞争的时候多。而在业外,出版社不加工MARC数据,馆配商向图书馆提供的MARC数据,大多是毛坯数据,用于采访尚可,离图书馆的编目数据还有不小的差距。

  很多图书馆采访人员认为,跨业书目协作与共享的理想模式是,由一家馆配商,第一时间从出版社那里获取全部的新书信息,加工成MARC数据,提供给一家编目中心,制作成编目数据,然后各成员馆共享。但这种模式显然在中国是行不通的,至少目前时机还未成熟。人天公司曾经想打造中国可供书目数据库,最后不了了之,中版通公司的“中国书业公共数据交换中心项目”也正在探索和尝试,无论成功与否,跨业书目协作与共享之路不会中断,并将最终迎来柳暗花明又一村的那一天。

联合编目中心的探索与实践

  全国图书馆联合编目中心与CALIS是国内最大的两家数据编目机构,分别代表了公共图书馆系统和高校图书馆系统。截止到2008年6月底,联合编目中心数据用户1105家,成员馆674家。从2007年以来,联合编目中心的工作突飞猛进,取得了比较大的成绩。

  首先是降价,书目数据服务公益性是大势所趋,在这种大背景下,CALIS和联合编目中心先后降价。2007年4月,全国图书馆联合编目中心全面下调了中文普通图书书目数据价格,由原先的0.3元/条降至0.15元/条,用以支持全国各级图书馆的数据建设,有效拓展了数据用户,数据下载量也逐渐增长,2008年3月以来,平均每月网上下载量超过了21万条,数据价格下调的效应开始显现。

  随着国家图书馆改变对少年儿童出版物的收藏政策,全国图书馆联合编目中心调整了书目数据的接收范围,开始接收成员馆关于少年儿童出版物的书目数据。截至目前,少年儿童图书馆中心已汇集了56万余条数据,完成了7000余条连环画、低幼画册数据的人工修改剔重和批上载。为尽快推进少儿文献数据的共建共享,联合编目中心于2007年11月在全国少年儿童图书馆系统建立了分中心,依托少儿分中心拓展数据用户,在半年时间里,共发展了7家成员馆,16家集团用户。

  对于编目中心而言,书目数据共建共享是最基础的工作。近年来,除了书目数据的共建共享之外,CALIS还在文献资源的共建共享上做了很多工作,像爱思唯尔数据库涨价事件,CALIS就曾积极与之斡旋。或许是因为分级财政的原因,全国图书馆联合编目中心不大可能像CALIS那样对于购买数据库的成员馆进行补贴,但是在文献资源的共建共享上还是大有可为。毕竟国家图书馆拥有中国最多的传统文献资源,而各成员馆也都拥有独具特色的地方文献资源。正因为此,国家图书馆副馆长陈力在中心2008年工作会议上表示,联合编目中心下一步的工作重点将转向文献资源的共建共享。

  下一步联合编目中心还将推进联合编目数据的标准化和国际化。联合编目中心主任顾犇说,从世界范围来看,编目规则的统一是大势所趋。无论是《国际标准书目著录》(ISBD)统一版的发布,还是《国际编目原则声明》的全球评估,都在向我们传递同一个信息:统一才是硬道理。因而联合编目数据制作的规范就显得尤为重要且必要。只有统一编目工作的各项标准,并积极与国际接轨,才能推动联合编目工作向纵深发展,为中文数据走向世界作好充分的准备。

  联合编目中心已经与OCLC开展了合作,即将上传170余万条中文文献书目数据,但相对于上海图书馆和深圳图书馆而言,合作的广度和深度都还不够。

  一直以来,图书馆都希望CIP数据的电子文本能够按照MARC格式转出,这样所有的编目机构就会节约数据制作成本,而且从源头上保持基本记录的一致性。但CIP数据的缺陷是信息不准,包括书名不准确,定价不准,申请了CIP号不等于该出版物一定出版。伴随着出版界二维码的推行,这种局面将得到改善。全国图书馆联合编目中心也积极参与《出版物物流二维码》标准的制定工作,提出了很好的建议。

  在全国图书馆联合编目中心2008年工作会议上,各成员馆都希望联合编目中心加强书目数据质量的控制和建立书目数据上传的激励机制。

  目前,对于各成员馆而言,下载数据进行套录者众,而上传原创数据者少,主要由全国联合编目中心和各省级分中心承担大部分数据的制作上传工作,特别是全国联合编目中心已不堪重负,迫切希望各成员馆能够分担原编数据的生产、校对工作,而不是套录。

协作与共享进行时

  全球最大的图书馆美国国会图书馆(LC)的书目控制未来工作组2007年11月30日发布了《书目控制未来报告》,指出:“书目控制未来将是合作的、去中心化的、国际范围的、基于Web的。它的实现将出现在与私营机构的合作,与图书馆用户的积极协作中。数据将从不同来源获取,变化将迅速出现,书目控制将是动态的而非静态的。”

  文中处处表明,在书目控制领域,曾经制定并维护了众多标准、提供了大量高质量书目与规范记录的LC,已不想再做老大,而只想做一个普普通通的联合编目成员馆。作为联合编目中心成员馆中的老大,国家图书馆对此深有同感。

  其实在美国,关于书目未来的争论还有一个重要的背景,就是编目专业人员的青黄不接。报告表明,近30年来,由于套录成为普遍现象,人们一直觉得对编目专业人员的需求会下降。而现在则面临编目员的大量退休,有素质的教学人员也变得稀缺。

  在国内同样如此。一个熟练编目人员的工作量是每天套录数据40条,原编20条。由于编目人员有限,大量的工作都要求加班完成。现在国家规定,加班必须付给双倍以上的工资,图书馆是全额财政拨款,几乎没有加班经费,因此,绝大多数编目人员都不愿意加班,数据生产速度非常缓慢。全国图书馆联合编目中心支付上传编目数据的成本是3元,而以国家图书馆为例,制作一条数据的各项成本将近20元,相比而言,套录数据会比原编数据节省很多经费。因此,国家图书馆也期望其他成员馆加大原编数据的上传力度。但抛开技术能力不谈,仅从成本来考虑,中小成员馆明显缺乏生产和上传原编数据的动力。因此,想在图书馆业内解决这一问题基本是不可能的,编目工作必须前移,回到出版商、馆配商、数据提供商那里,跨业书目协作与共享比过去任何时候都显得更加迫切。

  《书目控制未来报告》认为,具有高效平衡上游出版商及数据商的能力对于图书馆来讲是非常关键的。图书馆界面临的最重要问题之一就是:为包含印刷品和数字资源在内的馆藏,找出更加有效和快捷的方式来实现编目和元数据的制作。

  报告认为,图书馆的元数据环境太复杂,检索协议环境也很复杂,建议开发一个更灵活可扩展的元数据载体,兼容Web技术与标准,不限于图书馆数据工作实践,这似乎吹响了抛弃MARC的号角。

  OCLC的副总裁Lorcan Dempsey是LC书目控制未来工作组成员,在工作组的报告草案发布不久,他立刻在网站上发起了一个名为“新一代编目”的试验计划,抓取来自出版商的ONIX数据并对质量加以强化,以及早加入全球最大的书目数据库——OCLC在线编目联合目录WorldCat。显然,OCLC将由用户贡献数据的分销商转而成为原始数据提供商。

  国内方面,出版元数据相关标准取得了重大进展,为图书馆界与出版界的书目协作提供了更加便利的条件。《出版物物流二维码》标准将于年底实施。据中国出版集团中版通(北京)数据信息技术有限公司总经理杨文胜介绍,《中文图书标识数据》正在人民文学、商务、科学和高教4家出版社进行应用。

  我国于1994年开始将一维条码用于出版物出版。与一维条码相比,图书二维码信息容量会更大,由于可携带出版物的基础描述性信息,因此可以完全不依赖数据库而单独使用。图书二维码的应用,可规范图书产品基本信息的描述内容,达到图书属性信息与实物的同步。国家图书馆中文图书采编部副主任王洋说,如果出版物元数据能够规范图书出版的信息,确保图书标识性数据能够得以实现,则图书出版信息将与图书同时面世,如果借助二维码将其物化在图书上,在图书流通过程中,只需要一个解码器即可通过二维码获取图书的信息,不再需要重复做图书目录,图书馆作为终端用户,也只需要添加图书馆有特殊要求的内容即可,著录性工作可以节省,大大节约了社会成本。

谁将是中国的OCLC

  早在2006年11月12日,OCLC的WorldCat就启用了9位数的记录号,意味着它的第1亿条记录的诞生。OCLC创建于1967年,成立之初,其名称为“俄亥俄高校图书馆中心(Ohio College Library Center)协作网”。1971年,引进今天被世界各地图书馆广泛使用的在线图书馆编目共享系统,使得图书馆编目成本大大降低。1977年,它扩展成为全美图书馆合作网络。1981年,它发展成为全球最大的国际图书馆合作组织。OCLC伴随着书目数据新格式MARC的诞生而诞生,随着MARC的发展而发展。目前,OCLC已拥有112个国家和地区的超过6万所会员图书馆和超过10亿条馆藏数据,全年营收可达2亿多美元。

  OCLC的NetLibrary还是世界上最大的电子书供应机构,先后由775家出版社提供17万种西文电子书,包括电子听书6000多种,每月增加2500种新书。

  OCLC的馆藏分析服务可以为图书馆调整采访方针提供重要的依据,OCLC还于2007年7月推出一项名为Publisher Collection Analysis(出版商收集分析)的新服务,此服务针对与图书馆有业务往来的出版商。“出版商收集分析”使出版商通过WorldCat获取采购该出版商出版物的图书馆的馆藏信息,图书馆也能通过First search获取出版商的出版信息,以作为图书馆年度采购的参考。

  OCLC一直是国内编目机构学习的榜样和目标。OCLC的发展也是由小到大、由弱到强,而且没有政府一分钱的投入,与之相比,国内编目机构的起点无疑高了很多,但相对于OCLC,国内编目机构的发展是非常缓慢的,主要原因也许在于国内编目机构几乎都是国家投资,都是挂靠单位,非独立运作,定位于公益性服务,缺少创新的动力和资金。

  还是以全国联合编目中心和CALIS这两家国内最大的编目中心为例。全国联合编目中心设在国图,CALIS管理中心设在北京大学。在全国联合编目中心各成员馆中,国图一家独大,国图对联合编目中心的影响是不容置疑的。CALIS有四个全国中心,文理中心在北大图书馆;工程中心在清华大学图书馆;医学中心在北京大学医学部图书馆;农学中心在中国农业大学图书馆。在机构设置上,CALIS似乎更加合理。

  在功能定位上,全国联合编目中心曾经在企业和公益性服务上“几进几出”,最后还是确定为公益性服务。CALIS是经国务院批准建立的我国高等教育“211工程”、“九五”、“十五”总体规划的三个公共服务体系之一,其定位只能够是公益性服务。

  全国联合编目中心的工作还处在第一阶段,即书目数据的共建共享。CALIS虽然很早就开始了数据库的共建共享、联合采购,但成绩并不理想,缺少足够的话语权和凝聚力。在“爱思唯尔事件”中,CALIS与爱思唯尔谈判未果,其成员馆中很多都绕开CALIS直接与爱思唯尔达成了协议。

  两家编目机构在内容建设上可圈可点,但是服务却乏善可陈,边建设边服务做得不够。当然他们都意识到了这个问题。CALIS管理中心副主任陈凌就曾经说过,CALIS下一步要加强门户网站的建设,使成员馆能够更加便利地使用和享受CALIS的所有服务。

  全国联合编目中心与CALIS之间的明争暗斗更是让亲者痛仇者快,常常让下面的成员馆无所适从,已成为图书馆界最让人头疼的问题之一。

  总之,最大的障碍还是体制,在这种情况下,预言谁将是中国的OCLC真的是为时过早。当然,图书馆界之外不存在这些问题,比如中版通,但是绝大多数图书馆都不相信中版通有这样的实力。

中版通的理想

  中版通公司是中国出版集团专门为完成中国可供书目数据库建设任务而成立的,据中版通公司总经理杨文胜介绍,中版通的成立还有一段小插曲:某年,中国出版集团首任总裁杨牧之去国外考察时,亲身感受到图书编目蔚为可观的产业规模,遂决定重新扛起中国可供书目数据库的大旗,欲使中国可供书目数据库起死回生,重新寻找定位,寻找新的营销模式。

  最初,中版通将纸质书目、电子书目(网络书目)并重,模式也沿袭了传统的模式,从出版社那里营销书目,提供给馆配商和图书馆。为了扩大市场份额,他们采取低价策略,但效果并不理想。首先是因为模式并无创新,出版社对电子书目和网络书目没有足够的兴趣。其次,其纸质书目的出版周期相对于社科两目来说还是比较滞后的,而且渠道比较窄,不为图书馆界所认可,出版社自然也不愿意多花钱重复去进行征订,哪怕价格很低。

  应该说,中版通的第一个发展阶段是比较失败的。如果不突破传统模式,中版通不得不最终选择退出。2006年,亚马逊网上书店推出了名为“Search inside”的全新服务,实现了在线浏览全文样书,并能对样书进行全文检索。此举的目的在于提供给读者从网上购书的体验,帮助读者买到对路的书,利用全文检索新技术还可帮助读者了解图书内容,同时也是按章节销售的一个重要方法。另外也满足了那些想以POD和电子书方式购买图书的读者看样的需要。

  受此启发,中版通推出了“网上样书库”的新服务项目。项目要实现的效果是中版通公司以最快的速度、第一时间从出版社拿到样书或电子样书,经过技术处理后成为统一的电子样书,在中版通公司内部基于电子样书进行较详细的书目数据加工,经过校对后传输到网上发布;与此同时同国家图书馆在网上协同操作数据资源与电子样书,国家图书馆在中版通公司数据的基础上,参照电子样书,对数据进行针对图书馆严格要求的补充与校对,从而编制出完全符合图书馆要求的MARC数据,在全国联合编目中心网站上发布,供全国图书馆使用。

  目前,中版通的签约出版社有120余家,并且尝试为全国图书馆联合编目中心提供免费书目数据。中版通免费从出版社那里拿来样书或电子样书,然后免费提供给联合编目中心使用,对上下游都免费,完全是一个公益性项目。对此,中版通有着说不出的苦衷。

  全国联合编目中心当然非常欢迎,他们还一度担心,与中版通合作之后,现有的编目人员会大量失业,但这种担心更多的是庸人自扰,退一万步说,中版通将MARC全包了,编目人员无事可做,图书馆是事业单位编制,是铁饭碗,断不存在让人失业的道理。无MARC数据可编,不过是将编目人员从繁重的体力劳动中解放出来,MARC数据编制其实没有多少技术含量可言,编目人员完全可以开展研究,开拓新的业务,唯其如此,现有编目机构的模式才有可能打破,因此,合作是有百利而无一害,反正是免费的,全国联合编目中心何乐而不为呢?

  而想从图书馆那边收钱,大概也不是中版通的初衷。出版社方面就不那么乐观了。据杨文胜介绍,虽然是免费给出版社作宣传,但出版社的积极性并不高。首先是观念的问题,出版社嫌麻烦,目前出版社还是传统模式,一般没有数字出版的专门机构和人员。无专人负责也就是无人负责。其次是版权问题,“网上样书库”要求出版社提供若干页电子样书,发布在中版通的网站上,供图书馆在采选图书时参考。出版社担心侵权,事实上,Search inside项目覆盖的图书不到亚马逊图书品种的30%,主要也是因为版权问题。

  公益性项目意味着一大笔投资。据悉,“网上样书库”每年投入的经费高达500万元左右,每年仅样书的运输费至少就有50万元。“如果不能够实现经济效益,能够实现较大的社会效益,也能够接受”,杨文胜如是说。但他同时也承认,“网上样书库”在中国出版集团新一届领导班子第一个任期之内若不能够实现盈利,肯定不能够继续下去。

  “网上样书库”的核心是电子样书,难点是时效性。如果中版通不能够先于图书馆拿到样书,甚至图书馆先于中版通拿到样书,“网上样书库”就没有意义了。这是完全有可能的,现采对图书馆来说越来越必不可少,图书馆对获取新书的时间越来越苛刻,特别是图书二维码应用以后,图书馆拿到了样书就等于拿到了毛坯MARC数据,“网上样书库”将变得可有可无。亚马逊毕竟是网络书店,网上样书不过是手段,他们要做的还是B2B、B2C,而中版通似乎完全押宝在这上面,从这个意义上说,“网上样书库”不能不说是一项充满了未知数的业务,费力不见得讨好,盈利则更无穷期。

  今年4月,中国出版集团成立了数字出版有限公司,中版通的业务将整合到数字出版有限公司,中版通公司随之完成了自己的使命,“网上样书库”将成为中国出版集团数字出版有限公司的业务,也是目前该公司的唯一业务。众所周知,中国出版集团数字出版有限公司的成立就是冲着上市去的,业界也对其充满了期待。中国出版集团所属出版社都是大社、强社、名社,拥有国内其他出版机构不可比拟的资源优势,而内容优势正是做数字出版的最重要的条件。

  上市融资是重要目标,这些资金应该能够解决“网上样书库”的资金问题,何况中国出版集团还能够立项申请专门资金,钱似乎不是问题。而且在可预见的将来,中国出版集团肯定也会成为国内数字出版的领头羊,甚至能够在全球占有一席之地,中国出版集团打造中国的OCLC也不是没有可能的。

  OCLC在7月中旬发布的最新报告《从自发到自觉:美国图书馆经费支持研究》中说,研究固然重要,但行动则更为必须。这句话用在“跨业书目协作与共享”上是再适合不过了。


《新华书目报·图书馆专刊》,2008年8月18日,第C4-5版


返回上一级 / Back to the Previous Level

返回主页 / Back to Home

update 8/24/2008