首页 >> 语言学 >> 观点·对话·访谈
从电子印刷迈向数字出版的基石 ——《辞源》用字整理
2016年03月10日 08:54 来源:中国社会科学报 作者:王晓明 字号

内容摘要:《辞源》第三版修订工作始于2007年,用时长达8年。其间,恰逢我国数字出版从兴起转向兴盛之际,毫无疑问,纸质版和数字版都要出,但二者是分步实施还是一气呵成,纸质版电子印刷数据是否与数字出版接轨,这是一个无法回避的问题。

关键词:辞源;数字出版;电子印刷;用字整理

作者简介:

《辞源》第三版优盘版和网络版

   《辞源》第三版修订工作始于2007年,用时长达8年。其间,恰逢我国数字出版从兴起转向兴盛之际,毫无疑问,纸质版和数字版都要出,但二者是分步实施还是一气呵成,纸质版电子印刷数据是否与数字出版接轨,这是一个无法回避的问题。

  “一气呵成”的数字出版策略

  单从数据层面讲,电子印刷相对传统铅字排版印刷只是载体改变,目的还是“印刷”呈现,而数字出版则是全新的理念。

  数字出版是建立在计算机技术、存储技术、显示技术、网络技术和流媒体技术等高新技术基础上,在内容的编辑、制作、发行、传播等出版全过程中,将所有信息都以统一二进制代码的数字化形式存储。其核心是“一字一码”,这个编码在全球范围内是唯一的,即国际标准编码。

  为了实现数字出版,项目组最终确立了纸、电一气呵成的出版策略。从电子印刷迈向数字出版,意味着转变观念、调整工作模式和技术创新。《辞源》修订工作原本就时间紧、任务重,这种策略的调整无疑雪上加霜。为此,专门成立了字形组,对《辞源》用字进行全面整理。

  为了在短时间内实现这一跨越,字形组在主编指导下,制定了较为科学的技术路线和实施方案,从摸清情况、制定原则和技术实现3个层面,分6个步骤对《辞源》用字进行整理,为实现《辞源》第三版从电子印刷迈向数字出版打下基础。

  《辞源》用字面临挑战

  修订人员以2010年《辞源》纪念版为基础,利用其纸质版和电子印刷数据,对《辞源》用字进行彻底清理,从中提取出用字16000余个,并且摸清了《辞源》的用字状况。《辞源》初版于1915年面市,距今已百年,由于历史沉积和印刷技术条件所限,其用字存在一字多形、新旧并存等现象,这是呈现层面的问题;电子印刷数据则存在一码多字、多字一码等情况,这是印刷平台系统底层的问题。2010年版《辞源》的电子印刷平台是以国家编码标准GB2312的6763汉字为核心编码,繁体字和集外字均通过切换字库来实现,这是权宜之计。同时,该平台为了排版印刷的方便,开放了自造字功能,导致一个编码对应多个汉字和多个汉字对应一个编码的现象频出。这样的数据无法实现有效的信息检索、准确的信息传递和直接的信息交换,是实现数字出版的最大障碍。

分享到: 0 转载请注明来源:中国社会科学网 (责编:王婷婷)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们