台湾成功大学甲骨文全文影像数据库介绍

您的位置：
台湾成功大学甲骨文全文影像数据库介绍
刘源摘自台湾成功大学图书馆网站 2005-03-05 00:57:54 阅读次
第一阶段建构工程－－《甲骨文合集》简介一、缘起国立成功大学「甲骨文全文检索与全文影像系统」建构计划始于于一九九五年，原计划名称为「世界甲骨学数据库建构计画」，系由中国文学系甲骨学研究室、图书馆、资讯工程研究所三单位联合执行。后以甲骨学研究室主持人黄竞新先生一九九六年离校去职，建构计划执行至《甲骨文合集》、《殷墟甲骨刻辞摹释总集》第十册三三六００片。为使计划能发挥作用，在教务长李建二先生、前图书馆馆长高强先生、现任馆长蔡文达先生与文学院院长王三庆先生的支持下继续执行。原计划欲涵盖范围也由「世界甲骨学数据库」修正缩小为《甲骨文合集》部分，并列为第一阶段实验工程。本系统主要是将学习甲骨文与研究甲骨文的重要征引资料《甲骨文合集》十三册、《殷墟甲骨刻辞摹释总集》上下册以及《殷墟甲骨刻辞类纂》上中下三册汇整输入，全文检索与全文影像处理，以方便甲骨学界、其它学科领域以及初学者一套完整而便捷、快速取得理据的工具，进而推动学术的向前发展。二、系统建置过程：本系统的建置，先将《甲骨文合集》四万一千九百五十六拓片、摹片扫描输入，分期分类，再依《殷墟甲骨刻辞摹释总集》、《殷墟甲骨刻辞类纂》建立指引片、摹片及关键词，依次建文件的资料为：笔次、拓片编号、指引片、摹片、资料来源、期别、释文、关键词及分类。并在＜检索系统说明＞中附上＜校勘记＞，以说明各册各片的讹误脱衍情形。至于未释出的「字头」，系依据《殷墟甲骨刻辞摹释总集》、《殷墟甲骨刻辞类纂》、《甲骨文字诂林》诸书序号编码，检索时，可用「部首检索」、「笔划检索」及「拼音检索」方式。关于整个系统建置可分四部分进行： 1、影像处理部分：原书扫描拓片时，由于拓片本身单色，影像也就以单色TIFF/G4格式处理，影像密度为300DPI，有的为400DPI，端视各拓片品质而定。如拓片若分上、下、左、右，则分多页合并一档处理。也因拓片性质特殊，所以影像压缩比极高，所有拓片扫描完成后，储存于光盘将不超过两片，平均每片光盘可储存达50000页 2、释文建档部分：《甲骨文合集》共着录41956拓片，每一片拓片也有相对应的释文，但因释文长短变异很大，必须逐片键入，并加入分类及关键词以利检索。但在释文的键入中，因当初建置准备中，对计算机字库中没有的未释词未先依《殷墟甲骨刻辞摹释总集》的序号编码，随着键入笔数的增加就愈形成一种困扰与负担，今对照《殷墟甲骨刻辞摹释总集》的序号编码，以利检索。唯基于甲骨文造字的困难度与造字环境尚未臻成熟，今暂用序号编码，待日后环境许可后，再一次处理。 3、指引片与摹片部分：本系统有一部分是为甲骨文的清晰识读或不谙习甲骨文识读者设计的，故建有指引片与摹片。但《甲骨文合集》第十三册着录本身已以摹片为主，故仅提供指引片，其余十二册皆按指引片与摹片的方式进行。所谓「指引片」，系提供每一片拓片释读的次序与方向，次序的先后，系根据《殷墟甲骨刻辞摹释总集》释读先后，并以每一条的第一字与最后一字为主，标示其方位指针。「摹片」则除剪录《殷墟甲骨刻辞摹释总集》摹写本身外，并以描图纸印对《甲骨文合集》摹写还原。 4、系统部分：由于成功大学图书馆数据库的检索系使用汉珍公司的「TTS中英文全文检索系统」，为考量本系统未来发行、交换及公开服务的需求，目前采用WINDOWS CLIENT及WEB版两种版本。但因甲骨文图文资料的庞大，又必须兼顾质与量的前后一致，尤其在图文整合方面，考虑到长期保存、系统成长、移植等因素，于是采图文分开处理的原则。目前，本系统无法处理释文与影像被精细的剪辑、合并，如欲处理，则需藉由某些软件包，而产生依附的现象，从而使格式受限，不再只是最原始而单纯的ASCII与影像文件，而在软件包改版或淘汰时影响资料的后续维护与保管，对资料的长期保存与未来加工需求不利。三、系统功能部分：本系统具有功能如下： 1、数据库中内建的每一个字皆可检索〔特别指明只供显示的资料除外〕，甲骨文的释文、分类、出处、关键词、摘要等，只要指定为可全文检索的区段，就可执行全文检索。 2、可运用布尔逻辑AND、OR、NOT将词汇组合起来检索，或是跨字段查询。 3、具有浏览词组索引(Browse Index)的功能。 4、可快速显示数据库中的文字，记录并直接打印或储存。 5、除可由全文检索系统对文字部分作全文检索外，如需查看拓片、指引片、摹片，可切换到影像输出系统作显示与印出，使用者并可将影像作局部放大、缩小、旋转、反白，可将细部看得更清楚，提供更进一步的研究。四、系统功用：本系统的功用，最基本的有： 1、结合《甲骨文合集》十三册、《殷墟甲骨刻辞摹释总集》两册、《殷墟甲骨刻辞类纂》三册凡十八巨册，改善查阅上费时与占空间的缺点，并提供拓片、指引片、摹片，查阅上更快速便捷，一秒钟可达数百笔资料。 2、所提供的笔数，可供研究商代应用文字的字频，并探究各期应用文字的特性。 3、提供网络检索，方便学者使用。 4、对初学者的辨识阅读甲骨文提供协助。 5、提供甲骨学者较准确而有效的缀合尝试。五、未来展望：本系统目前完成《甲骨文合集》共四万一千九百五十六片，《殷墟甲骨刻辞摹释总集》释文全部的输入建档工作，而「关键词」与「摹片」、「指引片」的工作也接近完成。未来除对内容作细密谨当，求全求备的校正，及处理本文与影像各自独立，藉由影像系统来切换不同画面的缺点，祈能在甲骨文拓片影像显示时，适切而统整地在画面上呈现文字说明的小窗口外，更待处理编码造字的困难。而在经费与版权的许可下，计划可将《甲骨文字诂林》纳入，对系统的完整性来说，将更齐备。本系统对古文字全文检索与全文影像处理建构的初步尝试，本是拋砖引玉，服务大众性质，在古文字出土日繁的今日，如何透过信息网络的便捷资料取得，以提升学习与研究的质与量，古文字材料在信息国度的「预流」，将是风起云涌，须待努力的！
责任编辑：刘源
[发表评论] [文章回顾] [收藏本文][关闭窗口]