明觉杂志

数位人文与数位佛学(一)──日本篇

第313期明觉   文:道观| 2013-10-16
图1:网络版CBETA与SAT测试。输入“般若”一词,前者得10900条/项结果,后者得21674条/项结果。图1:网络版CBETA与SAT测试。输入“般若”一词,前者得10900条/项结果,后者得21674条/项结果。
图2:五位七十五法一览表图2:五位七十五法一览表
图3:《道行般若波罗蜜经》文献数据和古写本纪录,除经录提供的咨询外,还网罗了敦煌本资料。图为金刚寺所藏写本。图3:《道行般若波罗蜜经》文献数据和古写本纪录,除经录提供的咨询外,还网罗了敦煌本资料。图为金刚寺所藏写本。

近年欧美日多所高等学府齐声响应一新概念--“数位人文”(digital humanities,或“电子人文”),引起大众广泛关注。人文科学一般泛指与人和社会直接相关的学问,比对自然科学的硬科学。自然科学与现代科技紧密衔接,看似理所当然。人文科学给人感觉就是只管读书,究竟有没有追赶时代步伐,把学问数位化的必要呢?


学问的本质就是求真,尽管领域和方法论上的差异,知识必然经过探索、累积、整理、过滤和淘汰的不同阶段 。“数位人文”的目标就是希望充分利用科技,克服人类社会既有的各种限制,促进学术和人文科学的研究,整合和普及知识,把人类视野推到最前线。


随着过去二十多年来个人电脑和网络普及化, 各种为学习而设计的电子工具如雨后春笋,应运而生。我们所指的“数位人文”除了各种数据化典籍和工具外,实际上牵涉到整个学习的模式和人文学科的整体面貌。举例说,扫描本和维基百科给大家带来前所未有的便利,但其中利弊则尚待探讨。资讯质素良莠不齐,搜索器的操作局限,还有讯息紊乱的情况,相信对学佛的人来说并不陌生。


数位化讯息如何整合和优化本身也是一门学问。在专业佛学研究的领域里,不少院校近年耗费大量资源去推动“数位人文”,其中有成功的,但也有些彻底失败的例子,值得反思探讨。


国内一位梵学泰斗曾经被质问为何不去编一套梵汉字典。他淡淡的回答说,字典不是随便编的,背后需要一个学术团队,还有基础研究去支撑,编出来的东西才有价值,不然人家不用便没有意思。他的一个学生后来当了教授,为了申请国家基金,打着科研的旗号,希望利用科技去编一套梵汉字典。其实当时台湾的林光明已经发愿要编译一套以日本的《梵和大辞典》为基础的梵汉字典,不过这位教授不理,觉得他有他做,我有我做,反正不用亲力亲为,只是下判给一群学生“干活”,马不停蹄的把荻原云来的《梵和大辞典》重新输入,打算随便加删一点便交货。至于数位格式和校对步骤等则完全没有周详考虑,觉得先干着再说。后来日港台多地学府公开他们的数据库,于是这个名副其实的“国家豆腐渣工程”亦告吹。不过事情还没完结,这位教授连同另一位不谙梵语的教授在香港申请了一个更大的资金,这次打着“佛经数位化”的旗号,目标是通过电脑分析去比对佛经汉译与梵语原文之间的语法关系云云。听起来很科学,但实际操作层面上出现不少问题。首先他们利用的并不是自己输入的数据,而是抄袭国外学者的公开档案。不是正轨合作,人家的东西质量如何无法辨认。加上自己不是电脑专业,程式编写的工序只能外判出去。至于梵语的语法分析,则下判给一批博士生和年轻博士去做机器化的标签工作。其实西方学者早已经写出辨认梵语语法的程式,无须依赖人力辨认。他们在这个工程半途才发现自己如何落后,人家的自动化标签程序,按一个键便完成,把那群超时工作的博士和博士生吓得目瞪口呆。


这情况的出现,先不说资源的浪费,归根究底还是学者之间缺乏沟通 。既没有处理大型数据库的经验,亦没有掌握好“数位人文”发展的脉络,加上好大喜功,闭门造车,最后的结果自然就是失败。


今年9月笔者在日本松江举行的日本印度学佛教学会年会发表论文之际,参加了一场“数位人文”的座谈会,了解日本佛教界在电子佛学里的一些前沿工作。其中最令人欣慰的,除了技术的先端性,最重要的还是背后精密的思维,团队的合作和分工。简单的说,首要的为眼光和眼界,想清楚,做好准备才去动手。而且项目必须公开,让各方学者指点批评,互相切磋,这才说得上因缘具足,项目才会至臻完善。实际上,世界各地不少高等学府都在各自建立自己的数据库,其中只有部分对外公开,笔者亲眼目睹现今一些高端程式组合,可以让学者不用按几个键便能引经据典,进行多语言对勘,并搜索出所有相关的研究论文和材料。至于两岸三地,台湾在佛学研究中一直占着领先地位,近十多年来推出不少大部头的数据库,其中以法鼓山牵头成立的中华电子佛典协会的电子佛典集成(CBETA)最为瞩目。中国大陆近年得到国家投放大量资源推动佛学研究,而大众对佛学和“数位人文”的需求亦甚殷切,可惜国内网络受到诸多限制,学术体制欠透明,引致国内佛学资讯异常紊乱,重量不重质,错漏百出的情况十分普遍。至于香港就更不用说了,由于就连一个国际水平的佛学图书馆也没有,学术以营商的管治方式运作,相关的古典学、印欧语言学、印度学、印度哲学、文献学等基础学科长期处于真空状态,因此本地佛学一直未能与世界接轨。不过由于香港拥有高度自由,还有丰厚的经济基础和国际交通枢纽的优势,在网络开通的时代“电子佛学”也许能够弥补一些先天的不足,为未来带来转机。


(待续)


网页推介:


1)电子大藏经:CBETA还是SAT?
SAT大正新修大藏经テキストデータベース:
http://21dzk.l.u-tokyo.ac.jp/SAT/ddb-bdk-sat2.php
CBETA电子佛典集成
http://tripitaka.cbeta.org
要在浩如烟海的大藏经里翻查资料,就算是熟读经藏的大德也可能无从入手,经典电子化彻底改变了读经和研究佛经的模式。CBETA和SAT是两个当今研究汉文佛典的重要资源,前者原来为东京大学 《大正藏》电子化的科研项目,其后法鼓山的CBETA后来居上,开发出读经软件和搜索器,其光盘安装版功能甚多,并包涵大量其他经藏。不过SAT仍然具有一定优势,因为包含了《大正藏》55卷以外CBETA所欠的内容,而且网络版搜索平台操作方便。近年SAT继续发展,与东大Muller教授的半开放式电子佛教辞典和BDK“平行文数据库”结合。至于CBETA走的方向则集中文献收集,搜索工具和引文功能比前者方便,两者可以说是各有千秋。

图1:网络版CBETA与SAT测试。输入“般若”一词,前者得10900条/项结果,后者得21674条/项结果。


2)多方位佛教辞库
Bauddha Kośa佛教用语用例集
http://www.l.u-tokyo.ac.jp/~b_kosha/start_index.html
佛教名相复杂,在不同经典里有不同的用法和含义,随便翻阅佛教辞典有时只能一知半解。要掌握佛教的名相,必须配合经文和注释,还有整体知识系统和正确的历史观才说得上是“如实正知”。东京大学建立Bauddha Kośa的目的就正是要以多方位角度去让读者理解复杂的佛教名相。像阿毗达磨的“五位七十五法”,以图表和HTML链接化表达,内容细心挑选,除了提供各种相关语言讯息,还有出典、译文等等,一目了然。 (http://bushiso.mydns.jp/~bkosha/html/index_75dharma.html#

图2:五位七十五法一览表


3)写本数据库
日本古写经数据库
http://koshakyo-database.icabs.ac.jp/p02_canonList.seam
汉译佛经有多古老?《四十二章经》、《道行般若经》等相信都是东汉时代译出,至今近二千年了。不过从文献学的角度去看,我们今天的汉译佛经,一般以刻版印刷的经藏为依据,年代最早的而又最为流通的是韩国海印寺的再雕版高丽藏,至今有八百年左右的历史,其他我们日常接触到的大藏经,其版本最早的也不会超过北宋。二十世纪学者发现的敦煌残卷,还有日本的手抄写本,其中内容往往与后来版本颇有出入。随着“数位人文”的普及,各国科研机构争相把自己国家收藏的写本陆续数据化和公开。国际佛教学大学院大学设置的日本古写经数据库便是一个极好的例子。日本那一个寺收藏了那一部经,一目了然。由于古经卷十分珍贵,一般放在寺院的藏经阁或博物馆里并不公开,位于东京的国际佛教学大学院大学收藏了大量重要古经卷的扫描档,而部分已在网站公开。

图3:《道行般若波罗蜜经》文献数据和古写本纪录,除经录提供的咨询外,还网罗了敦煌本资料。图为金刚寺所藏写本。


 


 


 


 


 


 


 







分类 :
评论 :
    回覆 :
    姓名 : *
    内容 : *
    验证码 : *
    分享到