语言学与应用语言学 信息网络时代中日韩语文现代化国际学术研讨会论文集 浏览文章

中文智能处理技术古文标点自动化(摘要)
-- -- 以古今图书集成艺文与选句为始作
 
  摘要:中国古籍都没有新式标点,古籍数位化不加标点不能说完整。标点所须的工时与金钱比输入还多,而且还非求助学者专家不可。笔者主持故宫与东吴合作《古今图书集成》专案时,便深深感受到这方面的压力,于是开始探讨电脑自动标点的可行性。结论是有些难度甚高,但甚可行。某些问题较为容易,可获成功,韵文即其中之一。
  《古今图书集成》全书分"汇编"、三十二"典"、6117部。每一"部"之下分"汇考、总论、图、表、列传、艺文、选句、纪事、杂录、外编"十项,"艺文"收录诗文词赋,"选句"收录名句佳对选,约占该书十分之一,有一千七百余万字。此等文体句法严整,兼有押韵,十分有利于自动标点。先易后难,整个自动标点工程由此切入。
本论文详述古籍诗、词、赋标点的构思与技术,并有程式作示范。
  关键词:标点;古籍;数位化;诗;词;赋


 
 
{ 作者:陈郁夫   编辑: 宋沁潞   }
 
 
  


Copyright 2004-2008  All Rights Reserved 制作维护:『山东大学中文信息研究所』