您的位置  > 互联网

“汉字结构认知大字典”与读者见面

——访华东师范大学汉字研究与应用中心臧克和教授

光明日报记者 柴如金

经过数十年的努力,华东师范大学汉字研究与应用中心组织编写的《汉字结构认知词典》(以下简称《词典》)终于面世。 这是一本反映当代汉字研究成果、实用性强的大型汉字文化工具书。 旨在描述和分析通用规范汉字的形、意、用的历史演变,揭示汉字的结构规律和文化内涵。 围绕该词典的编纂特点、学术价值、汉字结构起源与发展等话题,记者采访了该词典主编、华东师范大学汉字研究与应用中心臧克和教授。大学。

记者:与同类汉字工具书相比,这本词典在编撰风格、汉字结构分析等方面有何特点?

臧克和:写作学科建设一般有两个主题:一是调查、组织和规范;二是写作学科建设。 另一个是收集知识并解释它。 前者属于汉字标准化工作,以保持符号系统的有效使用; 后者属于汉字发展史,使文明记忆能够代代相传,不中断、不丢失。

一本语言工具书,基本的写作风格取决于功能定位的设计理念。 这套写作学科建设专着的最基本特征或者关键词可以说是“结构认知”。 汉字的结构体系已经经历了数千年,从未间断过。 与世界各地的各种文字系统相比,它算得上是一种独特的存在形式。 汉字的基本结构元素是“逸仙象形”的“相似符号”。 与西方已经使用的线性视觉文字相比,汉字系统使用者形成的视觉思维方式是一种普遍存在的“类比认知结构”。

具体来说,所呈现的汉字认知结构具有以下特点:结构分析强调结构视觉认知的整体性、形符号和声音符号的相互依存性,观察和描述历史汉字各个阶段的结构变化和转变。 。 ,把静态的汉字结构、古今变异,放到动态的历史发展过程和实际使用过程中去考察分析。 所有这些都是为了串联起线索而结构化,力图使之成为汉字识别的“倍增器”,提高思维效率。

记者:词典按顺序列出了各个时期实际使用的代表性字形。 这样排列汉字字形演变的历时链条有何意义?

臧克和:根据《汉字断代调查与汉字发展史》、《中古汉字的演变》和《量化汉字发展史》的调查统计以及字典的发展以往的历史词汇发展体系仅限于历史平台。 条件不能这样综合,基本上不系统。 就书法类型而言,我们的调查统计包括篆书、隶书、行书、草书、楷书类型。 其中,草书及其演变史基本上没有进入人们的视野。 事实上,汉代简牍文字已经有了成熟的草书。 我一直认为草书对书法形态的影响堪比第一次“官变”的解体,故称为“第二次解体”。 当今的书写系统中存在大量的简体字。 如果缺乏对草书带来的“二次解体”的考察和分析,基本上相当于中断了繁体字、简体字等结构转型之间的联系。 对古今汉字单位史的历史考察,有一种注重两端而忽视中间过渡环节的倾向。 例如,对于所谓的“异体字”甚至“疑难字”等类型的调查数据,其基本统计对象是从头到尾集中的,即从最初的字形直接到固定结构的字形。流变结果。 事实上,汉字的大量使用存在于中间阶段,中间产生了大量的过渡形式。 这些过渡形式对于保存人类书写记忆往往具有不可替代的“中介”意义。

人们付出了巨大的努力来比较各个时期的字形关系,目的是重建被隐藏、中断或丢失的形式和意义之间的线索。 考察过渡形式的中介环节,可以将固定字形置于动态的历史使用过程中,这为汉字的理解提供了前所未有的可能性,从而能够定义复杂的字际关系,识别各种所谓的难字。 。 识别无非就是恢复丢失的链接,重建丰富的认知线索。 可见,汉字的过渡或中间形式对于汉字发展拓展认知渠道具有不可多得的价值。 过渡形态的调查过程遵循“原始形态→过渡形态(过渡I-过渡II-过渡III...)→最终形态”的组织模式,构成了文字资源的统计、文字规范和标准的制定,甚至是字体选择的海量数据处理和调查。 关键环节。

例如,人们喜欢引用“爱”字的结构来批评繁体简体化和心形符号丧失的问题。 根据字典的字形顺序,战国初期中山王墓壶铭中的“仁”字,记载为“(见图一)”; 战国楚简、秦汉简等大多写作“(见图一)”(也采用“吉”和“心”组成的结构(“吉”和“辫”与音符号的作用相同))北魏神癸二年的石刻和隋孝爵的墓志铭中,都采用了中间的“心”字的结构。看来,仅仅根据某个时间层面正则化的结果来看待完整的发展脉络并批评简化者是不可能的,这会导致简化。

2月4日,孩子们在汉字博物馆体验汉字民俗庆祝元宵节。新华社

图1

记者:汉字的意义和结构与汉字的文化内涵有何关系?

臧克和:汉字的结构和汉字书写系统所承载的文化属性构成了汉字的文化认知结构。 “以假字解经”、“以字证史”的悠久传统,无非表明汉字体系已成为“国学”的基础。 汉字的结构是作为中国古代人的类比认知模式而积累和体现的。 以汉字为代表的汉语认知结构,以形表意,以范畴相辅相成。 它首先体现在汉字系统的分类上——根据汉字所代表事物的外延范围,划分为一系列意识范畴和概念结构。 每个类别也被“采取”。 “类别”——被视为一个属,而不是一个特定的形态单位。 “汉字文化圈”的几个学科往往把汉字系统视为构建中国上古三代以来的认知结构和概念体系的基础之一。 例如,最早的古汉字词典《说文解字》收集了数以万计的古汉字和篆书结构单元,以百科全书式的方式呈现了先民的“关于自然和人性的观念”。 通过观察和理解,分类型、分层次,系统地推演出汉字最丰富的认知模式。

对汉字的考证和阐释过程表明,通过古汉字结构的内在联系,我们可以发现和提炼出民族固有的纯粹而鲜明的思想观念范畴,追本溯源,观察动态,并从汉字系统的发展过程中收集知识——形成汉语认知结构意识资源库。

记者:字典对于构建汉字起源和结构的理论体系有什么价值?

臧克和:很难说它是一个“系统”。 古人说,道是“形外无虚”。 所谓“空白”,本来就不空; 需要填充的东西其实就在那里。

第一,科学认识汉字的结构属性及其定义逻辑。 汉字的主体是由相似符号组成并借用相似符号作为音符,按一定方式合成并反映汉语语素的视觉书写符号系统。 该定义规定了汉字结构识别中的汉字分类和分层的依据,即汉语语素单元对汉字分类的规定性约束机制,从而有效避免了简单的汉字分类和汉字文化解释带来的随意性。 。 。

其次,汉字的结构具有历时属性。 我们今天面临的所有汉字字符集本身就是一个包含不同发展阶段的混合系统。 还原当时文字标准适用的社会环境,重构异体字形之间的中介联系,关注历史发展层次和数量关系。 结构表示和语音模式也在发生变化。 例如,在“说部”字符集中,船炮船变体是不同时期突变、过渡甚至误读和替代的结构。 从船到船,改变了秦汉竹简“[~符号~]”到隶书的过渡。 北朝至唐代,石刻转变为楷书,成为“锣”符号结构。

第三,“变异字”是“过渡”结构链中的一环。 不同时代所面临的字形是历史积累的结果,体现了几个历时层面。 为了对历史汉字标准进行考察和规范,有必要援引“异体字”等术语。 随着时间的推移,考察和整理其实是一件非常困难的事情:官变和草书普及的过程,以及中间产生的大量形式都属于“过渡”的形式书写。 各种异体字都是“过渡”形态的阶段性结果。

四是结构整体衔接意义明确。 从汉字的整体结构到结构成分,成分之间存在着差异、对立和相互依存。 结构组件的作用取决于整体结构的定义。 如果不能纳入统一的文本结构比较,结构意义将难以准确理解。 恢复和建立各结构单元之间固有的认知通道,从而提高汉字的认知效率和社会使用的思维效率,成为汉字学习乃至全球传播的“汉字认知器”。

第五,对“假装”关系类型的理解常常存在“时代错误”。 深入考察往往会发现,一些出土文献中的所谓“通甲字”往往是与后来的文字系统甚至是现代和古代文字的结果进行比较。 正如“霹雳”二字一样,《史记·天官书》也写作“霹雳”(《会注本》)。 历史注释表明,西汉《史记》的书写过程中,用“霹雳”二字作为假“霹雳”,则是后世注释的理解,不符合实际。汉代的文字系统。 查《大词典·语部》可知,汉代文字中尚未记载“霹雳”字。 最早实际使用的是隋代的石雕。

记者:汉字字形数据库在哪些方面支持汉字研究和词典编纂?

臧克和:如果没有大规模的各类文字数据集平台系统,要在一定时间内完成如此大规模的多功能工具类书法书籍的处理和集成,几乎是不可想象的。 例如,以下关系更为重要:

面对大量的个性化书写样本,在字体选择层面,需要在不同时期的字形和工具书中呈现的材料中选择常用的、有代表性的结构。 这样的工作远远不是手工统计能够完成的。 还远远不能胜任,必须依赖各种注释齐全的属性库来进行词型、词量、词频的统计分析。

在信息保真度层面,数十个数据库标注了时间、空间、媒介、流通保存、字体原型、结构类型、部首成分、解释性文本、不同文本之间的关系、各种文本的作者和研究人员等各种原始信息。 ,保证历史汉字属性的科学准确提取和有序排列,数据链完整,信息不丢失。

在平台共享层面,依托各种数据集合,形成开放的平台体系,研发过程中可以实现团队之间的同步和协调,大大提高深加工的效率。

记者:几十年来的词典编纂过程为文学学者如何潜心研究提供了范例。 你是如何认识并坚持的?

臧克和:国家文化建设的日益发展和一批批新文字资料的出土出版,为文字学史上任何一个“黄金时代”提供了学科建设条件。 越来越多的专业工作者在这一领域“预流”,追求道德研究,其成果非同寻常,可想而知。

就我个人而言,我的感受很复杂,惊喜也很复杂。 这远不是一个“范例”,我和我的团队到目前为止所做的事情非常有限。 今年,我其实已经工作了48年了。 回顾我所经历的一切,我之所以能在这个相对“冷的行业”领域,能过着与“另一个世界”几乎没有区别的生活,可能是基于以下近乎顽固的执念:

一个人来到这个世界上,站稳脚跟是最重要的。 如果语言作为人类的认知方法和认知结果构建了世界,那么我们是否可以说,是语言在异构体和固定着这个流动的宇宙呢?

文字标记在人类社会中首次实现系统化编码; 同构使所有事物能够被存储、互连、分类和提取,从而能够对对象和知识进行研究。 遥远的汉字塑造了人类社会生活和观念领域的各种结构关系。 让这个世界的结构“可视化”,甚至“场景化”。 规则明确了,世界就可以把握了。 正是在这个意义上说:“言足以安身立命”。

进入数据时代,对文本的理解和处理不仅仅是工具和方法,更是一种生活状态、一种生存方式。 建立文本数据库保存人类文字记忆,是大数据时代汉字文化界为世界贡献人类智慧的重要课题。

汉字的“过渡形式”和“中间图系列”理论为汉字文化圈书面语言文本大数据挖掘提供了理论基础。 “转换形式”单元字段的设置使得海量文本的数据处理具有可操作性。 依托这个文本数据库,研究者将掌握第一手资料,揭示人类认知行为的发展规律和智力记忆的传承。

一切事物都在变化,由旬没有永久的住处。 白马已过,文字树常青!

《光明日报》(2023年2月12日第05页)