德语词汇长度的共时特征与历时演化

发布时间:2022-04-14 19:33:09 论文编辑:vicky

本文是一篇德语论文,本研究视语言为一个复杂动态适应系统,将词汇长度作为研究语言系统的切入点,通过数学的定量方法提炼德语背后蕴藏的规律,结合社会、历史、文化、认知等作用因素,多维度分析规律成因及演化动因,力求“以小窥大”,以期为揭示德语语言的跨文体特征及历时演化特点提供实证参考,并促进对人类语言普遍规律的了解。

1  绪论

1.1  词长研究述评

词汇长度因其易观察的属性特点,不仅很早就在日常生活中引发了不同语言使用者的关注,而且成为了包括计量语言学在内的诸多学科领域的研究对象。随着研究的深入,各国学者正在逐步揭开词长这一语言特性的深层内涵。本节将简要回顾词长研究的历史,以及相关的学科、主题和方法,并在此基础上聚焦计量语言学,着重评述该领域内的词长研究现状,尤其是德语词长计量研究取得的成果。我们将总结现有研究的优点与不足,以期从中学习研究方法、发现研究问题、获得研究思路。

1.1.1  多学科词长研究

提及词长研究,多数学者会将英国数学家、逻辑学家摩根  (Augustus  de Morgan) 1851 年 8 月 18 日写给友人的一封信作为研究史的开端。不过在此之前,英国速记工作者布莱特  (Timothe  Bright) (1588)、德国浪漫主义作家让·保罗 (Jean Paul) (1813)、日耳曼学者巴克麦斯特  (Adolf L. Bacmeister) (1870)  等人士就已经注意到了词长与构词法、可读性、接受度、信息传递效率及工作效率之间的关系。

摩根的影响力之所以比较大,是因为他将词汇长度与作者身份的辨别工作直接联系起来,且其猜想在将近 40 年后得到证实。摩根主张以每个单词所包含的字母数量为基础,计算、对比各封保罗书信的平均词汇长度,以此判断书信是否出自同一作者之手1  (Lord 1958: 282)。

1887 年,美国物理学家、气象学家门登霍尔  (Thomas C. Mendenhall)  在《科学》杂志副刊上发表文章,利用多组选自狄更斯《雾都孤儿》、萨克雷《名利场》的 1000 词次语料,统计了基于字母数的平均词长,并绘制词长与词频关系图。频谱图显示,出自同一作者之手的各组语料有着极为相似的词长分布状态 (Mendenhall 1887: 238–239)。在进一步对比约翰·密尔、爱德华·阿特金森的文稿、凯撒战记以及《旧约》《新约》后,门登霍尔发现不同作者的文本平均词长有别。例如,狄更斯的一万词次语料的平均词长为 4.342,而密尔的则为 4.775 (Mendenhall 1887: 243),且后者“比其他作者更喜欢使用双字母词”(Mendenhall 1901: 98)。门登霍尔进而指出,人在遣词造句时会不自觉地表现出个人习惯与偏好,这些无意识的行为“最终会呈现出规律性,反映其规律的图表或许就能成为辨别作者身份的一种路径”(Mendenhall 1901: 97)。

1.2  研究目的、研究问题和研究意义

得益于计量语言学词长研究,传统语言学的一些理论和猜想得到证实,我们对人类语言的认识也更为丰富。不过,综合现有研究结果,仍有部分问题尚未得到解答:

第一,不同研究采用的词长测量方式有别,例如包括德语在内的拉丁字母语言在研究初期多以字母数为测量单位,后期则更多地基于音节数计算词长。可是,由不同测量方式所得的词长数值存在差异,它们之间是否有对比或转换的可能?是否存在对于特定语言而言的最佳词长测量单位?

第二,边界条件会对词长产生影响已是学界共识,但其具体会产生何种影响尚不可知。陈衡  (2016)  利用大规模、真实汉语语料系统分析了语体类型、写作年代、文本规模等因素可能会对词长研究造成的影响,可是尚无针对其他语言的类似考察。

第三,通过共时研究发现的词长分布特征及语言属性关联在历时层面是否仍然适用?不同语言研究所得到的结论是否存在相似性?这些共性能否反映人类语言的普遍特征?

德语论文怎么写


2  理论基础与研究方法

2.1  理论基础

如何定义“词”?何谓计量语言学研究方法?本节将先从不同的语言学视角出发,界定“词”这一概念。在厘清了“词”的意义后,便可基于此展开词汇长度研究。下文将逐一介绍计量语言学领域与词长相关的常用定律、方法与考察指标,为之后的方案设计与研究分析奠定理论基础。

2.1.1  词的界定

开始词汇长度研究之前,我们需要先明确“词”(Wort)  的定义。尽管人们每天都在用“词”,“词”也是语言系统的基石之一,这一概念看似无需解释,但若深究,却会发现给“词”下定义其实并非易事。

“词”鲜少作为学术术语出现,也尚无统一的概念界定  (Heringer 2009: 18)。中国语言学家张斌曾发出感叹:“研究什么是词,通常考虑的是:第一,给词下定义的问题;第二,如何从成片语言中分析出来词的问题。这两方面的探讨都不很令人满意”(张斌  2019: 15)。这可能是中西方语言学所共有的难题。

就德语而言,一般认为可以从正字法/字位学、音位学、形态学、词汇学、语义学、句法学、语用学等语言学标准定义“词”(Wurzel 2000a; Fuß & Geipel 2018: 13; Römer 2019)。本节将结合不同的语言学层面及各异的理论视角,尝试对“何谓词”这个问题的多种见解进行简单梳理。

(1)  正字法/字位学指标

在一些语言的书写、印刷习惯中会在词和词之间留下空隙,用以“划分词与词之间的界限”,例如英语、德语、法语等  (Bloomfield 1933: 178;  布龙菲尔德 1997: 218)。Bühler et al. (1972: 87)  将词视为由一连串字母写成的语言单位,用空格分隔划分。除了字母  (Buchstaben)  外,也有学者认为字位  (Grapheme)  同样“是字位学的抽象单位”(Neef 2011: 37)。

2.2  研究语料

语言的系统规律与历时演化是人类探究语言实体的核心所在。由于语言表达的“无限性与信息的不充分性”(刘海涛  2017: 33),我们难以直接观察“语言”本身,往往需要借助特定载体、结合有效的方法路径。不同学科及其分支均有其常用的考察方法。在计量语言学领域,研究的辅助载体为真实的语言文本,“所以也有人把计量语言学理论称为文本理论”(刘海涛  2017: 33)。故此,本研究将以真实的德语语料为研究对象。

从古至今,德语不断演化,经历了多个历史时期的发展。然而,无论是历史上的德语,还是今天的德语,都存在许多变体。在开展词长研究时,应选择哪个时期的哪些语料作为研究对象?为了更有针对性地选择研究所用语料,有必要先对德语的发展历史进行回顾,并基于此明确研究对象。

本节将简要梳理德语发展历史,说明语料来源、选用依据,并介绍收集方式及预处理过程,在开展正式研究之前夯实语料基础。

2.2.1  德语简史

德语  (Deutsch)  属于印欧语系日耳曼语族西日耳曼语支,是德国、奥地利、瑞士、列支敦士登、比利时、卢森堡的官方语言,全球约有 1 亿母语使用者与1545 万外语学习者(Auswärtiges Amt 2020)。 欧洲大陆延伸至印度周边土地上的诸多语言均属于这一语系。这些语言在词汇等方面存在相似性,但日耳曼语  (Germanisch)  因发生了第一次音变  (也叫日耳曼语音变)10  (erste/germanische Lautverschiebung),即阻塞音的系统变化,在发音上明显区别于其他语族的语言  (布斯曼  2003: 138; Jäger & Böhnert 2018: 13–16)。

3  德语词长测量方式的差异性分析................................. 60

3.1  测量单位对词长测量结果的影响 ...................................... 61

3.1.1  基于字母数的词长测量结果................................. 62

3.1.2  基于字位数的词长测量结果.............................. 64

4  德语词长特征的跨文体共时考察.............................. 89

4.1  平均词长的跨文体共时对比 ......................................... 90

4.2  词类平均词长的跨文体共时对比 ................................ 99

5  德语词长演化的跨文体历时考察...................................... 131

5.1  平均词长的跨文体历时对比 .................................... 133

5.2  词类平均词长的跨文体历时对比 ................................ 138

5  德语词长演化的跨文体历时考察

5.1  平均词长的跨文体历时对比

与第四章中共时维度的词汇长度考察方式类似,本研究首先选取平均词长作为观测指标。我们仍然按照“是否考虑屈折变化”的标准,将词汇分为在实际文本中“所见即所测”的“词形组”和基于词汇基本形态的“词目组”,并在两组内继续基于形符和类符计算动态平均词长和静态平均词长。目的是观察三类文体内部,不同形态的词汇的长度以及人们的使用偏好在300年间是否发生了改变,德语词长总体具有怎样的历时演化趋势。

经SPSS的单样本Kolmogorov-Smirnov检验  (K-S检验),三类文体、六个时段的各组20个文本基于词形形符、词形类符、词目形符、词目类符的四组平均词长数据均符合正态分布。我们利用统计软件Igor Pro,将三类文体时段1至时段6“词形组”和“词目组”的静态平均词长和动态平均词长分别与线性公式  y=ax+b  进行了拟合。图5.1为基于词形  (有屈折变化)  的两组数据,图5.2展示了“词目组”(词汇原形)  的长度特征,拟合参数详见表5.1。

德语论文参考


6  结语

6.3  创新、局限与展望

本文以问题为导向,遵循第二章的理论指导与研究设计,以第三章开展的前测研究结果为参照,利用计量语言学方法,从共时和历时双重视角对 17-19 世纪文学、应用文及学术德语语料展开分析研究。经过多层级的考察,本文对研究问题作出了解答,实现了预期的研究目标。

本文的创新之处主要体现在以下几点:

第一,思路方法创新。本研究注意到现有德语词长研究对于“词”的概念界定较为模糊,选择词长测量单位及词汇形态的理由阐述较为简单,尚未系统考证词长测量方法对研究结果的影响。解决上述问题对阐明词长研究的有效性、合理性至关重要。因此,本文在围绕研究问题开展正式研究之前,对上述悬而未决的基础问题进行了系统考察。采用多种词长测量方案处理语料、对比数据,以理论指导实证研究,并以所得结论指导后续研究,力争在研究方案的设计上做到有理有据。本研究不仅有助于在理论层面增进对德语“词”这一概念的理解,明晰不同词汇概念对词长测量方案的影响,同时能够促进改变目前“词长测量单位不统一、研究结果难以对比”的现状。

第二,研究语料创新。语言史绝不是美文的语言史,还应该将学术、政治、公文、经济、技术相关的文本纳入考察范围  (Polenz 2009: xii–xiii)。本研究突破常规研究“以文学作品为主、时间维度单一”的语料选择方法,以出版于 17-19世纪的文学作品、应用文、学术文本及报刊文章作为语料,丰富了德语词长研究的语料类型、拓展时间跨度。本文在选择语料时兼顾同质性与异质性,通过研究结果的定量描述和质性分析,充分探究文体、时间作为语料边界条件可能对词长特征产生的影响。此外,本研究一方面验证了词长相关的计量语言学定律与假设,另一方面也与构词法、文体学、历史语言学、语言类型学等主题领域紧密相关,并用实证数据回应了前述学科基于经验认知提出的观点与猜想。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。