版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
甲骨文字頻特征分析
一抽樣材料的確定漢字頻率研究是了解字系統(tǒng)的重要方面。對(duì)于漢字來(lái)說(shuō),這仍然是一個(gè)年輕的研究方向,在20世紀(jì)70年代開始。但隨著中文信息技術(shù)的發(fā)展,近年來(lái)已呈現(xiàn)長(zhǎng)足進(jìn)展態(tài)勢(shì),材料對(duì)象已涉及歷史文獻(xiàn),研究的觸角也深入到了字頻與詞性、語(yǔ)義、字音及字形的關(guān)系,以及字頻與文獻(xiàn)內(nèi)容、時(shí)代的關(guān)系探究等層面。但總體而言,出土文獻(xiàn),特別是上古出土文獻(xiàn)字頻研究相對(duì)薄弱,而甲骨文的字頻研究更乏人問(wèn)津。立足在漢字發(fā)展史的視角,字頻研究理應(yīng)聚焦斷代文字系統(tǒng)的特點(diǎn)。作為迄今所見最早的成系統(tǒng)的漢字文獻(xiàn)材料的甲骨文,無(wú)疑應(yīng)該成為這個(gè)特定視角研究序列的起點(diǎn)。但就現(xiàn)實(shí)情況來(lái)說(shuō),甲骨文字頻研究尚缺乏嚴(yán)格意義上的成果。島邦男的《殷墟卜辭綜類》和姚孝遂、肖丁的《殷墟甲骨刻辭類纂》,以單字為綱類聚辭條的體例,本來(lái)可以涉及字頻統(tǒng)計(jì),但卻因壓縮篇幅的需要而將一些高頻卜辭語(yǔ)言單位作舉例節(jié)錄處理,如常見的卜辭套語(yǔ)“往來(lái)無(wú)災(zāi)”、“旬無(wú)”、“其雨”、“不雨”以及常見的虛詞“于”、“惟”、“在”、“其”、“勿”、“弗”、“不”、“弜”等等。這種處理方式正如姚孝遂所說(shuō):“對(duì)研究古代語(yǔ)言,尤其是研究古代語(yǔ)法的人來(lái)說(shuō),無(wú)疑是會(huì)感到遺憾……沒(méi)有其它好辦法,只能做出這樣痛苦的選擇?!?甲骨文字頻統(tǒng)計(jì)研究的缺位,意味著一個(gè)非常嚴(yán)重的情況的存在:對(duì)于任何一種歷史文獻(xiàn)的字頻研究而言,都將失去一種最為接近源頭的起點(diǎn)性狀況的參照,當(dāng)然,這將在一定程度上模糊人們歷史視線。毫無(wú)疑問(wèn),字頻研究是需要一定條件的。大致來(lái)說(shuō),這種條件可以概括為技術(shù)的和學(xué)術(shù)的兩個(gè)方面。就技術(shù)而言,需要數(shù)字化的文字處理手段,否則,以人工計(jì)數(shù)為基礎(chǔ)來(lái)完成字頻研究,僅僅存在理論上的可行性。就學(xué)術(shù)而言,則是被統(tǒng)計(jì)文本的用字正確和統(tǒng)一??陀^來(lái)說(shuō),對(duì)于甲骨卜辭而言,這兩個(gè)方面的條件目前都不自然具備。為此,我們根據(jù)統(tǒng)計(jì)學(xué)的抽樣原則,限定了材料范圍,確定以《漢英對(duì)照甲骨文今譯類檢》(下文簡(jiǎn)稱《今譯》)、《小屯南地甲骨》(下文簡(jiǎn)稱《小屯》)和《花園莊東地甲骨》(下文簡(jiǎn)稱《花東》)卜辭為字頻統(tǒng)計(jì)的資料。抽樣當(dāng)然首先是為了限制材料的量,以便在目前條件下確保材料學(xué)術(shù)和技術(shù)加工的可行性。然而這種數(shù)量限制是被控制在實(shí)現(xiàn)字頻研究目標(biāo)可允許的范圍內(nèi)的。根據(jù)統(tǒng)計(jì)學(xué)原理,在一個(gè)總體為250的例子中,“只要樣本量不是太小——通常為10或20就夠了,統(tǒng)計(jì)學(xué)理論表明這個(gè)分布近似于正態(tài)分布?!?這也就是說(shuō),這三種材料的58544的總字量,可以滿足1410000以上字量文本的抽樣要求,而迄今所見已經(jīng)公布的卜辭材料,遠(yuǎn)遠(yuǎn)達(dá)不到這個(gè)字量(1)。此外,上述抽樣還有以下幾個(gè)原因:一是這三種卜辭材料的字頻數(shù)據(jù)已經(jīng)發(fā)表,具有驗(yàn)證的方便性(2)。二是照顧了甲骨卜辭出土地的分布。對(duì)于考古發(fā)掘材料來(lái)說(shuō),出土地的屬性是極為重要的,甲骨文當(dāng)然也不例外。我們所抽樣的三種卜辭材料,《今譯》選自《甲骨文合集》,代表了傳統(tǒng)殷墟卜辭出土地小屯村北的材料,而《小屯》和《花東》,則是非傳統(tǒng)出土地的主要卜辭材料。三是隨機(jī)抽樣和判斷抽樣的互補(bǔ)?!缎⊥汀泛汀痘|》對(duì)應(yīng)所有公布的出土地材料,用以為統(tǒng)計(jì)對(duì)象,屬于隨機(jī)抽樣,長(zhǎng)處是所得數(shù)據(jù)相對(duì)客觀;而《今譯》則是在《甲骨文合集》的材料范圍內(nèi)進(jìn)行篩選,篩選原則“一是著眼內(nèi)容和字詞的覆蓋面,即在一定的篇幅內(nèi)包含盡可能多的內(nèi)容類型和字詞種類的甲骨刻辭;二是注重刻辭拓片的清晰度,即只選擇清晰或比較清晰的甲骨文刻辭進(jìn)行今譯”凡例,同時(shí)還考慮辭例的完整性和各期卜辭的合理分布,故屬于判斷抽樣(JudgementSampling),所得數(shù)據(jù)雖然可能在表面上偏離客觀性,但卻有可能反映本質(zhì)的真實(shí)。二甲基字頻兩端集中現(xiàn)象經(jīng)剔除刻辭殘泐字和兆序用字后的統(tǒng)計(jì),《今譯》、《小屯》和《花東》的字量(3)和字?jǐn)?shù)(4)等數(shù)據(jù)如下:上表的數(shù)據(jù)(5)表明:使用單字的數(shù)量和其平均使用量都是與文獻(xiàn)的用字總量成正比增長(zhǎng)的,《今譯》用字總量最少,故單字量和平均使用量也較少;《小屯》總字量最多,故其單字量和平均使用量也較多。匯合三種材料進(jìn)行統(tǒng)計(jì),所得字頻分級(jí)數(shù)據(jù)(6)如下:上表數(shù)據(jù)所呈現(xiàn)的甲骨文字頻狀況林林總總,但其中最值得關(guān)注是兩端集中狀況,即少數(shù)高頻字占總字量的高比重(以下簡(jiǎn)稱“高端集中”)和總字量中極低比重的低頻字占單字總數(shù)的極高比重(以下簡(jiǎn)稱“低端集中”)。高端集中表現(xiàn)為,占單字量的22.87%的379個(gè)10次以上字的累計(jì)覆蓋率為94.60%,僅占單字量的1.87%的31個(gè)500次以上字的累積覆蓋率為52.46%。低端集中表現(xiàn)為,僅占總字量1.05%的616個(gè)一見字卻占單字量的37.18%。為了對(duì)甲骨文字頻兩端集中現(xiàn)象作一個(gè)合理的評(píng)估,我們首先引進(jìn)現(xiàn)代漢語(yǔ)的類似數(shù)據(jù)作為觀察的參照物。根據(jù)貝貴琴和張學(xué)濤的《漢字頻度統(tǒng)計(jì)——速成識(shí)讀優(yōu)選表》一書所提供的數(shù)據(jù),現(xiàn)代漢語(yǔ)中前42個(gè)高頻字累計(jì)覆蓋率在25.46%,而甲骨文9個(gè)1000頻次以上字就超過(guò)了這個(gè)覆蓋率,達(dá)到26.32%;現(xiàn)代漢語(yǔ)中出現(xiàn)1次的字占單字總數(shù)的8.76%,甲骨文中出現(xiàn)1次的字占單字總數(shù)的37.18%。再以古代傳世文獻(xiàn)為比較的參照。先看高頻:屬于先秦的《左傳》《論語(yǔ)》《詩(shī)經(jīng)》等文獻(xiàn),字頻最高前10字累加覆蓋率為19.276%70;而甲骨文字頻最高前10字累加覆蓋率為28.03%(1)。再看一見字:據(jù)研究,《爾雅》、《楚辭》、《山海經(jīng)》是先秦傳世文獻(xiàn)中一次字最多的三部作品。其中《爾雅》有619個(gè),占總字?jǐn)?shù)3383的18.30%;《楚辭》有221個(gè),占總字?jǐn)?shù)3137的7.04%;《山海經(jīng)》175個(gè),占總字?jǐn)?shù)1999的8.75%115。與甲骨文一次字占總字?jǐn)?shù)37.18%相比,比重都要低得多。雖然字頻存在差異被認(rèn)為是作為人類思維的外在反映的文字受到大腦功能限制的必然結(jié)果,但對(duì)于一種文字系統(tǒng)而言,少數(shù)字被過(guò)度集中使用和較多字難得被使用終究是一種消極現(xiàn)象,而兩者又具有內(nèi)在的邏輯聯(lián)系:即文字系統(tǒng)的常用字集對(duì)整個(gè)字集的覆蓋面太小的另一面,必然是罕用字在字集中的大量存在。而兩端集中現(xiàn)象導(dǎo)致的直接后果,一方面意味著相對(duì)實(shí)際語(yǔ)言交際的豐富信息而言,文字記錄功能顯得低能;一方面又會(huì)極大挑戰(zhàn)這種文字使用者的識(shí)記能力。所以這種現(xiàn)象不應(yīng)該被人們長(zhǎng)期接受,因而也不應(yīng)該是文字系統(tǒng)充分發(fā)展以后的常態(tài)。由此來(lái)看,少數(shù)高頻字占總字量的高比重和總字量中極低比重的低頻字占單字總數(shù)的極高比重的甲骨文,相對(duì)后世漢字而言,似乎確實(shí)體現(xiàn)著殷商時(shí)代這個(gè)對(duì)漢字來(lái)講屬于早期的文字系統(tǒng)的不成熟特性。三《花東》和《小屯》去程式因素前后的數(shù)據(jù)比較人們很容易想到,甲骨文兩端集中狀況與甲骨文的文獻(xiàn)特點(diǎn)有關(guān)。首先,甲骨卜辭是非常程式化的文字表達(dá),而覆蓋率極高的前辭、占辭等用字則是高度集中于少數(shù)字的。而如果去除這種因文獻(xiàn)特殊程式而導(dǎo)致的高頻因素,當(dāng)可更準(zhǔn)確反映甲骨文時(shí)代的一般文獻(xiàn)的字頻狀況。為此,我們分別將《花東》與《小屯》作不同程度的去程式因素處理,以評(píng)估卜辭中程式因素對(duì)字頻的影響程度。對(duì)字?jǐn)?shù)相對(duì)較少的《花東》僅作去除前辭用字的處理,依據(jù)去除后對(duì)兩端集中度產(chǎn)生影響的觀察角度,首先做總字量、單字?jǐn)?shù)和單字平均使用率的數(shù)據(jù)調(diào)查如下:上表去前辭版本的數(shù)據(jù)比較未去除前辭的《花東》相關(guān)數(shù)據(jù),可以發(fā)現(xiàn)三個(gè)變化:(1)總字量減少較多,達(dá)到3664個(gè),這個(gè)數(shù)字要占未去前辭版本總字量的22.18%,占去前辭版本總字量的28.50%;(2)總字?jǐn)?shù)減少不多,僅7個(gè):“夫京申”,這個(gè)數(shù)字僅占未去前辭版本總字?jǐn)?shù)的1.046%,占去前辭版本總字?jǐn)?shù)的1.05%。(3)單字平均使用量下降,具體下降了5.275,這個(gè)數(shù)字要占未去前辭版本單字平均字頻的27.16%,占去前辭版本單字平均字頻的21.38%?!缎⊥汀纷?jǐn)?shù)較多,因此在去除前辭的基礎(chǔ)上再作去占辭用字的處理,所得同類數(shù)據(jù)如下:上表的去前、占辭版本數(shù)據(jù)比較未去除前數(shù)據(jù)發(fā)生了與上述《花東》數(shù)據(jù)極為類同的變化:(1)總字量少了7711個(gè),這個(gè)數(shù)字要占未去除前版本總字量的22.48%,占去除后版本總字量的28.99%;(2)總字?jǐn)?shù)只少了3個(gè),即“卜”“”“”。這個(gè)數(shù)字僅占未去前占辭版本總字?jǐn)?shù)的0.292%,占去前占辭版本總字?jǐn)?shù)的0.293%。(3)單字平均使用量下降7.45%,這個(gè)數(shù)字要占未去前、占辭版本單字平均字頻的22.28%,占去前、占辭版本單字平均字頻的28.66%。細(xì)審《花東》和《小屯》去程式因素前后的數(shù)據(jù)比較,盡管也可以發(fā)現(xiàn)兩者間由各自文獻(xiàn)特點(diǎn)而導(dǎo)致的某種細(xì)微差異,如《花東》去程式因素后單字?jǐn)?shù)降低較多與《花東》前辭每每強(qiáng)調(diào)占卜地點(diǎn)有關(guān)(2),而《小屯》去程式因素后單字平均使用頻率下降較少則很可能與其總字量較大有關(guān),但就總體而言,兩者的數(shù)據(jù)指向卻有驚人的一致性:即卜辭程式對(duì)甲骨文總字量和字頻影響較大,而對(duì)字?jǐn)?shù)影響很小。為更加細(xì)致地描述卜辭去程式因素?cái)?shù)據(jù)的意義,不妨再作字頻數(shù)據(jù)高低兩極的去程式前后的比較?!痘|》數(shù)據(jù)如下:從上表我們可以進(jìn)一步獲知值得注意的三點(diǎn):(1)由于剔出了前辭,頻率300次以上字從12個(gè)減少到9個(gè),但是頻率為1的字卻沒(méi)有發(fā)生數(shù)量變化。(2)300次以上字的字均使用量和對(duì)總字量的覆蓋率也都有所下降:前者減少40.64(為單字平均字頻的2.09倍),后者下降4.34%。(3)由于總字量下降而一見字?jǐn)?shù)量不變,一見字對(duì)總字量的覆蓋率上升0.39%?!缎⊥汀返耐惤y(tǒng)計(jì)數(shù)據(jù)如下:從上表我們獲得了幾乎與上文《花東》同類數(shù)據(jù)相同的三點(diǎn)信息:(1)由于剔出了前占辭,頻率500次以上字從14個(gè)減少到10個(gè),但是頻率為1的字卻只減少了1個(gè)。(2)500次以上字的字均使用量和對(duì)總字量的覆蓋率也都有所下降:前者減少75.63%(為單字平均字頻的2.3倍),后者下降5.89%。(3)由于總字量的下降量大而一見字減少量小,一見字對(duì)總字量的覆蓋率上升0.33%。綜合《花東》和《小屯》高低兩極字頻數(shù)據(jù)的去程式因素的前后比較,我們可以作這樣的歸納:首先,伴隨程式因素的去除,高頻一極的單字會(huì)發(fā)生較多的數(shù)量減少,而低頻一極的字卻只有微小的數(shù)量減少,甚至數(shù)量不變??梢?甲骨卜辭的程式,主要影響的是字頻高端集中度。其次,由于程式因素的消除,在降低了高頻字過(guò)度集中的密度的同時(shí)也提高了中低頻度的文字的出現(xiàn)比重。由于這兩個(gè)因素的共同作用,程式因素一旦去除,兩端集中現(xiàn)象的集中度有了某種程度的降低。這也就是說(shuō),卜辭的程式確實(shí)是導(dǎo)致甲骨文兩端集中現(xiàn)象的一個(gè)因素。其次,高頻字集中于少數(shù)字,與相關(guān)文獻(xiàn)的內(nèi)容熱點(diǎn)也是具有內(nèi)在聯(lián)系的。相對(duì)程式因素而言,內(nèi)容熱點(diǎn)的成因相對(duì)隱晦,但我們還是可以通過(guò)系統(tǒng)調(diào)查高頻一端用字的字用是否涉及甲骨卜辭的內(nèi)容熱點(diǎn)來(lái)摸清情況。前文言及,《小屯》未去前占辭版本中字頻在500以上者有14字,而這14字在該文獻(xiàn)中的實(shí)際使用次數(shù)占了該文獻(xiàn)的總字量近五分之二。那么,這些為數(shù)不多的高頻字的字用狀況是否具有相對(duì)集中的內(nèi)容熱點(diǎn)呢?答案無(wú)疑是肯定的:字頻數(shù)居前二位的“貞”“卜”,全然就是專用于占卜的動(dòng)詞;“王”的高頻,無(wú)疑與《小屯》材料的王卜辭特點(diǎn)有關(guān);“吉”、“”,表達(dá)的是占卜的終極結(jié)果;“雨”,則是占卜中最多涉及的氣象概念;“旬”的多見,與殷人占卜有于旬末卜下旬之吉兇的習(xí)慣有關(guān);“癸”“乙”的多見,是因?yàn)檫@兩個(gè)天干字多表示占卜的時(shí)間,以及與占卜直接相關(guān)的先祖廟號(hào);“又”的高頻,當(dāng)然與其用法較多有關(guān),而其中“祭名”和通“祐”的用法,也與殷商甲骨卜辭占卜事神的特點(diǎn)有關(guān)。這樣,在14個(gè)高頻字中,與占卜沒(méi)有直接關(guān)系的只有“其”“亡”“于”“叀”4個(gè)字。而這4個(gè)字的文字?jǐn)?shù)量只占14個(gè)字頻500以上字的28.57%,其字頻合計(jì)為4011,也占這14高頻字總字頻13347的30%。由此,我們可以得到如下認(rèn)識(shí):對(duì)于甲骨文極高頻字的形成,占卜文獻(xiàn)的內(nèi)容熱點(diǎn)也起了相當(dāng)大的作用。四商法漢字的斷代屬性甲骨文字頻高端集中與卜辭程式和內(nèi)容熱點(diǎn)相聯(lián)系的事實(shí),很容易導(dǎo)致這樣一種認(rèn)識(shí):甲骨文的字頻特征,只能反映甲骨文的文獻(xiàn)特性,而并不具備殷商漢字的斷代屬性。但事實(shí)上,前文的調(diào)查數(shù)據(jù)清晰地告訴我們:即使剔除程式因素,甲骨文的兩端集中度仍大大高于后世傳世文獻(xiàn)用字,可見甲骨文字頻兩端集中與殷商文字?jǐn)啻攸c(diǎn)是具有邏輯關(guān)系的,這種關(guān)系主要體現(xiàn)為如下兩個(gè)方面:(一)結(jié)論:材料中的字頻特征決定字頻差異的因素很多,除了前文言及的文字記錄語(yǔ)言的內(nèi)容熱點(diǎn)所在以外,另一個(gè)重要因素是文字記錄語(yǔ)言表達(dá)意義的方式,更確切地說(shuō)是文字與其所要表達(dá)語(yǔ)言的意義要素對(duì)應(yīng)的精密化程度。如有的文字種類一個(gè)字可以記錄一個(gè)語(yǔ)段,有的文字則每個(gè)詞都要至少用一個(gè)字記錄。很顯然,這兩種不同的文字即使記錄同樣的語(yǔ)言內(nèi)容,字頻也一定會(huì)大不一樣。值得注意的是,由上述兩種因素導(dǎo)致的字頻差異有著根本不同的性質(zhì)。字頻差異可以歸結(jié)為結(jié)構(gòu)型和非結(jié)構(gòu)型兩種:不同頻度字在總字量中的比重存在差異,屬于結(jié)構(gòu)性差異;而不同頻度字在總字量中的比重大體不變,只是對(duì)應(yīng)頻度字群中所轄的具體文字不同,則屬于非結(jié)構(gòu)性差異。文本內(nèi)容的特點(diǎn)差異,既可以存在于不同斷代的文獻(xiàn),也可以存在于同一斷代的文獻(xiàn),如果屬于后者,由此導(dǎo)致的字頻差異一般不會(huì)是結(jié)構(gòu)上的差異,而只是不同頻級(jí)的字群所轄個(gè)體文字的差異。所以這種差異并不具備斷代的意義。一般來(lái)說(shuō),文字與其所要表達(dá)的意義要素對(duì)應(yīng)的精密化程度,是隨著文字系統(tǒng)的發(fā)展而進(jìn)化的,因此,作為導(dǎo)致字頻差異的原因,它顯然是更具有斷代意義的。那么,甲骨文的字頻特征,是否與殷商時(shí)代漢字記錄語(yǔ)言表達(dá)意義中字符與意義要素的對(duì)應(yīng)程度有關(guān)呢?顯然,這是判斷甲骨文字頻特征是否具有斷代屬性的重大問(wèn)題。下面擬通過(guò)不同時(shí)代但內(nèi)容類同文獻(xiàn),以及相同時(shí)代內(nèi)容不同文獻(xiàn)的兩種比較來(lái)嘗試解答。甲骨文是占卜文獻(xiàn),如果其字頻特征僅僅形成于占卜的內(nèi)容熱點(diǎn),那么其他斷代的類似內(nèi)容類型的文獻(xiàn)的字頻特征應(yīng)該與之相去不遠(yuǎn)?;谶@種認(rèn)識(shí),我們以戰(zhàn)國(guó)楚簡(jiǎn)中的卜筮祭禱文獻(xiàn)的字頻狀況來(lái)與甲骨文字頻作一個(gè)比較。與甲骨文以占卜和祭祀為主要內(nèi)容相類似,楚簡(jiǎn)中《新蔡》簡(jiǎn)也是記述占卜和祭祀的,我們剔除《新蔡》釋文中表示殘斷的2433個(gè)△和表示拓片不清的479個(gè)□,吸取迄今相關(guān)考釋研究的意見,對(duì)這部分楚簡(jiǎn)的整理者釋文進(jìn)行了校訂,在此基礎(chǔ)上進(jìn)行了數(shù)字化處理,獲得如下數(shù)據(jù):總字量10053,總字?jǐn)?shù)1004。其中最高頻前11字共計(jì)出現(xiàn)2531次,占總字量的25.18%(1);而甲骨文的前7個(gè)最高頻字的出現(xiàn)頻次已占總字量的26.03%。這就是說(shuō),雖然卜筮類楚簡(jiǎn)文獻(xiàn)的最高頻字?jǐn)?shù)量比甲骨文增加了57%以上,但其合計(jì)頻次占總字量的比重卻仍低于甲骨文。在最低頻一極,《新蔡》簡(jiǎn)一次字397個(gè):占總字?jǐn)?shù)的39.54%,占總字量3.95%;而前文統(tǒng)計(jì)三種材料合計(jì)的甲骨文一見字616個(gè),雖然占單字?jǐn)?shù)比重略低于新蔡簡(jiǎn),為37.18%,但其在總字量中的比重卻大大低于新蔡簡(jiǎn),只占1.05%。這也從另一個(gè)角度說(shuō)明了甲骨文的兩端集中度要大大高于新蔡簡(jiǎn)。內(nèi)容相似而高頻字的集中度卻有著明顯差異,這至少可以證明甲骨文的字頻特征與其占卜、祭禱的文獻(xiàn)內(nèi)容并無(wú)必然聯(lián)系。其實(shí),對(duì)于甲骨卜辭與卜筮祭禱楚簡(jiǎn)文字表達(dá)上的差異,人們只要讀過(guò)這兩種文獻(xiàn)都是可以直觀感悟的,字頻差異只是作了一個(gè)很清晰的宏觀描寫而已。甲骨文的字頻特征的斷代屬性由此可見一斑。殷商漢字除了用于記錄卜辭以外,至少還用于青銅器銘文,它們的字頻特征比較顯然具有另一層面的意義。不妨先從個(gè)案的比較入手。前文言及,字頻兩端集中現(xiàn)象的形成,與文字記錄語(yǔ)言中需要經(jīng)常使用的文字,即常用字集的數(shù)量相對(duì)偏少有著直接關(guān)系。然而,甲骨文字記錄卜辭為什么會(huì)只需要較少文字經(jīng)常使用呢?通過(guò)個(gè)案分析,我們或許能夠具體解釋這個(gè)問(wèn)題?!都坠俏暮霞?33片:“貞:芻得?”《今譯》:“貞問(wèn):逃亡的牧人將會(huì)被抓獲嗎?”10比較以上卜辭原文和現(xiàn)代漢語(yǔ)翻譯,可以發(fā)現(xiàn)兩大差異:首先,今譯相對(duì)卜辭原文多使用了一些詞,記錄這些詞的是“的”“將”“會(huì)”“被”“嗎”等字。顯而易見,這些字詞在現(xiàn)代漢語(yǔ)的書面表達(dá)中是一些非常重要的成分,或表示限定修飾關(guān)系,如“的”;或表示行為的狀態(tài),如“將”“會(huì)”;或表示被動(dòng)關(guān)系,如“被”;或表示疑問(wèn)語(yǔ)氣,如“嗎”。毫無(wú)疑問(wèn),這些字詞所承載的語(yǔ)言成分,都起到了促使語(yǔ)言表達(dá)清晰準(zhǔn)確的作用,幾乎在現(xiàn)代漢語(yǔ)交際的每個(gè)句子中都是不可或缺的。然而在殷商卜辭中,它們卻根本不需要出現(xiàn),或者說(shuō)它們表達(dá)的語(yǔ)言交際意義是不需要文字實(shí)體來(lái)承擔(dān)的。其次,卜辭原文的四個(gè)字都非專名,而是較為通用的名詞或動(dòng)詞,而它們與今譯所對(duì)應(yīng)的表達(dá)在用字?jǐn)?shù)量上也有差異:“貞=貞問(wèn)”,“=逃亡”,“芻=牧人”,“得=抓獲”。單音詞演變?yōu)殡p音詞,所用文字自然就會(huì)成倍增加。而在殷商青銅器銘文中,我們可以看到極為類似的情況?!白鲀?cè)般甗”銘首句:“王宜人方,無(wú)敄?!苯褡g:“商王為出征人方到社祭祀,得到保佑,必能取勝?!?34對(duì)照今譯,我們同樣可以發(fā)現(xiàn)銘文原文表達(dá)的一些意義單位得不到文字的對(duì)應(yīng):王進(jìn)行社前的祭祀(宜祭)是為了征伐人方,這在現(xiàn)代漢語(yǔ)中用了一個(gè)介賓結(jié)構(gòu)的“為”字句來(lái)表達(dá),其中征伐的意義用了“出征”二字對(duì)應(yīng)。而這些在原文中卻并無(wú)文字對(duì)應(yīng),這些意義要素實(shí)際是靠“王”“宜”“人方”之間隱含的內(nèi)在關(guān)系,讓讀者意會(huì)的。個(gè)案分析表明,銘文的用字密度與卜辭似在伯仲之間。這也就決定了銘文的總體字頻狀況與卜辭類同。我們借助于《商周金文斷代字頻表》(2),只選取該表中確定時(shí)代為“殷”的記錄,來(lái)進(jìn)行殷商青銅器銘文的字頻統(tǒng)計(jì),得出如下相關(guān)數(shù)據(jù):總字?jǐn)?shù):1579,總字量10799;銘文中最高頻的前6字的出現(xiàn)頻次為2919(3),占總字頻10799的27%。而總字量與之相對(duì)接近的《花東》卜辭的同口徑數(shù)據(jù)(4)則為27.25%。青銅器銘文當(dāng)然是與甲骨卜辭全然不同的文獻(xiàn)類型,具有與卜辭不同的體式,而其上述字頻特征卻與甲骨卜辭類同。這就意味著:甲骨文的字頻特點(diǎn)反映的是不是殷商文字的一種共性呢?這個(gè)結(jié)論可能還會(huì)遭到這樣的質(zhì)疑:無(wú)論是卜辭還是銘文,都是非常特殊另類的文獻(xiàn)種類,因此其字頻特點(diǎn)的時(shí)代代表性難以確認(rèn)。但種種情況表明:這種質(zhì)疑是不能成立的。首先,早期漢字,具體來(lái)說(shuō)是戰(zhàn)國(guó)以前的漢字的具體用途與后世有很大不同。我們?cè)?jīng)對(duì)《左傳》中關(guān)于文字使用的記錄做過(guò)窮盡性的調(diào)查(1),得到的相關(guān)結(jié)論是:(1)《左傳》時(shí)代的漢字決不介入中、下階層人群的社會(huì)生活,而僅僅為統(tǒng)治階級(jí)上層所用。(2)《左傳》記載中的文字應(yīng)用,又與人們的日常生活無(wú)涉,即便在統(tǒng)治階級(jí)上層也不例外。(3)《左傳》時(shí)代的文字,并不應(yīng)用于單純意義上的知識(shí)傳播。因而我們更不能期望在殷商時(shí)代就會(huì)存在如同后世主流文獻(xiàn)的種類。事實(shí)上,今天可以認(rèn)定確實(shí)存在的殷商出土文獻(xiàn)只是甲骨卜辭與銅器銘文而已,因此可以認(rèn)為甲骨卜辭之類就是可以反映當(dāng)時(shí)漢字基本特性的主流文獻(xiàn)。再換個(gè)角度來(lái)分析。殷商還有傳世文獻(xiàn),《尚書·多士》“惟殷先人,有典有冊(cè),殷革夏命”的記載可以證明當(dāng)時(shí)史官已用漢字記史,顯然這種文獻(xiàn)更加符合傳統(tǒng)的主流概念,其字頻特點(diǎn)是否也與卜辭類同呢?毫無(wú)疑問(wèn),這個(gè)問(wèn)題的答案能幫助我們進(jìn)一步確認(rèn)甲骨文字頻特征是否真的具有斷代屬性?!渡袝冯m有《商書》,但其4000余字的總字量很難滿足字頻研究的基本要求,更何況其時(shí)代的真實(shí)性也存在問(wèn)題。因而相對(duì)后出的《春秋》更能反映先秦史官文字的真實(shí)字頻狀況。關(guān)于春秋時(shí)代史官文字的特點(diǎn),可以通過(guò)讀解《左傳·宣公二年》中關(guān)于晉國(guó)史官董狐如何記下“趙盾弒其君”的官史文字的記述獲知一二,從中不難發(fā)現(xiàn),先秦史官記史必須恪守“書法(記史之法)”,而所謂“書法”,其實(shí)都是一些簡(jiǎn)約記事的手法。晉史如此,魯史也不會(huì)例外。歸結(jié)起來(lái)說(shuō),即使是類同于后世主流文獻(xiàn)的先秦史書,同樣呈現(xiàn)出文字對(duì)應(yīng)語(yǔ)言內(nèi)容的以簡(jiǎn)馭繁特性。就這一點(diǎn)而言,《春秋》之類先秦史書與甲骨卜辭并無(wú)本質(zhì)差異。(2),占總字量24.93%,1頻次字占單字總數(shù)的35.89%。按照兩端集中的指標(biāo)將其字頻狀況與甲骨文作比較,則可得出如下數(shù)據(jù):上表數(shù)據(jù)表明:相對(duì)現(xiàn)代漢字來(lái)說(shuō),兩端集中無(wú)疑是甲骨文和《春秋》字頻的共同特征。而它們?cè)诩卸壬系牟町?顯然與其時(shí)代距離有關(guān)。而《春秋》的字頻的兩端集中度與《新蔡》更為接近的事實(shí),更說(shuō)明了時(shí)代跨度是決定甲骨文與它們兩端集中度差異的根本原因。甲骨文字頻特征的殷商時(shí)代的斷代屬性,也由此得到了進(jìn)一步的證明。(二)期土樣形貌理論以上討論,主要涉及了高端集中的緣由闡釋,而對(duì)低端集中并未作多少分析說(shuō)解,以下的討論,將試圖彌補(bǔ)這一缺陷。而要弄清楚這一問(wèn)題,需要從具體材料的分析入手。不妨就《小屯》的一見字的用法類型作具體分析?!缎⊥汀芬灰娮址?95個(gè),其中因辭殘而用法不明者117字(3),因?yàn)橛梅ú幻?實(shí)際意味著它們究竟屬于何字尚不明確,因而只能將其視為無(wú)效數(shù)據(jù)加以排除。另有25個(gè)合文,作為古文字中特殊的文字種類,合文并不能為本視角的探討分析提供有效的評(píng)估性信息,所以也作排除處理。這樣,真正可以認(rèn)定的《小屯》一見字只是253個(gè),其中屬于專名類型的占了絕大多數(shù),達(dá)191個(gè)(4)。分別為:地名82個(gè),祭名42個(gè),人名38個(gè),方國(guó)名11個(gè),祭牲名5個(gè),用牲法5個(gè),神名7個(gè),官名1個(gè)。而屬于普通詞匯之列的62個(gè)(1),其中動(dòng)詞36個(gè),名詞17個(gè),副詞4個(gè),形容詞4個(gè),代詞1個(gè)。綜上,我們可以明確《小屯》一見字用法的基本狀況:大約四分之三為各類專名,四分之一所指則為一般詞匯。如何評(píng)估這種狀況呢?顯然也需要分層次進(jìn)行。作為目前可見最早的成系統(tǒng)的漢字材料,甲骨文當(dāng)然處于漢字發(fā)展的早期階段。而這樣一個(gè)早期階段實(shí)際在一定程度上具有由原始圖畫性或抽象刻畫符號(hào)類表意記事符號(hào)向成熟文字逐步過(guò)渡過(guò)程的性質(zhì),而在這個(gè)過(guò)程的兩端,同為視覺(jué)表意系統(tǒng)的重要差異就是表達(dá)符號(hào)的專用與通用性程度的不同:前者的特征就是圖形單位和意義單位的一一專門對(duì)應(yīng),而后者的特征則是以具有通用性的字形去對(duì)應(yīng)多個(gè)各不相同的語(yǔ)言單位。因此,在這個(gè)過(guò)程中,越是處于早期階段,出現(xiàn)次數(shù)不多的文字?jǐn)?shù)量也越多,而能夠獲得與之相對(duì)應(yīng)機(jī)會(huì)的,自然也是具有盡可能更早的時(shí)間屬性的專用性語(yǔ)言單位?!缎⊥汀芬灰娮值挠梅杏诘孛?、國(guó)族名、祭祀名等尤具歷史厚度的卜辭單位,正印證了上述邏輯聯(lián)系。因而低頻字群的多字?jǐn)?shù)集中度,同樣是衡量文字系統(tǒng)原始性的另一重要尺度。當(dāng)然,一見字的生成因由是多樣的,具體到《小屯》非專名類一見字,至少可以有這樣幾種理由來(lái)解釋它們的出現(xiàn):文字?jǐn)啻卣鞯淖饔?文獻(xiàn)用字?jǐn)?shù)量的限制和文獻(xiàn)內(nèi)容對(duì)文字單位的選擇性限制。值得注意的是,后兩者作用力的結(jié)果,都有可能影響字集中所有單位公平出現(xiàn)的機(jī)會(huì)。為用盡可能客觀
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 群文閱讀寓言的事與理說(shuō)課稿2024-2025學(xué)年統(tǒng)編版語(yǔ)文八年級(jí)上冊(cè)
- 25《少年閏土》說(shuō)課稿-2024-2025學(xué)年語(yǔ)文六年級(jí)上冊(cè)統(tǒng)編版
- 第二單元 3 公民意味著什么2023-2024學(xué)年六年級(jí)上冊(cè)道德與法治同步說(shuō)課稿(部編版)
- 好玩的手影游戲 (說(shuō)課稿)-2024-2025學(xué)年一年級(jí)上冊(cè)綜合實(shí)踐活動(dòng)山東科學(xué)技術(shù)版
- 2025年建筑項(xiàng)目采購(gòu)合同6篇
- 第八章第三節(jié)摩擦力第一課時(shí)說(shuō)課稿 -2023-2024學(xué)年人教版物理八年級(jí)下冊(cè)
- 人教版歷史與社會(huì)八年級(jí)下冊(cè)第五單元第一課第三框《農(nóng)耕文明的繁盛》說(shuō)課稿
- 第一單元第4課《身邊的信息系統(tǒng)》說(shuō)課稿 2023-2024學(xué)年浙教版(2020)初中信息技術(shù)七年級(jí)上冊(cè)
- 第6單元 習(xí)作:這兒真美 名師版2024-2025學(xué)年三年級(jí)語(yǔ)文上冊(cè)同步說(shuō)課稿(統(tǒng)編版)
- 二手房交易規(guī)范合同范本2024版B版
- 污水處理廠單位、分部、分項(xiàng)工程劃分
- 春節(jié)值班安全教育培訓(xùn)
- 舌咽神經(jīng)痛演示課件
- 子宮內(nèi)膜癌業(yè)務(wù)查房課件
- 社會(huì)學(xué)概論課件
- 華為經(jīng)營(yíng)管理-華為的研發(fā)管理(6版)
- C及C++程序設(shè)計(jì)課件
- 公路路基路面現(xiàn)場(chǎng)測(cè)試隨機(jī)選點(diǎn)記錄
- 國(guó)家自然科學(xué)基金(NSFC)申請(qǐng)書樣本
- 湖南省省級(jí)溫室氣體排放清單土地利用變化和林業(yè)部分
- 材料設(shè)備驗(yàn)收管理流程圖
評(píng)論
0/150
提交評(píng)論