【摘 要】近年來(lái),隨著語(yǔ)料庫(kù)語(yǔ)言學(xué)的不斷發(fā)展,很多專門用途的英語(yǔ)語(yǔ)料庫(kù)應(yīng)運(yùn)而生。但對(duì)于學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的研究還處于空白階段。本文介紹了語(yǔ)料庫(kù)的定義和分類,闡述了學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的必要性,探討了學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的設(shè)計(jì)思想和具體方法,以期對(duì)學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)有所裨益。
【關(guān)鍵詞】學(xué)前英語(yǔ)語(yǔ)料庫(kù);建設(shè);設(shè)計(jì)思想;具體方法
一、語(yǔ)料庫(kù)的定義
語(yǔ)料庫(kù)的英文是“corpus”,有“全集”的意思。學(xué)者們對(duì)語(yǔ)料庫(kù)的具體定義不盡相同。學(xué)者 John Sinclair 認(rèn)為:“語(yǔ)料庫(kù)是按明確的語(yǔ)言學(xué)標(biāo)準(zhǔn)選擇并排序的語(yǔ)言運(yùn)用材料匯集,旨在用作語(yǔ)言的樣本”[1]。我國(guó)學(xué)者俞士汶提出:“在現(xiàn)在語(yǔ)言學(xué)的意義上,對(duì)語(yǔ)料庫(kù)的認(rèn)識(shí)應(yīng)該包含以下三點(diǎn):語(yǔ)料庫(kù)中存放的是在語(yǔ)言的實(shí)際使用中真實(shí)出現(xiàn)過(guò)的語(yǔ)言材料;語(yǔ)料庫(kù)是以電子計(jì)算機(jī)為載體承載的語(yǔ)言知識(shí)的基礎(chǔ)資源;真實(shí)語(yǔ)料需要經(jīng)過(guò)分析、加工、處理,才能成為有用的基礎(chǔ)資源”[2]。從學(xué)者們對(duì)語(yǔ)料庫(kù)的定義,我們可以歸納出:語(yǔ)料庫(kù)是一個(gè)按照一定的標(biāo)準(zhǔn)采集而來(lái)的,能夠代表一種語(yǔ)言或者某種語(yǔ)言的一種電子文本集。
二、學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的必要性
學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的必要性體現(xiàn)在以下兩個(gè)方面:第一,學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)為學(xué)前英語(yǔ)教學(xué)提供了新思路和新途徑,對(duì)學(xué)前英語(yǔ)教學(xué)的理論、內(nèi)容和方法等不同方面均產(chǎn)生極大的影響。首先,學(xué)前英語(yǔ)語(yǔ)料庫(kù)為學(xué)前英語(yǔ)教學(xué)提供大量生動(dòng)的教學(xué)范例。其次,學(xué)前英語(yǔ)語(yǔ)料庫(kù)還為學(xué)前英語(yǔ)教學(xué)課件編寫提供新的教學(xué)資源。第二,學(xué)前英語(yǔ)語(yǔ)料庫(kù)作為一種輔助性工具,它為從事學(xué)前英語(yǔ)研究的學(xué)者們提供學(xué)前英語(yǔ)的詞匯、語(yǔ)法、篇章等各個(gè)層面的語(yǔ)料,使他們的研究可以更系統(tǒng)和深入,從而使他們的研究成果更具解釋力和信服力?傊,學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)與學(xué)前英語(yǔ)教學(xué)和研究緊密結(jié)合,是推動(dòng)學(xué)前英語(yǔ)發(fā)展的一種必然。
三、學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的總體設(shè)計(jì)
1.建庫(kù)目的語(yǔ)料庫(kù)的建設(shè)必須有明確的目的,因?yàn)椴煌哪康暮陀猛緵Q定了語(yǔ)料的類型、語(yǔ)料庫(kù)的大小和基本結(jié)構(gòu)。要明確目的,首先要明確的是其基本用途和應(yīng)用范圍。學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)主要是滿足學(xué)前英語(yǔ)教學(xué)研究、學(xué)前英語(yǔ)翻譯研究和學(xué)前英語(yǔ)語(yǔ)言學(xué)研究的需求,其應(yīng)用范圍包括學(xué)前英語(yǔ)信息查詢、學(xué)前英語(yǔ)教學(xué)、學(xué)前英語(yǔ)教材編寫、學(xué)前英語(yǔ)翻譯研究、學(xué)前英語(yǔ)詞典編撰等領(lǐng)域。
2.語(yǔ)料庫(kù)規(guī)模學(xué)者 Kennedy,1998 指出進(jìn)行句法研究和高頻詞匯的研究一般要求語(yǔ)料庫(kù)規(guī)模在 50- 100 萬(wàn)詞次之間。根據(jù)學(xué)前英語(yǔ)語(yǔ)料庫(kù)的使用目的,學(xué)前英語(yǔ)語(yǔ)料庫(kù)初步設(shè)計(jì)容量規(guī)模為 100 萬(wàn)詞次的語(yǔ)料庫(kù),抽取 500 篇每篇長(zhǎng)度約為 2000 個(gè)詞左右的樣本,取樣時(shí)間跨度為 1990 年至今,其后根據(jù)現(xiàn)實(shí)需要繼續(xù)擴(kuò)展。
3.語(yǔ)料庫(kù)結(jié)構(gòu)學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)在參考中圖分類及國(guó)內(nèi)院校開設(shè)學(xué)前相關(guān)專業(yè)的主要課程設(shè)置的基礎(chǔ)上,主要由以下六個(gè)模塊組成:(1)學(xué)前教育學(xué)科模塊,具體包括:學(xué)前教育學(xué)、學(xué)前心理學(xué)、學(xué)前兒童發(fā)展心理學(xué)、中外學(xué)前教育簡(jiǎn)史;(2)學(xué)前教師教育模塊,具體包括:幼兒園教育活動(dòng)設(shè)計(jì)與指導(dǎo)、學(xué)前兒童教育(學(xué)前兒童社會(huì)教育、學(xué)前兒童語(yǔ)言教育、學(xué)前兒童科學(xué)教育、學(xué)前兒童健康教育、學(xué)前兒童藝術(shù)教育);(3)學(xué)前游戲模塊,具體包括:學(xué)前兒童游戲、兒童游戲通論、幼兒園環(huán)境創(chuàng)設(shè)、幼兒玩具制作與指導(dǎo);(4)學(xué)前兒童保健模塊,具體包括:學(xué)前衛(wèi)生學(xué)、幼兒營(yíng)養(yǎng)學(xué)、兒童生活保健、兒童心理保健;(5)學(xué)前兒童文學(xué)模塊,具體包括:學(xué)前兒童文學(xué)、中外優(yōu)秀兒童文學(xué)賞析、幼兒文學(xué)創(chuàng)作;(6)幼兒園管理模塊,具體包括:幼兒園管理、幼兒園經(jīng)營(yíng)與管理、幼兒園組織與管理、幼兒教育政策與法規(guī)。
四、學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的具體方法
1.語(yǔ)料抽樣關(guān)于抽樣,我國(guó)學(xué)者郭曙綸指出“選取語(yǔ)料首先需要在實(shí)際使用的語(yǔ)料中確定一個(gè)范圍,稱為母本;被選入庫(kù)的語(yǔ)料稱為樣本。由母本取得樣本的過(guò)程叫作抽樣”[3]。學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)是在確定學(xué)前英語(yǔ)語(yǔ)料庫(kù)規(guī)模的基礎(chǔ)上,根據(jù)統(tǒng)計(jì)學(xué)原理進(jìn)行科學(xué)抽樣,使所建的學(xué)前英語(yǔ)語(yǔ)料庫(kù)達(dá)到總體效度的標(biāo)準(zhǔn)。要進(jìn)行學(xué)前英語(yǔ)語(yǔ)料庫(kù)的抽樣首先需要考慮語(yǔ)料庫(kù)抽樣的范圍、抽樣的原則和抽樣的方法。
2.語(yǔ)料標(biāo)注我國(guó)學(xué)者楊惠中列舉了標(biāo)注的幾種層次:“(1) 經(jīng)過(guò)格式屬性標(biāo)注,如段落、字體、字號(hào)進(jìn)行標(biāo)注;(2)對(duì)識(shí)別信息進(jìn)行標(biāo)注,如作者、體裁、語(yǔ)域以及詞性等標(biāo)注;(3)特殊標(biāo)注,如特殊賦碼等”[5]。語(yǔ)料標(biāo)注的過(guò)程豐富了電子文本語(yǔ)料庫(kù)的內(nèi)容,經(jīng)過(guò)標(biāo)注的語(yǔ)料庫(kù)被賦予了各種語(yǔ)言信息,同時(shí)擴(kuò)展了語(yǔ)料庫(kù)在語(yǔ)言學(xué)分析上的潛在用途,其意義是不言而喻的。語(yǔ)料的標(biāo)注是學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)的重要環(huán)節(jié),也是體現(xiàn)學(xué)前英語(yǔ)語(yǔ)料庫(kù)建設(shè)水平的重要標(biāo)志。
3.語(yǔ)料來(lái)源學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)采用現(xiàn)有的以電子形式存在的語(yǔ)料為主,鍵盤手工輸入語(yǔ)料和光學(xué)掃描語(yǔ)料為輔的數(shù)據(jù)獲取方式。在實(shí)際建庫(kù)時(shí),要注意以下兩個(gè)方面:(1)在采用現(xiàn)有的以電子形式存在的語(yǔ)料為語(yǔ)料來(lái)源時(shí),必須對(duì)以電子形式存在的語(yǔ)料進(jìn)行細(xì)致、嚴(yán)格的校對(duì);(2)通過(guò)鍵盤手工輸入語(yǔ)料時(shí),容易出現(xiàn)錯(cuò)誤,后期需要用拼寫和語(yǔ)法檢查功能進(jìn)行校正。
4.數(shù)據(jù)管理方式語(yǔ)料庫(kù)的數(shù)據(jù)管理方式是指借助計(jì)算機(jī)進(jìn)行的語(yǔ)料的管理。以 XML 語(yǔ)言作為語(yǔ)料文件的組織格式是國(guó)際上的主流格式。學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)也應(yīng)采用這種文件管理方式,原因在于 XML 格式的文件管理方式的以下三個(gè)主要特征:“高度靈活,擴(kuò)展性強(qiáng),其自身并不包括任何預(yù)設(shè)的標(biāo)簽,而是由使用者自己設(shè)計(jì);XML 文件結(jié)構(gòu)完整,句法嚴(yán)謹(jǐn);適用于意義的描述,而不是格式的呈現(xiàn)”。
五、結(jié)束語(yǔ)
學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)為學(xué)前英語(yǔ)教學(xué)提供了一個(gè)全新的思路,也為從事學(xué)前英語(yǔ)研究者們提供一個(gè)分析和研究學(xué)前英語(yǔ)的載體。但語(yǔ)料庫(kù)的建設(shè)是一個(gè)繁雜而精細(xì)的系統(tǒng)工程,需要大量的人力物力。本文僅對(duì)建庫(kù)幾個(gè)主要步驟進(jìn)行了探討,更詳細(xì)具體的建設(shè)思路和方法還需要繼續(xù)完善,期望對(duì)學(xué)前英語(yǔ)語(yǔ)料庫(kù)的建設(shè)有所幫助。
【參考文獻(xiàn)】
[1] John Sinclair. Corpus Concordance and Collocation[M]. England: Oxford University,1991:185. [2]俞士汶. 語(yǔ)料庫(kù)與綜合型語(yǔ)言知識(shí)庫(kù)的建設(shè)[M]. 北京:科學(xué)出版社,2003:7.
相關(guān)推薦:小學(xué)英語(yǔ)課題研究容易做嗎
轉(zhuǎn)載請(qǐng)注明來(lái)自:http://www.jinnzone.com/xueqianjiaoyulw/68728.html