什麼是語料庫?

讓我們先看看wiki中的定義

 In linguistics, a corpus (plural corpora) or text corpus is a large and structured set of texts (now usually electronically stored and processed). They are used to do statistical analysis, checking occurrences or validating linguistic rules on a specific universe.
(在語言學中,語料庫或文字語料庫是一種大型結構化的文字組合(現在通常是以電子形式儲存運作)。通常用於在特定的領域中進行語言的統計分析、區別常用性及證實語言規則)

藉由使用語料庫
使用者可以迅速的了解某個字詞在所有情境下的運用
語料庫有分情境
例如學術論文寫作語料庫
若使用這樣的語料庫
找到的就都是這樣的字詞在寫作中的使用方法
舉例:
TOTALrecall關鍵詞檢索
在這裡可以看見的語料就是從著名的雙語雜誌光華引出的
只要打入你想要查詢的字詞
就可以迅速的找到所有曾經出現的相關用法

這樣的搭配詞
我們給他一個名稱叫做concordancer
concord就是協調、一致的意思
所以這樣的用法意義
就是你所查到的前後用法會與該詞相合
搭配下會出現良好的運用

使用語料庫有什麼好處呢?

第 一個重點是可以區分出許多的例外
語言使用上有約70%是合乎邏輯、系統化的
另外的30%則是複雜的例外
經過分析
語言研究/學習者可以了解例外出現的狀況

第二個好處是透過使用語料庫
尤其是像上面的光華中英對照語料庫
翻譯者可以迅速的找到相對應的字詞
可以更加準確並提高效率

第三個好處是區分語言使用場景以及重要性
根據上課中所提供的資料
名詞、動詞、以及人稱代名詞的使用次序
在一般對話中:三個比例所佔比重幾乎相同
隨著狀況移轉到教室教學英文、教科書、以及學術期刊
名詞比重越來越重
動詞與人稱代名詞情況則越來越少
且差距非常懸殊
由此我們就可以看出不同的情況下
所需要重視的詞性教學是哪個

第四個好處是可以區分教文法時應該搭配什麼樣的動詞教學
例如加上that子句的動詞有哪些呢?
以下是頻率排序:think(2000)、say(1250)、know(750)、guess(480)
其他所有動詞相加(1550)
所以可以得知
要學習加上that子句的句型時
think, say, know, guess絕對是必教的動詞組合

第五個好處是藉由讓學生自行使用
可以加深學生的學習能力以及學習效果
研究指出
學生藉由使用語料庫
可以增進字彙能力以及對單字的了解
學生完成分析後
進一步消化也就內化了
為良好的教室內應用模式

所以別等待
從現在開始運用語料庫學習吧 :)





arrow
arrow
    全站熱搜

    crusader 發表在 痞客邦 留言(1) 人氣()