Go to Content Area :::
   
:::
Home/Research/Compilation, Translation and Language Education

語文教育及編譯研究中心 | 白明弘 副研究員

齊夫定律揭示詞彙使用的不均衡現象

  語言學著名的齊夫定律 (Zipf's law) 描述了詞彙在真實語言使用情境中極度不均衡的現象。藉由大量文章的統計,我們得以統計出詞彙在實際語言使用的頻次表。將頻次表依出現次數由高而低排列,就可以觀察到齊夫定律的現象(如表1):排名序位第20名的詞的頻次大約是排名第10名的一半;而第100名的詞大約是第10名的1/10。齊夫定律的通則就是詞頻和序位的倒數成正比(頻率∝1/序位)。

  從另一個角度來說明,齊夫定律反應了詞彙使用極度不均衡的現象:語料庫中 99% 的頻次是由最高頻的 1% 詞彙所貢獻。我們實際統計約10億頻次 (tokens) 的美國COCA語料庫,其中大約由數十萬個相異英文詞 (types) 所構成,但這數十萬詞大部分的出現頻率都極低。最高頻的前100 詞大約就貢獻了5億頻次(將近50%)。......【全文請見相關連結內容】

Home Sitemap FAQ Feedback Mailbox 中文
facebook youtube