Go to Content Area :::
   
:::
Home/Research/Curriculum & Instruction

Research Center For Translation, Compilation and Language Education | 吳鑑城 副研究員

  若將學習語言視為興建一座建築物,文法就像是建築物的骨架,詞彙則是骨架上一片片的磚瓦,骨架固然重要,詞彙量若不足,語言能力仍難以提升,並連帶影響表達以及理解的能力。隨著學習者對專業領域(如商務、觀光等)的語用需求,專業英語(English for Specific Purpose, ESP)、專業華語(Chinese for Specific Purpose, CSP)等藉由教師依照專業領域及情境,教導學習者具備特定領域溝通之能力的專業語言教學概念也因應而生。而考量詞彙運用在不同領域的差異,研究者或教學者也開始建置各專業領域的詞表,以使教學時能更有成效。然而,若僅靠人工進行詞表編輯,不僅耗時費力,也容易有所遺漏。因此,本研究嘗試透過電腦輔助,從約3億8,100萬詞的5年份新聞資料所構成的語料庫中,自動蒐集特定專業領域詞彙的候選詞,供後續領域詞彙表編輯之參考。

  本研究透過先蒐集既有的領域詞彙並經過篩選後,作為運用詞向量(word embedding)技術進行自動化蒐集時的種子詞彙,進而尋找其他同領域的詞彙。詞向量簡單而言,就是將每個目標詞利用一個向量(vector)去表示,而目標詞的向量則是由目標詞在文章中前後文共同出現過的詞彙所建構而成。因此,當兩個詞彙的詞向量越相似,表示著彼此常鄰近的詞彙越相近,也意味著他們使用的情境越加相近。

……【全文詳見相關連結內容】
Home Sitemap FAQ Feedback Mailbox 中文
facebook youtube