首頁
歡迎來到FormosanBank,這個以建置大規模資料庫為導向的計畫,此計畫專注於保存與復振臺灣的原住民族語言。臺灣原住民族語言在南島語系中具有相當特殊且重要的地位,但目前正處於瀕危的狀態,其中一些甚至有滅絕的風險,我們的使命是為這些語言創建一個全面、機器可讀取的語料庫,以促進語言學研究、語言教育及族語復振等工作。
在這裡,您可以找到關於收集和處理16族臺灣原住民族語言語料庫的說明,這些語料涵蓋超過800萬個詞彙單位以及超過730小時的語音資料(詳細資訊請參見此處),我們還提供這些語料結構的說明和存取方式的介紹。您也可以從GitHub(這裡)了解FormosanBank相關的工作及語料,而所有語音檔案則存於此處。
在此感謝許多個人、學者、合作夥伴及機構單位的共同努力,FormosanBank資料庫才能在短時間內建置完成,並已具如此大規模!
計畫主持人
諮詢委員會
阮玄
Ūi-iū Kán
以及所有的貢獻者。
Last updated