排灣故事
概述
排灣故事語料庫是一個小型的兒童故事集,內容以東排灣語為主,故事集能展現在族人導向語境中東排灣語寶貴的文化和語言見解。將其納入FormosanBank,能擴大可用語料的範圍,亦能窺探傳統知識、日常生活以及兒童學習的排灣語環境。
來源材料
gesi giling & tjaiwan giling (2020) vuvu 的寶物 / kavatjes ni vuvu
gesi giling & tjaiwan giling (2021) dingding蝸牛
gesi giling & tjaiwan giling (2022) maljialjian a qaciljay
語料庫處理
將排灣故事整合到 FormosanBank 的標準化 XML 格式中,以確保一致性和可取性。
處理備註
手動轉換:由於這些文本的規模較小、敘事複雜,且其原始材料為PDF格式,難以自動解析,因此XML是手動創建的,而非透過自動化程式進行轉換。
清理與標準化:在手動處理時均已標準化。
最低限度編輯:拼寫法和格式調整保持在最低限度,保留作者對語言的原始表現方式,僅進行輕微清理,如刪除空元素和標準化標點符號,以保持語料的一致性。
存取資訊
包含排灣故事語料庫、FormosanBank的標準化 XML 語料庫及重建語料庫的程式碼的資料庫等,可以在此找到。
版權
這些故事可以在創用CC BY-NC授權下使用。
引用說明
根據我們的使用條款,若您在任何出版物中使用此語料庫或任何從此語料庫衍生的產品,您必須同時引用FormosanBank以及以下資料:
Juan, T. F., & Ruan, X. (2024). Corpus of Paiwan stories [Electronic resource].
Last updated