排灣故事

概述

排灣故事語料庫是一個小型的兒童故事集,內容以東排灣語為主,故事集能展現在族人導向語境中東排灣語寶貴的文化和語言見解。將其納入FormosanBank,能擴大可用語料的範圍,亦能窺探傳統知識、日常生活以及兒童學習的排灣語環境。

來源材料

  • gesi giling & tjaiwan giling (2020) vuvu 的寶物 / kavatjes ni vuvu

  • gesi giling & tjaiwan giling (2021) dingding蝸牛

  • gesi giling & tjaiwan giling (2022) maljialjian a qaciljay


語料庫處理

將排灣故事整合到 FormosanBank 的標準化 XML 格式中,以確保一致性和可取性。

處理備註

  • 手動轉換:由於這些文本的規模較小、敘事複雜,且其原始材料為PDF格式,難以自動解析,因此XML是手動創建的,而非透過自動化程式進行轉換。

  • 清理與標準化:在手動處理時均已標準化。

  • 最低限度編輯:拼寫法和格式調整保持在最低限度,保留作者對語言的原始表現方式,僅進行輕微清理,如刪除空元素和標準化標點符號,以保持語料的一致性。


存取資訊

  • 包含排灣故事語料庫、FormosanBank的標準化 XML 語料庫及重建語料庫的程式碼的資料庫等,可以在此找到。


版權

這些故事可以在創用CC BY-NC授權下使用。


引用說明

根據我們的使用條款,若您在任何出版物中使用此語料庫或任何從此語料庫衍生的產品,您必須同時引用FormosanBank以及以下資料:

  • Juan, T. F., & Ruan, X. (2024). Corpus of Paiwan stories [Electronic resource].

Last updated