FormosanBank
中文
中文
  • 首頁
  • 背景
    • 臺灣南島語
    • 為何是臺灣南島語?
    • FormosanBank
    • 貢獻者
  • 語料庫架構
    • FormosanBank的XML格式
    • 臺灣南島語方言
    • 語料庫
      • 族語E樂園
      • 原語會族語線上辭典
      • 維基百科
      • 總統道歉文
      • 國立臺灣大學排灣語自動語音辨識
      • Virginia Fey阿美語辭典
      • 排灣故事
  • 其他资源
    • 電子報
      • 2024年10月
      • 2023年9月
    • 出版物
    • 使用條款
    • 捐款給FormosanBank
Powered by GitBook
On this page
  • 概述
  • 語料庫處理
  • 存取資訊
  • 版權
  • 引用說明
  1. 語料庫架構
  2. 語料庫

排灣故事

概述

排灣故事語料庫是一個小型的兒童故事集,內容以東排灣語為主,故事集能展現在族人導向語境中東排灣語寶貴的文化和語言見解。將其納入FormosanBank,能擴大可用語料的範圍,亦能窺探傳統知識、日常生活以及兒童學習的排灣語環境。

來源材料

  • gesi giling & tjaiwan giling (2020) vuvu 的寶物 / kavatjes ni vuvu

  • gesi giling & tjaiwan giling (2021) dingding蝸牛

  • gesi giling & tjaiwan giling (2022) maljialjian a qaciljay


語料庫處理

將排灣故事整合到 FormosanBank 的標準化 XML 格式中,以確保一致性和可取性。

處理備註

  • 手動轉換:由於這些文本的規模較小、敘事複雜,且其原始材料為PDF格式,難以自動解析,因此XML是手動創建的,而非透過自動化程式進行轉換。

  • 清理與標準化:在手動處理時均已標準化。

  • 最低限度編輯:拼寫法和格式調整保持在最低限度,保留作者對語言的原始表現方式,僅進行輕微清理,如刪除空元素和標準化標點符號,以保持語料的一致性。


存取資訊


版權

這些故事可以在創用CC BY-NC授權下使用。


引用說明

  • Juan, T. F., & Ruan, X. (2024). Corpus of Paiwan stories [Electronic resource].

PreviousVirginia Fey阿美語辭典Next電子報

Last updated 3 months ago

包含排灣故事語料庫、FormosanBank的標準化 XML 語料庫及重建語料庫的程式碼的資料庫等,可以找到。

根據我們的,若您在任何出版物中使用此語料庫或任何從此語料庫衍生的產品,您必須同時引用FormosanBank以及以下資料:

在此
使用條款