該數據集專為訓練更懂口語表達的AI模型打造,有利于提升西班牙語語音識別的自然交互能力,覆蓋多場景真實對話,由多樣化人群錄制,字準率高。強化對連誦、吞音等特性的標注,合理標點還原西語熱情洋溢的韻律節奏,高完整度語句助力模型理解復雜動詞變位句式,提升識別魯棒性。
語種
西班牙語
數據風格
spontaneous
比特率
16bits
聲道
1
時長
5000+小時
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態數據
涵蓋多領域的對話式、朗讀式及自發式數據
人機協同高精度標注