北京Magic Data創(chuàng)始人兼CEO張晴晴受邀在西北工業(yè)大學(xué)做報(bào)告分享
發(fā)布時(shí)間 : 2021-08-09 閱讀量 : 2036

CCF主辦的“人工智能系列報(bào)告”邀請(qǐng)函

西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院謝磊教授主持本次活動(dòng)

張晴晴博士現(xiàn)場(chǎng)做主題分享

張晴晴博士為現(xiàn)場(chǎng)聽眾講解對(duì)話式AI技術(shù)
近期,由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)、CCF語(yǔ)音對(duì)話與聽覺專委會(huì)、音頻語(yǔ)音與語(yǔ)言處理研究組聯(lián)合主辦的“人工智能系列報(bào)告”在西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院舉辦。北京Magic Data創(chuàng)始人兼 CEO張晴晴博士受邀做《多語(yǔ)種對(duì)話式AI技術(shù)及語(yǔ)料庫(kù)建設(shè)》的主題報(bào)告。
西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院謝磊教授擔(dān)任本次講座主持,張晴晴與現(xiàn)場(chǎng)聽眾分享對(duì)話式AI技術(shù),多語(yǔ)言識(shí)別系統(tǒng)可實(shí)用化的關(guān)鍵在于,如何解決非母語(yǔ)發(fā)音的插入語(yǔ)識(shí)別問(wèn)題。通過(guò)混合發(fā)音字典建模和混合雙語(yǔ)聲學(xué)建模角度,提高雙語(yǔ)識(shí)別的性能。
在介紹多語(yǔ)種語(yǔ)料庫(kù)建設(shè)上,北京Magic Data開發(fā)了超過(guò)60種語(yǔ)言的自有數(shù)據(jù)集,包括中文普通話、八大方言區(qū)方言、英語(yǔ)、日語(yǔ)等常用語(yǔ)種,還有馬來(lái)語(yǔ)、泰語(yǔ)、印尼語(yǔ)等特色語(yǔ)種。目前擁有超過(guò)150000小時(shí)自有數(shù)據(jù)集,其中包括超過(guò)90000小時(shí)對(duì)話式AI訓(xùn)練數(shù)據(jù)集、超過(guò)50000小時(shí)朗讀式數(shù)據(jù)集和超過(guò)10000小時(shí)自發(fā)式數(shù)據(jù)集。
自有數(shù)據(jù)集外,張晴晴還向聽眾介紹北京Magic Data研發(fā)的Annotator? 5.0標(biāo)注平臺(tái)、數(shù)據(jù)服務(wù)、MagicHub.io開源社區(qū)等公司核心產(chǎn)品和技術(shù)。MagicHub.io開源社區(qū)自4月份發(fā)布以來(lái),共開源超過(guò)50個(gè)數(shù)據(jù)集,覆蓋全球超過(guò)3000名AI開發(fā)者,數(shù)據(jù)累計(jì)下載量超過(guò)7000小時(shí)。
同時(shí),北京Magic Data近期還針對(duì)高校和企業(yè)開展“對(duì)話式AI語(yǔ)音識(shí)別及說(shuō)話人識(shí)別(ASR&SD)挑戰(zhàn)賽”,公司向參賽者提供訓(xùn)練數(shù)據(jù)集,鼓勵(lì)A(yù)I科研者和開發(fā)者積極參與比賽,促進(jìn)AI技術(shù)創(chuàng)新和應(yīng)用的發(fā)展。
聽眾們現(xiàn)場(chǎng)踴躍提問(wèn)和互動(dòng),交流觀點(diǎn)和心得,活動(dòng)對(duì)產(chǎn)學(xué)研之間互相促進(jìn),企業(yè)與高校間無(wú)縫溝通交流起到積極推動(dòng)作用。

活動(dòng)現(xiàn)場(chǎng)合影