數(shù)據(jù)開(kāi)源 | Magic Data中英文座艙功能點(diǎn)泛化語(yǔ)料
發(fā)布時(shí)間 : 2022-11-10 閱讀量 : 2049
在智能座艙中,人機(jī)交互是智能座艙與車(chē)內(nèi)人員關(guān)聯(lián)的橋梁,其中的人機(jī)交互技術(shù)主要涉及語(yǔ)音交互、文本交互。我們?cè)谂搩?nèi)所說(shuō)的內(nèi)容,會(huì)由交互系統(tǒng)轉(zhuǎn)換成語(yǔ)義文字,然后經(jīng)過(guò)后臺(tái)算法的決策,給出合理的反饋信息,最終系統(tǒng)才能聽(tīng)懂我們的表達(dá),做出相應(yīng)指令動(dòng)作。讓我們來(lái)看看智能座艙中功能點(diǎn)泛化語(yǔ)料相關(guān)的技術(shù)應(yīng)用。
人機(jī)交互的核心
人機(jī)交互的核心就是自然語(yǔ)言處理(NLP),也就是車(chē)載處理器可以理解人類(lèi)的語(yǔ)言(NLU),并且生成合理的反饋信息(NLG)。
人與汽車(chē)最基礎(chǔ)的交互就是指令詞的使用,但“打開(kāi)窗戶(hù)”這一句簡(jiǎn)單的命令,根據(jù)每個(gè)人的說(shuō)話(huà)習(xí)慣不同,同樣的指令可能會(huì)有幾十甚至幾百種表達(dá)方式。
如“請(qǐng)打開(kāi)車(chē)窗”、“幫我打開(kāi)車(chē)窗一下”、“開(kāi)一下窗”、“窗戶(hù)開(kāi)開(kāi)”。可能還會(huì)包含方言,如“幫俺打開(kāi)車(chē)窗”、“給俺開(kāi)下窗戶(hù)”、“把窗戶(hù)給俺弄開(kāi)”。此外也會(huì)有中英文混合、以及全英文的情況“幫我Open一下Window啦”、“Open the window please”。語(yǔ)音識(shí)別系統(tǒng)需要識(shí)別所有的可能性,才能更好的對(duì)應(yīng)到艙內(nèi)相應(yīng)的指令,完成指定操作。完整的自然語(yǔ)言人機(jī)交互的流程圖,如下所示:

上面車(chē)載交互中對(duì)于天氣的詢(xún)問(wèn)屬于自然語(yǔ)言技術(shù)支撐的搜索引擎,能夠在一定程度上理解人類(lèi)的自然語(yǔ)言,從自然語(yǔ)言中抽取出關(guān)鍵內(nèi)容并用于檢索,在兩者之間建立起更高效、更深層的信息傳遞。目前,上述技術(shù)主流方法都是基于復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,因此需要大量與場(chǎng)景匹配的語(yǔ)音、文本語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,以支持大體量數(shù)據(jù)的學(xué)習(xí),從而得到更好的效果。
艙內(nèi)泛化語(yǔ)料稀缺
智能座艙能夠直觀地提升視聽(tīng)娛樂(lè)和人機(jī)交互體驗(yàn),個(gè)性化、定制化的座艙配置和功能將成為車(chē)企的特色,提升品牌和車(chē)型認(rèn)知度。因此,智能座艙成為各大整車(chē)廠商及零部件供應(yīng)商的布局重點(diǎn)。但是由于人機(jī)交互的深度學(xué)習(xí)算法,依賴(lài)大量的數(shù)據(jù)訓(xùn)練,而高質(zhì)量數(shù)據(jù)的缺乏,是導(dǎo)致目前車(chē)載交互成本較高、準(zhǔn)確率低的重要原因之一。
由于車(chē)載場(chǎng)景的特殊性,導(dǎo)致車(chē)載場(chǎng)景的NLP數(shù)據(jù)非常稀缺,也是目前車(chē)載場(chǎng)景交互技術(shù)的壁壘。針對(duì)目前各智能交互系統(tǒng)普遍存在的冷啟動(dòng)無(wú)數(shù)據(jù)可用、產(chǎn)品車(chē)機(jī)交互功能覆蓋不足、長(zhǎng)尾命令識(shí)別性能較差等痛點(diǎn)。Magic Data構(gòu)建了本中文和英文座艙功能點(diǎn)泛化數(shù)據(jù)集。共有語(yǔ)料90,000+條,其中中文70,000+ 英文20,000+。同步持續(xù)更新,確保時(shí)效性。
Magic Data數(shù)據(jù)開(kāi)源:中英文座艙功能點(diǎn)泛化語(yǔ)料庫(kù)
Magic Data擁有中文和英文座艙功能點(diǎn)泛化語(yǔ)料庫(kù)90,000+條,本次開(kāi)源1000+語(yǔ)料,涉及常見(jiàn)的車(chē)載場(chǎng)景的指令詞,非常適合車(chē)載場(chǎng)景交互的研究與落地。
開(kāi)源的數(shù)據(jù)集包含眾多艙內(nèi)功能點(diǎn),包含了車(chē)內(nèi)外常用部件的關(guān)閉與打開(kāi)等意圖。如打開(kāi)藍(lán)牙、關(guān)閉車(chē)窗、調(diào)節(jié)攝像頭角度、調(diào)節(jié)方向盤(pán)、通話(huà)音量、打開(kāi)遠(yuǎn)光燈等等。句式多樣性豐富,同時(shí)對(duì)功能點(diǎn)的多樣性表達(dá)進(jìn)行泛化。這些泛化的命令文本具有較強(qiáng)的適用性,對(duì)傳統(tǒng)車(chē)企及新勢(shì)力車(chē)企的部件功能均兼容。
中文座艙功能點(diǎn)泛化語(yǔ)料庫(kù)
該開(kāi)源數(shù)據(jù)集包含500句中文座艙功能點(diǎn)泛化語(yǔ)料,涵蓋10種車(chē)載命令控制功能,每個(gè)功能相關(guān)含10-100種通用語(yǔ)料。
如開(kāi)啟車(chē)道保持、開(kāi)啟遮陽(yáng)簾、打開(kāi)遠(yuǎn)光燈、打開(kāi)藍(lán)牙、打開(kāi)WiFi、啟動(dòng)ESP等等。句式多樣性豐富,在語(yǔ)句結(jié)構(gòu)上充分考慮了動(dòng)詞、實(shí)體詞、句式及其組合,同時(shí)對(duì)功能點(diǎn)的多樣性表達(dá)進(jìn)行泛化,如車(chē)身穩(wěn)定系統(tǒng)=ESP,延時(shí)攝像=縮時(shí)錄像。在泛化部件功能時(shí)文本有預(yù)留Slot,涉及槽位有Position、Fraction、Percent等,如position=[前,后,左,右,中,左后方,全部]等。

- 中文座艙功能點(diǎn)泛化數(shù)據(jù)集:https://magichub.com/datasets/chinese-automobile-cabin-command-text-corpus/
英文座艙功能點(diǎn)泛化語(yǔ)料庫(kù)
該開(kāi)源數(shù)據(jù)集包含500句英文座艙功能點(diǎn)泛化語(yǔ)料,由具有駕駛經(jīng)驗(yàn)的以歐洲和美國(guó)英語(yǔ)為母語(yǔ)的人提供。涵蓋3個(gè)領(lǐng)域的16種車(chē)載命令控制功能,每個(gè)功能相關(guān)含2-100種通用語(yǔ)料。
如打開(kāi)藍(lán)牙Activate Bluetooth、車(chē)窗打開(kāi)百分比Set the window down to a quarter、調(diào)大通話(huà)音量Turn up the call volume by a notch、打開(kāi)遠(yuǎn)光燈Turn on high beam light等等。句式多樣性豐富,在語(yǔ)句結(jié)構(gòu)上充分考慮了動(dòng)詞、實(shí)體詞、句式及其組合,同時(shí)對(duì)功能點(diǎn)的多樣性表達(dá)進(jìn)行泛化,如Panoramic Camera=Omnidirectional Camera=Full View Camera。在泛化部件功能時(shí)文本有預(yù)留Slot,涉及槽位有Position、Fraction、Percent等,如Position=[Front, Real, Driver, Pilot, Rear Left, Real Right, Left, All]。

- 英文座艙功能點(diǎn)泛化數(shù)據(jù)集:https://magichub.com/datasets/english-automobile-cabin-command-text-corpus/
海量數(shù)據(jù)的開(kāi)源是眾多科研工作者的訴求,Magic Data希望通過(guò)開(kāi)源數(shù)據(jù)激發(fā)技術(shù)的革新,促進(jìn)行業(yè)進(jìn)步。
歡迎訪問(wèn) MagicHub 開(kāi)源社區(qū):https://magichub.com/