#科技部將舉辦台灣語音辨識大賽
"正式賽則開放各界報名,預計於明年3月開賽,為期一年。陳良基說,雖然初次辦比賽,著重於國台語的語音辨識,但未來會逐步將客語、原住民各族族語的語音辨識列入。"
台灣目前確實很缺這塊,華碩本身也吃盡苦頭,這次大力贊助科技部也是其來有自。
目前講華語的機器人,基本上有幾個特色:
1. 台灣同胞說話的特色是台灣國語,混和國語跟台語,天龍國人講的是國語文法加上英語詞彙參雜其中,在第一關STT(speeck to text)就搞死一堆語音引擎。
2. 多半還是Command-Based聽指令的,如果你沒遵守它提供的公式講話,多半就是回你"我聽不懂你說的可不可以再說一次"。
3. 整個對話(Dialog)是套有版型的,也就是它講它的努力把對話講完,但人們會覺得有點莫名其妙。
4. 聽不懂就胡亂抓關鍵字(Keyword)丟去搜尋引擎,抓錯的時候也挺高的。
5. 語義的資料庫廣泛度嚴重的限縮,很多Domain都有待開發。
6. Chatbot後面串接的服務嚴重不夠,這部份台灣比較嚴重,因為台灣在互聯網的方便性與普遍性本就落後對岸很多。
總結一下,也就是語音聽不懂、語義資料庫不夠、後端服務不夠,造成用戶體驗很差,用沒多久就厭煩了。
這次科技部能舉辦這國台語的語音大賽,個人相當的支持,因為這部份真的是台灣AI服務的大斷層,期待本土團隊與廠商能儘快把這部份補起來。
#語音語義引擎
#Chatbot
Search