(圖源康奈爾大學)
如果你在商務會議或安靜的圖書館中,不太可能大聲說出“Siri,檢查電子郵件”這樣的指令。因此,研發人員設計了一款名為Speechin的項鏈,它可以識別無聲指令。
該裝置由康奈爾大學的研究員開發,它建立在去年推出的NeckFace項鏈的基礎上,后者可以監測佩戴者的面部表情。
除了微處理器、電池和藍牙模塊,Speechin還配備了一個朝上的紅外攝像頭,可以對佩戴者的下巴進行成像。它通過一組延伸到兩側的“翅膀”保持住方向。為了解決隱私問題,它不會直接指向用戶的臉。
利用基于機器學習的算法,該設備能夠根據佩戴者的下巴運動來確定佩戴者在無聲地說出哪些命令。然后它可以將這些命令中繼到配對的智能手機。
該系統最初通過監測20名志愿者的下巴運動進行訓練。研究員讓志愿者默默地說出已知的單詞和短語——其中10人說英語,另外10人說普通話。在隨后的測試中,參與者說出了54個常用的英語命令以及44個普通話單詞和短語。
事實證明,這條項鏈在識別英語和普通話語音方面的準確率分別為90.5%和91.6%。當志愿者在行走時使用該設備時,這些數字會跟著下降。
研究員希望進一步發展該技術,讓其不僅可以用于安靜的環境,還可以用于智能手機無法聽到用戶聲音的嘈雜環境。此外,Speechin項鏈也可以供缺乏語言能力的人使用。
該研究論文題為"SpeeChin: A Smart Necklace for Silent Speech Recognition",已發表在Proceedings of the Association of Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies期刊上。
前瞻經濟學人APP資訊組
論文原文:https://dl.acm.org/doi/abs/10.1145/3494987
標簽: