【摘要】 智能座艙是很多智能汽車廠商的主打概念,各大知名廠商都推出了自己的車載語音助手,將語音交互視為下一代人車交互方式,并在滿足用戶功能需求、情感需求的方向上持續進化。
【正文】近期,博泰車聯網聯手深聲科技(Deepsound.cn),為東風汽車集團旗下的高端電動品牌嵐圖,提供高度自由化、個性化、低門檻的自定義聲音服務。嵐圖H56、嵐圖H97車型的用戶,可定制車內的個性化音色,如將導航語音、語音助手替換為家人、明星、本人的音色,享受智能座艙語音交互新體驗。
小鵬汽車的小P、理想汽車的理想同學、蔚來的NOMI、嵐圖汽車的嵐圖,眾多新能源汽車品牌,都推出自己的車載語音助手,并通過OTA升級讓語音助手不斷進化。小鵬汽車語音負責人趙恒藝表示:“小鵬汽車認為未來車內交互的核心方式是語音而不是觸控。”為何眾多汽車廠商如此注重車載語音助手?
其實不難理解。
在傳統燃油車時代,通過旋鈕、按鈕、撥片等物理按鈕即可完成車內所有功能操作。但在智能化的新能源汽車時代,互聯網、物聯網、自動駕駛等技術的加持,使座艙承載的功能、信息急劇上升,全部使用物理按鈕已無法滿足當前需求。
一種解決思路是通過屏幕操作,車載屏幕也確實越來越大,理想ONE整車屏幕尺寸總和達50.9英寸,智己汽車也將屏幕尺寸提升至39英寸。大屏確實解決了信息輸出和展示問題,但用戶操作和輸入仍然是低效的,甚至由于操作層級增加導致操作成本進一步上升。實際行車過程中,若固定在位置上的駕駛員通過手指操控屏幕,對行車安全將造成極大威脅。
另一種解決思路,則通過智能語音交互完成人車對話,直接一個指令完成操作,理論上可以直達任何功能,不影響駕駛員眼睛、手、腳進行駕駛行為,相對于按鈕操作,更加安全、人性、直接。對于汽車廠商來說,語音助手將逐漸成為品牌和用戶最重要的交互方式,也是智能座艙的重要拼圖,這便不難理解汽車廠商對車載語音助手的情有獨鐘了。
一個受用戶青睞、使用率高的車載語音助手不僅應該滿足用戶的功能需求,更應該滿足情感需求、陪伴需求,讓語音助手就像你的愛人、小孩、朋友,讓座艙有溫馨、舒適的氛圍,實打實提升駕乘體驗,也是在提升汽車廠商的軟實力。
車載語音如何滿足情感需求和陪伴需求?各個廠商各顯神通,綜合技術可行性、成本、用戶體驗各方面,可以把聲音克隆作為一個重要的參考選項。試想一下,上了一天班,滿身疲憊,坐進車內時,便是孩子調皮、甜美的問候,是否疲勞會減去大半?堵車時,有朋友和你開啟“閑聊模式”,是否少了一些枯燥?到達陌生的城市時,有個熟悉的聲音在旁邊指路,是否就少了一些焦躁呢?
聽起來好像有點科幻,但與深聲科技CEO周俊明的溝通中,我們了解到,聲音克隆技術已經較為成熟,早在2020年春季的發布的小米10中,就已經搭載了深聲科技提供的聲音克隆服務,受到廣大米粉追捧。用戶僅需配合朗讀20句話短文本,大約錄音90秒,就能快速克隆出自己的聲音,將個人的情感表達、發音特點等信息遷移到合成聲音中,就連口音也能很好地克隆出來。
那么這種手機終端上的技術,運用到汽車座艙內是否可行?
答案是可行,甚至比手機終端的錄音效果更好。一方面新能源汽車使用電機驅動而非燃油發動機,車內靜謐性好,關上門窗之后便是一個絕佳的錄音室;另外大部分主打智能座艙的車輛都有麥克風陣列,各個位置都有對應麥克風,隔音降噪效果較好。除此之外,錄音過程也可通過手機,在APP或小程序上進行,操作便捷,同個品牌下的車主還可以互相分享自己的音色,具有一定的可玩性。
當然,聲音克隆也引發我們對于隱私安全問題的擔憂——是否自己隨意說出的幾句話,會導致自己的音色被克隆,引發詐騙或隱私泄露?
作為技術服務的輸出方,深聲科技也十分關注如何規避這項技術的非法應用,在推出之前就考慮了到法律倫理的問題,并給出了三點應對方案:
一是將聲音克隆能力只授權給那些有控制能力的企業客戶,對于C端用戶來講,只有選擇音色的權限,沒有自定義克隆聲音內容的權限;
二是加強對內容安全的嚴格審核。不支持用戶用隨意一段語音進行克隆,要求用戶對指定文本進行錄音,從而降低聲音被利用的風險;
三是通過身份認證、結合生物識別等技術,以限制聲音克隆的使用。
其實聲音克隆技術,并非深聲科技所獨有,但與競爭對手相比,周俊明表示:“聲音克隆技術上,我們在音色還原度、發音準確率、音質清晰度等方面,具有明顯的優勢。讓聲音服務好每個人的生活是我們的愿景,深聲致力于將語音AI技術融入人們生活的點滴之中,賦予企業和用戶以創新與科技力量來創造更美好的世界。”
智能語音交互將是未來汽車重要的人車交互方式,是用戶對智能座艙的重要感知點,非常需要“Think Big”,聲音克隆允許用戶自定義語音音色,在一定程度上是一個具備想象力的解決方案,相信在未來,會有越來越多的智能汽車廠商,還有像深聲科技這樣的人工智能科技企業,為用戶提供更豐富的解決方案,真正讓聲音服務好每一次旅途!
標簽: