《“百變金剛”是怎樣煉成的》
By Design0618 Group
當初發起創辦達摩院時,馬云是這樣說的:研究不應該是Research for Fun(為快樂研究),也不應該Research for Profit(為利潤研究),而是Research for solving the problem with Profit and Fun(為解決問題研究并帶來利潤和快樂)。For fun走得太遠,for profit走得太近,都走不長。一個企業做得多大,在于企業解決多大的社會問題。這是阿里巴巴思考的邏輯。
阿里巴巴“機器人實驗室”設計團隊,秉承這樣一種設計理念,力求規劃全系統模組化的服務機器人系列,打造“百變金剛”。
針對機器人領域的重新思考與定位
我們專注“AI-機器人”領域,“Alibaba自身平臺化”能力是贏得客戶信賴的優勢,我們認為將這一優勢在設計上最大化是機器人規劃&設計工作的核心目標。為此我們提出“泛模組化”的產品規劃理念?!胺耗=M化”旨在將產品按功能分區最大程度進行拆分,包括:硬件功能模組,系統感知模組,人機交互模組以及關鍵功能模組內的“模塊化” ,以實現自由組合,適應更多工況的目的。各模組內小模塊間解偶,便于單獨研發、管控。同時將各功能模塊上升到產品層級,同樣受產品PI約束。
在“未來社區,一云多端”的大背景下,為了使平臺化優勢能夠更直接清晰的傳達給客戶,我們需要在感官層面建立同樣使客戶信賴的產品形象:1.視覺感受。確立與自身定位相符的產品風格,建立“專業領域-自身品牌-產品”之間的對應關系。2.使用感受。在產品使用階段通過融合傳感器技術的人機系統設計、功能性細節設計使用戶獲得良好的人機體驗,從而建立用戶對產品性能和功能認知的信賴。
“S-Heart人機交互系統”應用實例
近年來,由于機器人產業的發展,各類機器人產品形態種類繁多,缺乏統一的行業可通設計標準,混亂無序的機器人人機交互模式,導致用戶與機器人認知、使用及有效交互的成本增加,造成各類使用困惑甚至人身風險。
“S-Heart”是阿里巴巴機器人團隊在“泛模組化”的服務機器人系列的產品規劃設計中研發的,基于一整套有效的軟、硬件功能模組,可智慧適配各類不同場景的機器人人機交互系統。
硬件部分我們將底盤運動模塊根據不同工況可變換室、內外兩種形式。中部業務功能模塊進行了最優的可變標準化設計。人機交互模塊結合多種傳感器感知融合,實現了視覺,語音,屏幕,表情、燈光等立體多模態交互手段,更大程度的提升用戶使用體驗實現人機融合。機體后方預留了特種功能擴展模塊,是針對未來不同場景的功能需求變化及設備外接等做了預留接口的模組化設計。
(圖1 S-Heart硬件“泛模組化”組合設計實例)
人機交互系統部分通過多傳感器的感知融合,充分協同,獲得全面的環境感知信息,有效調度機器人的各項軟、硬件能力,自動適配不同場景的智慧服務中不同模態間完美的補充與共振的平衡,打通人機交互通路,形成細膩、多維的服務機器人使用者體驗。此系統包括了完整專業的語音、燈光、手勢、音效、接口等交互內容,基于“Service Heart”的設計理念,以“Service Personality”(服務型人格)形成自然、統一的體系,在酒店、展館、醫療、敬老院等場景下,為使用者帶來高質量的智能服務體驗。
機器人與人的交互,依據遠、中、近距離及實際環境情況選擇適當的多模態交互方式,有效避免人對于機器人表達意圖的誤判,建立人機信息通路。例如:在嘈雜環境下不能準確地使用語音交互時,此時上位機就會調度燈光主動交互或是觸控屏交互等方式補充,讓人理解機器人在場景中想表達的狀態。當機器人在行進中由于不停地移動,機身上屏幕顯示的提示文字無法準確地被使用者感知,此時需要輔以語音交互或燈光等補充的交互方式。
(圖2 人器交互的空間尺度)
經過了多個機器人的業務經驗,沉淀了機器人業務中會出現的多種狀態的共性。我們將機器人服務室內、外業務場景流程模塊化,而每個業務流程中的模塊設計了相應的多模態交互組合, 這些組合包含了屏幕、手勢、燈光、語音、人臉交互,甚至包括運動速度、轉彎半徑、安全距離等等,賦予機器人在業務場景中完成任務的能力。舉例來說,當機器人感知自己在A場景中時,A場景中的多模態交互組合(比如:語音+屏幕)會被機器人系統主動調度,而當機器人移動到B場景中時,B場景中的多模態交互組合(比如:語音+燈光)會主動被觸發。有了這些多模態交互組合后,便可將機器人應用至多場景,并拓展到多人多機的體系化,將機器人、機械臂、智能硬件等的各個感官做了“體驗感受對齊“的設定,來降低用戶的困惑,讓操作機器人的用戶能明白機器人的意圖,進而提升用戶對機器人體驗的一致性,建立起機器人的共通語言。
在具體設計中,我們會根據場景需求將各種交互手段進行系統的多種模塊組合,滿足不同場景中人機交互需求所需要的機器人能力,構建優秀的服務體驗生態。輸出一系列多模態交互設定文檔。例如:
表情輸出——復雜交互場景,近距離表達。
語音輸出——中近距離表達,無明確指示性,帶有強制性及一定干擾,受使用環境制約。
屏幕輸出——近距離表達,明確信息及指向性,可做復雜及兜底操作。
燈光輸出——無距離限制,簡單信息可全方位表達,無法傳達復雜信息。
運動特征——人員密集場景,避免接觸。
(注:涉及核心數據,此處不宜披露詳細內容)
(圖2 S-Heart人機交互信息流 & 業務場景)
用戶只要調用提供的模塊功能組合即可整合軟、硬件交互能力,快速搭建適合業務場景的服務機器人。
S-Heart為機器人行業人機交互現狀提供了更優的解決方案,研究國際通用的相關交互認知規范,并構建出多模態的人機通用語言,而這樣一種革命性的智能機器人人機交互系統可有效地節省研發成本,建立人機通路,減少感知誤判。機器人人機交互系統可在各領域提升效率、改善生活,為多角色、多場景帶來了高效便捷且情感化的智慧體驗。另一方面,也為企業有效的解決成本,提升效能。S-Heart系統平臺能成為服務機器人領域的基礎設施。透過建立機器人共通的語言,在未來將持續推動機器人行業的爆發成長。