聽覺感知:語音識別;
視覺感知:人臉識別;
動作識別:表情、情緒、動作感知;
OCR:證件識別,文本識別。
政務服務領域知識圖譜及問答庫積累,實時語音交互靈活可配。
形象制作:2D真人、卡通、3D寫實、超寫實;
形象驅動:面部驅動、肢體動作;
語音交互:多輪對話、聲音定制。
內置2D真人數字人形象庫,開箱即用
支持從2D真人、3D仿真人、卡通、超寫實等個性化數字人資產定制;
政府、軍隊、媒體、金融、文旅等崗位形象和服飾;
可按內容、場景的需要,對數字人形象外觀進行配置,包括發型、服裝、鞋子等。
可配置不同互動場景下數字人的人像位置、聲音配置、背景圖片等。
動作、表情、感知深度匹配;
多功能語音包,語音、唇形、情緒同步;
提供靈活的話術配置,實現音唇精準同步、表情及動作豐富逼真。