进化中的AI数字人,从多屏信息流通走向多模态情感交互


    
    @科技新知 原创
    作者丨古廿
    编辑丨伊页
    万物互联网的5G时代,每个人要和多少块屏幕产生互动。
    
    在OPPO泛智能终端的生态里,这个答案可能是7块甚至更多。除了以智能手机为主的屏幕之外,还有已经推出的手表、电视、AR/VR等其他多种智能设备。
    伴随着智能硬件的增多,毫无疑问,在万物互联时代,一人多屏的泛碎片化交互场景越多越来。在多屏协同的场景里,智能助手正在成为多屏信息流通的交互枢纽。
    从手指触摸一块手机屏幕到多屏协同下的多模态语音交互,发生改变的不仅仅是人与机器信息沟通的物理形态,还有交互方式带来的情感变化。
    作为国内首个月活破亿的手机语音助手,OPPO小布助手敏锐地关注到交互变革趋势,率先向具备多维情绪感知和交互能力的方向创新进化。
    在三周年之际,OPPO小布助手以“温暖、机智、有趣”为理念,上线全新功能,以多模态情感交互,为用户提供温暖、贴心、可信赖的数智生活体验。
    01当语音走出硬件
    据Strategy Analytics的分析师透露,智能音箱已经成为了近年来发展最快的新硬件市场。到2023年,63%的美国家庭至少有一台智能音箱。
    国内市场方面,根据Omdia数据预计到2022年,中国智能音箱销量将达到4650万台,2020年-2025年复合增长率达到20.5%。
    作为语音交互的代表型产品,高增长的智能音箱是语音交互爆发性发展的表现之一,但远远不是语音交互的最终形态。
    在科技新知看来,语音交互的发展大致可以总结为三个层次:
    第一阶段,智能手机时代。以语音作为手机内置工具,扮演工具和技术的角色,是手机的附属能力。这一时期,它是手机可选的一项服务,经过设置,可以在你需要时,用它设定闹钟和日程提醒。
    这一阶段,语音交互功能被称为语音助手,不是手机最重要的功能,但是一种新的交互方式,并被用户尝鲜式低频使用。
    第二阶段,智能音箱时代。语音开始走出手机屏幕,成为独立的硬件产品,其中智能音箱是大部分语音交互的主流硬件产品形态。这一时期,语音交互作为多设备信息流通的交互枢纽,扮演连接者的角色。
    这一阶段,走出手机屏幕的语音交互功能被智能音箱所代表,简单连接起多设备的智能场景,智能音箱成为也成为新的硬件入口被各大厂商看重并抢占。
    第三阶段,多模态情感时代。语音走出屏幕,走出音箱,走出硬件定义产品。作为一个独立产品——智能助手,以更多元的形态和场景为落地载体,承担独立的平台应用服务角色。
    这一阶段,走出硬件的智能助手,流通于多设备、多场景,连接人和机器的物理交互,也连接人与AI的情感陪伴。
    如果说过去十年语音交互主要集中在硬件入口的低维之争,那么未来十年走出硬件的智能语音产品,将走向人类智能助手这一独立产品的高维之争。
    
    一方面不再局限于语音是硬件的附属功能,在强调万物互融的OPPO看来,小布助手是实现万物互融战略最关键的角色之一,奠定了小布作为智能助手的独立产品定位。结合用户场景,小布助手持续投入技术研发,比如目前小布助手的语义理解模型在行业最权威的中文语言理解测评基准上持续处于第一梯队的位置。
    另一方面不依附于某一硬件单品,作为独立智能助手,小布助手广泛搭载在OPPO万物互融生态下的多种IoT设备。截至目前,小布助手已经累计覆盖2.5亿用户,月活跃用户数突破1.3亿,月交互次数达20亿。
    硬件是智能助手的实物载体,但是当其走出硬件单品,成为独立产品,以多模态的形式和场景为落体载体,承担独立的平台应用服务角色,却拥抱了更大的多端泛硬件生态。
    02“温暖、机智、有趣”的情感互融
    作为智能助手,小布助手走出屏幕,走出硬件的同时,其角色也正在从信息连接者走向智能服务者。
    不同于以往功能导向的语音交互,扮演服务者角色的智能助手,如今也正在多场景下和人类建立情感互融的多模态连接,打破人与硬件机器语言的原生疏离感。
    
    自2018年诞生,如今三岁的OPPO小布助手聚焦“温暖、机智、有趣”三个核心理念,相继上线AI升温计划、老年人关怀版、小布有童心、多设备互联互找等新功能,以多模态深度学习AI技术,实现在不同场景下的情景交融。
    具体来说,OPPO发布行业首创“小布有童心”功能。通过算法识别用户语音进行特征分析(包括说话人的性别和年龄段等多维度属性),区分成人与儿童。
    
    当儿童用户向小布提问时,小布会自动切换成“妙趣童音”,以儿童口吻给出反馈,并呈现对应的视觉动效。在声音语气之外,回答的信息内容上,也将反馈更适合儿童理解的信息。
    实现在儿童场景下,以儿童视角+儿童音色+UI可爱有趣的动态效果来进行回复,让整个人机交互的过程充满温度和妙趣童真。
    针对老年人群体,小布助手发布行业首创“小布助手关怀版”。老年用户通过简单的语音口令即可开启关怀模式。
    在这个交互界面下,常用指令的界面字体跟图标显示调大,同时增大音量,更方便老年用户看手机与辨别声音。
    对于老年人语音方面使用不便的问题,操作上只需点击相应的功能卡片,不用语音也可以使用智能助手,极大程度改善了老年用户使用智能手机的体验。
    在情感互动场景下,小布助手推出行业首创“AI升温计划”。通过更准确的语义分析,识别用户不同的情绪状态,采用“开心、感激、夸赞和难过”等4种拟人情绪,加强情感化交互能力。
    比如当小布感知到用户很失落时,小布就会用温柔而有耐心的音色和用户互动。在虚拟形象、动作上,小布也会展现出想要跃出屏幕,给到用户拥抱的姿态。当听到用户夸赞小布可爱时,小布的声音也会变得雀跃,开心地播放满屏烟火。
    通过识别用户的情绪状态,以温情的文本回复及具有情绪变化的TTS音色,配合暖萌有趣的UI视觉效果与用户互动,给出多模态的情感反馈。
    以上三大行业首创功能,更多的是作为智能助手,小布情感关怀温暖的一面。在这之外,作为智能助手,机智也是小布必备的综合能力之一。比如最新发布的多设备互联互找、AI助忆等功能。
    多设备互联互找功能,则是在原有跨设备语音控制能力的基础上,进一步推进小布智能终端中枢的能力升级,在多设备之间扮演更机智的角色。
    
    比如设备遗忘是多设备用户经常面临的大问题,有时候着急出门突然忘了手机在哪,用户只需要对着小布助手喊一句“你好小布”,这时其他的设备,比如手表或者电视,都会急速响应,帮用户快速找到手机,反之亦然。
    不仅遗忘设备,记忆遗忘也是人会经常面临的问题,但是记忆对于机器来说却是最擅长的事情。
    AI助忆功能,就是小布助手通过自身的AI能力,来帮助用户加深记忆。比如某个人,某件事、某个时间、某个位置等等这些对于用户来说关键的信息点,都可以通过小布来进行记忆。
    目前小布助手已经支持生日、纪念日、位置、开学时间等十几个属性的记忆能力,除此之外还支持生日和纪念日主动提醒,可以再也不用担心错过重要日期了。
    温暖、机智之外,作为全面全能的智能助手,博闻强识的小布助手也可以给用户呈现有趣的一面。
    3.0版本的小布助手持续推出“答案之书、天文技巧、民乐小百科、AI谱曲”等趣味黑科技,全方面让用户体验到科技带来的乐趣。
    多种新功能的加入,温暖、机智、有趣的情感互融交互下,横向增加小布语言表现力的同时,也进一步纵向加深了小布语言的情感理解。
    03进化中的AI数字人
    作为智能助手,多种新功能的迭代加入,只是小布“温暖、机智、有趣”的一部分。在这之外,作为多模态情感学习的独立产品,走出硬件的小布助手交互模态进一步升级,推出小布虚拟人。
    
    作为业界首个基于虚拟人多模态交互的智能助手,小布虚拟人打破了人与机器之间单纯的语言交互形式,将人与机器之间的交互,演化为人与虚拟人之间的交互。
    在虚拟人的交互形式下,智能助手可以和用户实现多个场景生态下的内容服务能力、实时交互以及更丰富的情感化交互。比如在电商场景下,定制一些具备品牌特色的带货主播虚拟人,在天气场景定制具备地域特色的天气主播等。
    不同于此前大热的偶像派虚拟人,比如初音未来、洛天依等虚拟偶像,往往被作为元宇宙数字的一种内容景观被消费。实力派的智能助手小布虚拟人,作为有温度的人机对话沟通载体,更多是现实世界与数字世界之间,需要一种更具视觉化、沉浸式和情感温度的交互方式。
    因此,作为两个人与元宇宙世界沟通的桥梁,虚拟人还有很多想象空间。比如面向未来,在更多的情感互动层面,小布虚拟人还将提供更加个性化的定制能力,逐步开放发音定制、形象定制、性格定制、内容服务定制等开放能力。
    在开发者层面,OPPO和开发者一起为亿万用户建立技术桥梁,逐步开放并允许开发者为小布定制更多场景所需的虚拟人,搭载到更多智能设备上。
    
    正如小布虚拟人发布时,OPPO数智工程事业部总裁刘海锋表示:“希望构建一个以小布助手为中心,多端触达的开放生态,通过小布实现智能设备之间的万物互融”。
    走出硬件产品,接入更广泛硬件生态的独立智能助手,在这些未来逐步面向开发者和用户开放的交互功能上,OPPO小布助手正在逐步演化为元宇宙世界的AI数字原生居民,从而进化为人类元宇宙数字世界的最佳伙伴。