联商专栏:零售商需要不断通过创新服务来提高顾客的购物体验,而情感计算在该领域具有独特优势。它在零售行业的应用,主要集中在提升购物体验的服务中。
在这个科技逐步改变生活的世界里,《Her》的导演斯派克·琼斯,用他敏锐的视野和温柔的想象力,为我们创造了一场美好的新科幻爱情。而仅以声音出演的女主角扮演者斯嘉丽,也成为第一个用声音获奖的女演员。
《Her》讲述的是,宅男作家西奥多和人工智能系统“萨曼莎”的恋爱故事。导演表示,这是一部探讨“亲密关系”的电影。当人们渴望却又害怕亲密关系的时候,人工智能便为沟通提供了便利。“萨曼莎”不仅没有科技的冰冷面孔,还能理解、欣赏和鼓励男主人公,同时拥有强大的大脑,在写作、音乐和绘画上也有极高造诣。她可以陪伴和帮助脆弱的男主认识自己,度过人生危机。

《Her》电影剧照
这部电影,一度被认为是人与机器未来关系的最美试探。而科技进步,也让这个电影有望成为现实。
人工智能之父马文·明斯基曾提到过,“如果机器不能够很好地模拟情感,那么人们可能永远也不会觉得机器具有智能”。面部表情、语音、文字、肢体动作、生理信号等作为人类情感表达的主要方式,其中蕴含了大量有关人类内心活动变化的信息。在人们的认知中,是否具有情感,正是人与机器的分界线。
人类对科技的探索总是知难而上,当前热门的情感计算研究就是试图创建一种能感知、识别和理解人类的情感,并能据此做出智能、灵敏、友好反应的计算系统,即赋予计算机像人一样的观察、理解和生成各种情感特征的能力.
心理学研究表明,情感包括三个阶段:
· 主观体验阶段:个体对不同情感状态的自我感受;
· 外部表现阶段:在情感状态发生时身体各部分的动作量化形式,即表情;
· 生理唤醒阶段:情感产生的生理反应.
早在1997年,MIT的Picard教授就提出了“Affective Computing”(情感计算)概念。情感计算研究的发展,在很大程度上依赖于心理学和认知科学对人的智能和情感研究所取得的进展.
一、情感计算的算法分析
在情感计算的研究中,情绪识别是最基础、最重要的内容之一. 而情绪识别主要是通过面部表情、语音、文字、生理信号等模态的数据,来识别出人类的各种情绪,包括:快乐、惊奇、悲伤、恐惧、厌恶、鄙视、愤怒、沮丧、疲劳、平和等.
近几年,出现了各种各样的方法和技术来识别用户的情感,例如:面部表情识别、姿态识别、自然语言处理、人体生理信号识别、多模情感识别、语音识别等.
人机情感交互则包括人脸表情交互、语音情感交互、肢体行为情感交互、文本信息情感交互、情感仿生代理、多模情感交互等.
1、人脸表情识别和肢体行为识别,都是利用生物特征分析的方法,提取被观察者的情感特征.被观察者情绪变化都会通过表情变化、举手投足表达出来,而且这种表达往往更加真实.
人脸表情识别是利用人脸的面部信息分析判断表情,传统的方法有基于全局或局部特征的静态图像分析方法;基于光流变化、主动形状或者几何规则的动态多帧方法,例如比较经典的AAM、ASM方法.

深度学习的兴起,也大大推动了表情识别算法的进步,降低了特征工程的复杂度,无论是关键点信息提取的准确性,还是表情分类的准确性都有了很大的提升. 目前,简单的表情识别已经相对成熟,笑脸抓拍、疲劳驾驶的判断等技术应用已经深入到我们的日常生活中.
随着研究的深入,研究人员将精力聚焦在更为复杂的微表情识别中,这种表情持续时间更短,表达了被观察者试图隐藏的真正情感,微表情识别在安全、金融、司法等领域也有极大的研究价值.
2、语音情感交互,顾名思义是通过语音交互的方式,获取并传送给交互双方情感维度的信息.在人机交互领域,语音情感交互的核心,就是如何准确地获取到用户的语音情感信息,以及机器如何用语音反馈处理情感的信息.

具备智能语音交互功能的苏宁小Biu音响
语音情感信息的识别算法,和语音识别、声纹识别、语音异常事件识别的算法有很多共通的地方,即都是通过对声音信号的特征提取、处理,实现分类器所需的模型训练,最终利用分类器来对识别的情感类型进行预测.
从上世纪主要依托挖掘、分类器设计的方法,到日趋占据主流地位的深度学习框架,情感识别的准确率也不断提升. 但是,相对于其他的识别领域,在深度学习的发展下,大多已经不再重视特征选择,众多的语音情感识别研究人员,仍然保留了较识别和声纹不同的特征提取方案,比如,慕尼黑的开源的媒体特征空间提取(openSMILE),至今都是语音情感识别领域的经典工具.
既然是交互,处理语音情感识别,不得不提的还有语音情感表达,这也是语音合成里的一个重要的技术指标.在端到端语音合成方案问世之后,人们对于语音合成音色以假乱真的诉求基本得到了满足,朝着对韵律、节奏等细节的“情感化”提出了新的要求.
如何挖掘出说话人情感在语音中细微的变化,并通过迁移学习、强化学习等方法快速给语音合成赋能,是广大研究人员正在探索和解决的热点.
3、针对文本内容的情感分析,一直是自然语言理解和情感计算的重要问题.不同于图像、语音的情感计算,基于文本的情感分析可以从多维度多层次进行细致的分析,并得到有明确意义的分析结果.

基于用户评论的情感倾向分析 来源百度AI
人类的情感不是单一的,而是有着丰富的维度,例如:恐惧、愤怒、失落、兴奋等等.针对每一种情感,又有不同的情感强度.准确把握交互过程中对方的情感状态和情感强度,能够指导应答系统,及时调整应答方式,给对方更加有温度的应答.
在客服等场景中,识别用户的负面情绪,并给予针对性的安抚能够大大提高用户体验,减少用户投诉.同时,文本的情感分析又可以从对话、语句和属性多个层次入手.对话层次的情感计算获取整个对话过程中用户的情感倾向,反映了用户整体的感受.句子层次的情感计算可以及时感知用户情绪的转变,从而迅速做出调整.而属性层级的情感计算则可以提取出用户的观点.
例如,售后对话中用户可能会有如下对白—— “快递是很快,小哥人也很 nice,就是这个手机的电池太糟糕了,一点都不好.”属性层级的情感分析能够找到用户不满意的是电池,而对快递员则赞赏有加.那么在做应答的时候,我们就可以给出针对性的安抚,而不笼统地说一句“对不起”.
这就是文本情感分析的独特和有趣之处,除了感知用户的情绪,你还可以很明确地知道他因何开心,又为何感伤.这为更智能的应答提供了基础.
4、多模态情绪识别.现有的情绪识别技术大多是通过单模态数据来识别,而单模态的数据对不同情绪的敏感度存在差异,对准确识别情绪存在一定的限制,往往不能充分表达人类所传递的情感信息,因此对于多模态情绪识别的研究受到越来越多的关注.

竹间智能多模态交互系统
随着5G时代到来,移动智能端与人们的生活、工作、学习的关系越来越紧密,从而可以通过多种智能终端来收集情感计算所需的多模态数据,这将有利于训练多模态情绪识别的算法模型,而多模态的数据融合可以对情绪信息互相补充,能够保证识别情绪的准确性.
现有的多模态情感识别过程大致可分为两类:一类是对各模态信息在特征级进行融合,另一类是对各模态信息在决策级进行融合.
对于特征级融合,首先对各模态信息进行预处理,其次提取各模态特征信息,然后对各模态特征进行融合,最后使用分类算法对
