亚马逊Review中包含着客户真实的情绪反馈,增长后的数据分析也很重要。
挖掘评论并加以分析VOC(客户之声)可以使企业更准确、更有效地满足客户的期望,从而提高市场份额和客户忠诚度。能够让企业在日益激烈的市场环境中,将有限的资源集中在更有可能被消费者选择和满意产品上,而不是浪费在可能失败的产品上。这种方法也会帮助企业节省成本。且与消费者创造了更好的情感链接。积极响应客户之声也会提高客户留存,增加客户对品牌的忠诚度与参与度。对当下如此高的获客成本和客户留存成本环境来说,这些好处不容小觑。
Shulex VOC 通过ABSA(细粒度情感分析)模型,进行VOC的深度分析。
一、什么是ABSA?
ABSA是基于方面的情绪分析(aspect-based sentiment analysis, ABSA),是一个重要的细粒度情感分析问题,旨在分析和理解人们在方面层面的观点,在过去的十年中受到了广泛的关注。在不同的场景中处理ABSA,引入了不同的任务来分析不同的情感元素及其关系,包括方面术语、方面类别、观点术语和情感极性。
例如在淘宝中,这里对于评论信息的抽取就是典型的细粒度情感分析,买家对于手机几个方面的评价有正有负。对细粒度的aspect进行分析,一方面,有助买的人从自己看重的特征方面决定是否购买,另一方面,让厂家能对自身的产品有更全面的认知,从而进行针对性的改进。可以预想到这样的信息抽取比单纯的抽取喜欢/不喜欢更加具有应用价值。
ABSA中,要体现出情感的是句子中的某个实体或者实体的某个方面,而不再是整个句子。例如手机是正品,但网络不稳定中的“正品,网络”可以看做是方面。
二、普通情感分析与ABSA的区别
普通情感分析(general sentiment analysis)
主要包含两部分:目标(Target)和情感(sentiment),目标可以是任意一个实体或实体的任意一个方面,情感有积极/中立/消极(positive/neutral/negative)三种观点(opinion),这里的情感只针对目标。简单来说就是针对一个文本分析出其对应的情感,是一个非常简单的文本分类任务。
ABSA(aspect-based sentiment analysis)
Target可以是一个aspect category或一个aspect term,ABSA中的Sentiment进一步扩展为opinion term和大体情绪取向(情感极性)。
二者区别图示如下:
可以看到ABSA主要是扩展了方面类别和方面观点和观点项。
举个例子:
“我很想买这个产品,因为我非常喜欢它的设计,但它的价格不是很好。”
ABSA系统在这里的目标是识别两个方面:
设计和价格,以及它们相关的情绪。
换句话说,设计:正面,价格:负面。
同一个文本中,不同的方面可以有不同的情感。在这个意义上,ABSA的输出并不意味着是对文本中所表达的情感的一般指示,而是旨在提供一个更细化和详细的信息。
通过一张图快速学习一下ABSA中的4个关键情感元素:方面项(Aspect Term)、方面类别(Aspect Category)、观点项(Opinoin Term)、情感极性(Sentiment Polarity):
三、ABSA的四个关键挑战
从语言的角度来看,自动识别方面和相关情感的任务是一件不太容易的事情,因为语言是复杂的,很多时候不容易解释和理解。识别正确的方面更是尤为困难,因为客户可以从多维度表达他们的意见(例如:对于产品的价格、质量、性能、设计、用途等...)。另一方面,在消费者反馈中识别情绪相对容易,因为情绪通常只分为三类——正面、负面或中立。但检索与方面相关的正确情绪也可能很棘手。根据不同情况,在进行基于方面的情感分析时,我们会遇到以下挑战:
1.当情绪来源于产品时:
顾客会明确表达他们对产品或服务的赞赏与不满。
例如:通过写正面的形容词(好、不错、太棒了)或负面的形容词(坏、糟糕、可怕)。
也会简单强调产品的一些特征或通过对产品功能的描述来表达情感。例如:
·电池持续时间长。
·烤箱升温很快。
·脱毛器能拉动毛发。
这些例子可以被解释为“积极的”产品特征(一个确实能用很长时间的电池被认为是“质量好”的),但如果在文本中使用类似的表达方式而不明确提及产品,它们就会产生歧义。例如:
a1. 它持续的时间长。
b1. 它升温很快。
c1. 它能拉动头发。
上述例子并没有清楚地表明所指的确切产品或服务是什么。如果文本a1指的是“排队”,b1指的是“手机”,或者c1指的是“剃须刀”呢?那么情绪就会是“消极的”。因此,“加热很快”这个表达方式既可以是积极的,也可以是消极的,这取决于它所提到的产品(烤箱或手机)。这就是为什么我们对产品本身的了解对于正确识别情感是至关重要的。
在Shulex VOC,我们会根据产品的特点定制我们的标签树,以便正确检测出想要传达的情感。
2.当情绪取决于目标时:
在描述一个产品或服务时,客户也可以参考其他实体。比如说:
“这个产品的价格不错,我哥哥买的那个设计也不错。”
在这个例子中,系统能够检索到文本中提到的所有方面及其相关的情感(如价格:正面,设计:正面)这些是不够的。
重要的是系统只能选择:“价格:正面”这一对,因为它是与被检查的产品有关的。“设计:正面”这一对不应该被选择,因为它指的是一个不同的实体。
从另一个角度来看,机器需要能够将“目标”(当前分析的主要产品/服务)与其他实体区分开来。为了应对这种挑战,Shulex VOC的NLP引擎提供了可以在文本中提到但实际上与分析无关的实体的指示(在上述例子中,“我哥哥买的那个”)。
3.当情绪取决于评级时:
有时,客户写反馈时没有在文本中明确说明情绪。这种情况普遍会出现在问卷调查中,公司要求客户填写问卷:对产品/服务进行评级,同时写下评论。
评级代表了对产品/服务的总体情绪,分数通常从1到10不等。1是“最负面”的情绪,10是“最正面”的情绪。但客户在写反馈意见时其实很少会在文本中明确说明某种情绪。
例如:客户在问卷中的回答是陈述其喜欢/不喜欢的方面,没有任何文本元素可以帮助识别这串文本的情感。
问题1:您如何评价我们的服务?
评价答案:"10分"
问题2:哪项服务给你带来的感受最好?
文字性回答:"客户关怀"
顾客在回答问题时,会提到服务的一个相关特征,但没有在正文中表达意见的取向。因此,只考虑文本呈现出的答案,就不可能确定他们对这方面的真实情绪。
如果对评级进行打标,就有可能检索到更完整的信息。简短的回答“客户关怀”与一个等于10的评级相关。我们可以把文本信息和评级结合起来,推断出作者对客户关怀的赞赏。如果评分是“3”,我们就会把这个反馈解释为一个负面的。
在Shulex VOC中,我们可以通过将没有情感的结构化反馈文本与客户提供的评级联系起来来管理这种反馈。从而对情感评级进行打标,并对反馈进行完整的分析。
4.当情感不像它看起来那样时:
到目前为止,我们已经看到了一些反馈文本的常规案例,在这些文本中情感可以被被隐含地传达(通过我们对产品的了解被检索出来),明确地传达(但有时并不是指我们的目标),或者完全没有传达出(由于非文本信息而被传达例如问卷)。
还有一种有趣的情况,在这种情况下情感是明确传达的,但所传达出的情感并不是字面意思。主要是用来讽刺。在这种情况下,真正的情感与在文本层面上传达的情感是相反的。例如:
这把牙刷三天后坏了!真的太棒了!
如果您正在寻找皮肤刺激,那就太好了!
虽然“真的太棒了”和“太好了”这两个表达方式本身显然是积极的,但从上下文来看,顾客想表达的是相反的情绪,因此给出了消极的反馈。这种例子强烈依赖于上下文,还要结合语言的理解才能甄别出来。
在Shulex VOC,我们会不断检查那些评级与文本级别的识别情绪不匹配的样本。手动抽样检查低评级评论(即具有整体负面情绪的评论),对样本进行手动微调步骤使我们能够检索到客户反馈中所传达的真实情感。并提高识别准确率。