本月,Brandwatch 推出了一个全新的情绪模型,该模型涵盖了 Brandwatch 消费者研究中涵盖的超过 1 亿个在线来源以及由 Brandwatch 支持的应用程序,如 Cision Social Listening 和 Falcon Listen。
这是对 Brandwatch 现有的世界级情感分析的一次重大升级,对之前支持的语言的准确率平均提高了约 18%。
这种新模型还支持多种语言,这意味着:
- 官方已添加对 16 种新评估语言的支持,并且还 电报数据 将添加更多语言(目前官方支持的语言总数达到 44 种)
- 当模型有足够的信心时,它还会尝试将情绪分配给任何其他语言的帖子(以及未识别语言的帖子,例如仅有表情符号的帖子)
情绪是 Brandwatch 客户在许多重要任务中依赖的关键指标之一,例如:
- 评估品牌健康度
- 识别支持者或反对者
- 发现新出现的危机
- 了解与品牌或主题对话相关的正面和负面话题
我与领导开发新情绪模型的团队的数据科学家之一科林·沙利文 (Colin Sullivan) 坐下来,询问他该模型的工作原理以及它将如何使 Brandwatch 客户受益。
嗨,Colin!我们非常高兴看到您的劳动成果现在可用于 Brandwatch 的情绪分析。在我们讨论这个新的情绪模型之前,请先向我们介绍一下您自己和您的背景。
谢谢 Nick,我们也很兴奋!我是一名数据科学经理,负责 Brandwatch 的几个不同项目,我的背景是语言学和计算语言学。
语言学本质上是一门社会科学,它从语言的理论背景、句法和语义的角度研究语言运作的模式和规则。
计算语言学是研究计算机如何对这些相同结构 影响者活动如何影响关键 进行建模,并将这些模型应用于自然语言处理、语言识别和索引等方面。它还用于分析大量文本数据中的情绪和主题等内容。
这次情绪更新使用了一个全新的模型。为什么要建立一种新的情绪分析方法?
两个主要原因。
1. 我们想尝试一下研究领域中出现的一些最先进的方法。近年来出现了一些非常令人兴奋的新进展,可以帮助我们取得更好的结果。
2. 我们还看到了简化 Brandwatch 情绪分析方法的机会。我们 台湾数据库 过去对支持的每种语言都执行相同的程序,包括为每种语言收集大量训练数据、对其进行标记、了解其语言模式,然后为每种语言构建监督学习模型。采用这种新设置后,我们拥有一种可同时适用于多种语言的单一方法。
这个新模型使用了“迁移学习”。那到底是什么?
过去几年,人工智能领域在迁移学习方面取得了令人振奋的进展。迁移学习基本上涉及首先训练一个模型以获得更一般的理解,然后迁移该学习并要求其将其应用于不同的任务。这与仅为解决单个特定问题而训练模型(我们过去进行情绪分析的方式)截然不同。