最近几天,第九届CCF大数据与计算智能大赛正式启动爱奇艺携手中国计算机联合会推出剧本角色情感识别挑战赛,并邀请全球人才参与竞赛,共同探讨技术难题和行业痛点这也是业内首个基于剧本的角色情感识别挑战
IT之家了解到,基于剧本的角色情感识别主要依靠剧本中的每一段对话和动作描述,多维度分析相关角色,识别情感与普通新闻和评论性文本的情感分析相比,它有其独特的商业特点和挑战
这个问题也是基于爱奇艺业务场景提出的,要求选手运用自然语言处理和相关技术手段,综合判断和识别剧本中的各种情感元素。
剧本中丰富的情感是剧本的灵魂,好的剧本包含着充分的情感释放情感分析是剧本评价中非常有意义的一个方面
竞争问题概述
爱奇艺为本次挑战准备了一部分脚本场景作为训练集,训练集的数据已经手工标注参赛团队需要从多个维度分析和识别剧本场景中每个对话和动作描述所涉及的每个角色的情绪
本次比赛共有六大类情感定义:爱,音乐,惊喜,愤怒,恐惧,悲伤玩家可以根据以上六种情绪按照固定的顺序对应情绪值情绪值的范围是,0—无,1—弱,2—中,3—强,用英文逗号隔开该算法的得分将通过常用的均方根误差来计算,并将根据文本内容角色名称识别的六种情绪类型对应的情绪值来计数
与其他体裁相比,脚本文本的写作风格与普通新闻语料库有很大不同,更口语化同时,剧本场景中的对话和动作描写都涉及到人物的情感,从六个维度去识别更加困难此外,剧本中的角色情感不仅依赖于当前文本,还依赖于之前的语义,容易产生识别错误
竞赛日程。
CCF大数据与计算智能大赛由中国计算机联合会于2013年发起,是一项面向大数据与人工智能领域的算法,应用和系统的大型挑战赛2021年第九届CCF BDCI大赛以余杭为基地,面向世界,以引创新争智慧为主题欢迎各界精英选手参加比赛