资源预览内容
第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
第9页 / 共10页
第10页 / 共10页
亲,该文档总共10页全部预览完了,如果喜欢就下载吧!
资源描述
情感分析概述 1 2019 11 27 主讲内容 业界做法 处理流程 分析方法 注意事项 性能比较 2 2019 11 27 业界做法 情感倾向方向 正面情感 负面情感 中性情感 情感倾向度 权值 3 2019 11 27 一般处理流程 文本预处理 特征提取 特征权重计算 情感分析 4 2019 11 27 分析方法 情感倾向方向 算法 基于情感词典的方法 依赖情感词典 基于机器学习的方法 依赖大规模人工标注的语料库 情感倾向度 5 2019 11 27 注意事项 新名词 词典扩展方法 基于语义计算HowNet语义相识度算法 基于统计分析 通过计算目标词与基准情感词之前的点互信息值来获取目标词的情感倾向 变形词 程度副词 否定副词 标点符号 断句作用 情感强弱 情感极性 表情符号 情感词典 6 2019 11 27 注意事项 训练集测试集的自动标注 特征提取 特征项权重计算 向量空间模型及降维处理 机器学习分类 SVM NB ME KNN等 机器学习 7 2019 11 27 性能比较 优点 能够体现文本的非结构化数据特征 更利于挖掘文本内在联系和所表达的情感 缺点 依赖构建的情感词典 词语不规范 新词 变形词 情感词典 8 2019 11 27 性能比较 优点 克服了新词的邮箱 将文本转化为结构化数据进行处理 语料库自动扩充 缺点 各特征都看做了孤立元素 不能体现文本内在联系 机器学习 9 2019 11 27 Thanks 10 2019 11 27
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号