资源预览内容
第1页 / 共23页
第2页 / 共23页
第3页 / 共23页
第4页 / 共23页
第5页 / 共23页
第6页 / 共23页
第7页 / 共23页
第8页 / 共23页
第9页 / 共23页
第10页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
社交网络中的可信用户识别,陈文强1,邹权1,陈珂2,江弋1,林琛1 1 厦门大学信息科学与技术学院 2 广东石油化工学院计算机科学与技术系,大纲,1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结,社交网络中的可信用户,用户的决策行为 常常受别人评论的影响,识别出可信用户,帮助用户决策 了解WEB用户的行为模式,帮助建立专家搜索系统,面临的挑战,难以界定可信用户的有效特征 类别高度不平衡问题,大纲,1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结,相关工作 - pagerank and hits,Page L, Brin S, Motwani R, et al. The pagerank citation ranking: Bringing order to the web. In Technical report, Stanford Digital Library Technologies Project, 1998. Kleinberg J. Authoritative sources in a hyperlinked environment. Journal of the ACM, 46(5):604632, 1999. Jurczyk P and Agichtein E. Discovering authorities in question-answer communities using link analysis. In Proc.of CIKM, 2007. Campbell C, Maglio P, Cozzi A, et al. Expertise identication using email communications. In Proc. Of CIKM, 2003. Dom B, Eiron I, Cozzi A, et al. Graph-based ranking algorithms for e-mail expertise analysis. In Proc. Of workshop on Data Mining and Knowledge Discovery, 2003,相关工作 - 随机过采样、随机降采样,Japkowicz N, Stephen S. The Class Imbalance Problem: A Systematic Study. Intelligent Data Analysis. 2002, 6(5): 429449. Batista G E, Prati R C, Monard M C. A Study of the Behavior of Several Methods For Balancing Machine Learning Training Data. ACM SigKDD Explorations, 2004, 6(1): 2029. Chawla N V, Bowyer K W, Hall L O, Kegelmeyer W P. SMOTE: Synthetic Minority Over-Sampling Technique. Journal of Artificial Intelligence Research, 2002, 16(6): 321357.,大纲,1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结,可信用户识别流程,文本特征向量,社交网络特征向量- 示意图,社交网络特征向量,聚类降采样,集成学习分类器LibD3C,大纲,1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结,实验设置与结果分析,实验设置与结果分析,大纲,1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结,总结,1、提取识别可信用户的有效特征,包括社会网络特征和文本特征等41个特征 2、采用随机采样、降采样构建平衡的数据集 3、集成分类器D3C进行分类,提高了ROC面积、敏感性和特异性,谢谢!,论文作者:陈文强 电子邮箱:irwenqianggmail.com,Q & A,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号