资源预览内容
第1页 / 共39页
第2页 / 共39页
第3页 / 共39页
第4页 / 共39页
第5页 / 共39页
第6页 / 共39页
第7页 / 共39页
第8页 / 共39页
第9页 / 共39页
第10页 / 共39页
亲,该文档总共39页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计计算机科学与技算机科学与技术术学院学院毕业设计毕业设计( (论文论文) )论文题目微博用户关系可视化设计 指导教师职 称博士讲师学生姓名学 号专 业网络工程班 级系 主 任院 长起止时间2013 年 10 月 11 日至 2014 年 5 月 23 日2014 年 5 月 23 日目目 录录摘要.iAbstract.ii第一章 绪论.11.1 研究背景.11.2 研究意义.11.3 研究现状.2第二章 分析与研究方法.42.1 研究方法.42.2 微博用户关系分析原理.4第三章 微博数据获取.63.1 新浪微博开放平台.63.1.1 简介.63.2 数据获取.63.2.1 创建应用.63.2.2 下载软件开发包.73.2.3 获取数据.83.3 微博标签分析与特征.14第四章 微博用户属性及用户关系研究.164.1 微博用户属性.164.1.1 用户的动机.164.1.2 用户的角色分类.164.1.3 用户的行为.174.2 微博用户关注情况分析.184.3 微博用户关系网络分析.214.3.1 微博用户关系间的强度分析.274.3.2 网络密度分析.284.3.3 平均路径长度与网络直径.29第五章 总结与展望.315.1 总结.315.2 展望.32参考文献.33谢辞.34微博用户关系可视化设计微博用户关系可视化设计摘要摘要:微博用户数量的爆炸式增长使得微博用户网络更为错综复杂。本文主要研究微博用户关系以及其可视化:通过新浪微博的官方 API 开放平台接口以及 Python 运行环境,读取特定微博用户的相关数据并进行用户关系分析;利用 CSV 文件存储分析结果;使用 Gephi 工具进行可视化输出,对用户的特征、行为活动以及整体关系结构进行直接展示,从而得到微博用户与其相关用户之间的交互“强度” ,及其所在社群的可视化关系图,最终有助于用户社群的挖掘与舆情控制等。关键字关键字:微博用户;用户关系;可视化iVisualizationVisualization ofof RelationshipsRelationships betweenbetween WeiboWeibo UsersUsersAbstract: Weibo explosive growth of the number of users makes the network more complex Weibo user. The main microblogging users and their relationship herein Visualization: official Sina Weibo Open Platform API interface and Python runtime environment, read the relevant data for a specific micro-blog users and user relationship analysis; CSV file storage utilization analysis; using Gephi tools for visual output on the users characteristics, behavior and the overall structure of a direct relationship between the display, whereby the micro-blog users and their associated user interaction between the “strength“, and where the visualization diagram community ultimately contribute mining and user community control of public opinion.Keywords: weibo user;user relationship;visualization南华大学计算机科学与技术学院毕业设计(论文)第 0 页 共 34 页第一章第一章 绪论绪论1.11.1 研究背景研究背景伴随着我国的计算机技术以及互联网技术的快速发展,2013 年我国的信息化进程报告会认为我国的信息化进程已经与发达国家一同步入网络化的时代,截至 2013年的 6 月,中国网民已经突破 6 亿,初步实现网络化。可见,互联网技术已经日复一日的融入到我们的日常生活当中,网络技术已经影响了我们的生活、工作、交友方式等,成为生活中不可或缺的组成部分之一。近几年来,全球互联网市场上各种社交软件相续应运而生,从外国的 MSN、FaceBook、Twitter 等到国内的 QQ、人人、微信等,以及到目前流行的微博客,这些平台都是我们在日常生活中人与人之间关系以及行为活动的具体表现。通过这些交互平台,我们可以常与亲戚朋友沟通,并且结交志同道合的新朋友,它们能提供给我们所需要的通信便利,减少因为地理上的不便所带来的麻烦。 “微博”作为社交软件的新生力量,作为一种全新的信息传播模式。据新浪微博最新的数据显示,截至 2013 年底,新浪微博用户的注册数量已经突破 6 亿,用户活跃度也持续增长。随之而来的对于微博的技术升级、应用开发、平台资源的整合,在资源数据下的研究分析,折射出各方面的优势以及提升空间。在如此大的微博用户数据中蕴藏着巨大的可挖掘数据,因而对新浪微博的数据进行挖掘研究很有必要性。1.21.2 研究意义研究意义微博,即微博客,是一种基于用户关系间信息分享、信息传播以及获取信息的平台,用户可以及时更新自己的简短话题,并可以公开的形式公开。微博是依靠独立信息源所形成数量庞大的微博用户数量,通过对信息的加工整理,可以将微博构建为互联网中的信息指向源和主要信息源。微博这一全新的交互平台,打破了传统南华大学计算机科学与技术学院毕业设计(论文)第 1 页 共 34 页常规的传播途径,给人带来全新的社交交互体验;并且在现今的发展中,微博的应用开发使用有着巨大的商机潜力。对微博用户的挖掘研究有着巨大的积极意义:通过对微博用户的行为活动习惯、属性信息、直接关系、间接关系等的研究分析,并且对用户间的关系进行可视化展示,使得用户在自己微博中能够更加清晰的看到自己周边的环境情况、行为活动习惯、关系情况等;对微博用户的潜在关系的挖掘研究可视化展示,有助于更加深刻的了解到用户间圈子的形成、相同点、影响力、活跃度等,也有利于分类分析研究的开展。1.31.3 研究现状研究现状新浪微博自从 2009 年推出以后,在我们的社会生活中的一些方面领域产生巨大的影响力;随着微博的发展升温,微博在互联网业界得到了广大的关注,吸引着各界学者的关注,比如计算机科学、互联网技术、心理学等一些领域对微博进行深层次的挖掘研究。对于国内外关于微博研究的相关文献资料的整理分析,主要有以下几个方面:微博网络结构领域特征研究、微博用户研究、微博热点研究、微博应用研究等。本文主要是对微博用户关系领域的研究分析,所以针对微博用户关系研究的主要是以下两个方面:(1) 用户关系方面分析,解利群、颜清华等人对于社会网络的分析理论,从社会网络学方法分析视角微博中人与人之间的关系量化情况,总结出直观模型微博“围观模型” ,此模型表现了微博用户关系整体网络的基本特征:明星用户之间的交流互动的情况很频繁,形成一个朋友交流圈;普通用户则处于网络交流的外围“围观”状态,与明星用户之间的直接交流状态基本无法实现,因此在一定程度上普通微博用户只是进行单方面的信息传播与阅读;“围观模型”概念体现了微博交互网络的一个特征,并且也折射出了目前的现实社会中的一个网络关系特点交互交流的困境。袁园、孙霄凌、朱庆华则是随机选取部分微博用户以及其关注的人的数据作为研究对象,通过关联的关系建立社会网络结构图,利用社会网络方法分析并且使用聚类分析法来对此样本数据进行整个网络的分析、内部子结构的分析以及角色位置的分析,从而以微博用户关南华大学计算机科学与技术学院毕业设计(论文)第 2 页 共 34 页注的数据来挖掘微博用户关注对象的分布和其关联性,可针对目前的微博关系提出有用的建议。(2) 用户特征方面分析,杨小朋、何跃提出“博文魅力指数”概念,并且运用 Spearman 和 Pearson 的相关系数分别来对听众数量和收藏博文的人数、博文魅力指数等变量进行分析,最终选取用户的听众人数和微博的魅力指数这两个变量通过 K-Means 聚类算法对微博用户进行聚类分析,结果表明:博文魅
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号