资源预览内容
第1页 / 共41页
第2页 / 共41页
第3页 / 共41页
第4页 / 共41页
第5页 / 共41页
第6页 / 共41页
第7页 / 共41页
第8页 / 共41页
第9页 / 共41页
第10页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
大学毕业设计(论文)目录摘要IIIABSTRACTIV第1章绪论11.1微博用户模型构建的背景及意义11.2用户模型研究现状及存在的问题11.2.1研究现状11.2.2微博存在的问题21.2.3微博用户模型构建的难点21.3本文研究内容及目标21.3.1研究内容31.3.2研究目标31.4本文组织结构3第2章基于维基百科的本体构建方法42.1本体概述42.1.1本体的基本概念42.1.2本体构建方法52.2基于维基百科的本体构建62.2.1维基百科简介62.2.2传统方式构建本体存在的问题72.2.3基于维基百科的本体构建72.3本章小结9第3章基于本体的微博用户模型构建方法103.1用户模型概述103.2用户模型表示方法103.2.1常用用户模型表示方法113.2.2本体用户模型表示方法113.3微博用户模型的构建方法123.3.1特征词提取123.3.2兴趣度计算143.3.3用户模型的生成143.4本章小结16第4章微博用户模型构建系统设计与实现174.1系统整体设计174.1.1开发环境简介174.1.2系统整体架构174.2数据库设计184.3功能模块设计224.3.1本体的构建与显示224.3.2用户基本数据显示234.3.3用户模型构建与显示244.4本章小结25第5章总结与展望265.1本文总结265.1.1本文的主要工作265.1.2本文的主要创新点265.2展望26致谢28参考文献29附录:部分源程序清单31ABSTRACTIn recent years, with the rapid development of Micro-blog, the need that users gain the access to information is also a linear growth momentum. The amount of Sina Micro-blog registered users has reached 503 million by 2012. However, the daily flood of Micro-blogs has a serious impact on the quality of information users receive. Thus, how to find content that they are interested in quickly and accurately? Or can we push the information according to the users interest actively? That is what this paper concerns.User model is a formal description of users interests. To establish a precise user model for Micro-blog users, in order to recommend the information they concerned about and contents they are interested in, is the development trend of personalized recommendation. The achievements of this paper can be used for e-commerce, public opinion monitoring, advertising and other areas.In this paper, Micro-blog user model construction method based on the ontology technology is discussed. First of all, according to each users micro-blog content analysis, extract the keywords which represent the content information of each Micro-blog; then create users eigenvectors in order to calculate the users interest degree; finally match these keywords with the ontology library to create Micro-blog user interest model. The achievements of this paper will lay the foundation of personalized service based on Micro-blogs.Keywords: Ontology, Micro-blog, User model, Interest DegreeIII第1章 绪论本章主要描述了微博用户模型构建的背景、意义,分析了相关课题国内外的研究现状,进而提出了本文所要研究的内容及目标。1.1 微博用户模型构建的背景及意义微博的数量和质量千变万化,各种海量、实时的数据信息已严重影响着用户接收信息的质量,进而影响着用户的生活质量。传统的人找信息和人找服务的模式已越来越难以满足用户的需求。如何为微博用户建立一个精准的用户模型,以便于之后为其推荐所关注的信息和感兴趣的内容,是各大移动电子商务网站进行个性化推荐的发展趋势。本课题研究在微博上基于本体的用户模型构建方法具有现实意义。1.2 用户模型研究现状及存在的问题近年来国内外学者对用户模型的研究做了大量的工作,而基于微博的用户模型构建也开始逐步成熟起来,下面具体阐述研究现状以及存在的问题。1.2.1 研究现状近年来,用户建模技术作为个性化服务中的基础,愈来愈受到重视,并逐渐地从个性化服务中独立出来,形成了专门的研究方向。研究人员逐渐意识到个性化服务质量的好坏不仅取决推荐技术或者检索技术,而且还取决于准确的用户模型。国内的研究人员对用户模型构建和更新也展开了研究,例如大连理工大学林鸿飞和杨元生1根据用户提供的各类示例文档,通过考察特征、段落和类别的表达能力构建用户模型。南京大学多媒体技术研究所开发的个性化搜索引擎DOLTRI-Agent2采用一些相互关联的关键词组成用户模型,对每个关键词设置权值来表示用户对该关键词的感兴趣程度。国防大学的应晓敏3提出构建细粒度的基于关键词的用户建模方法,以更好体现出用户间的兴趣差异。国防科技大学的徐振宁4和李勇5构建了一个包括个性化领域本体的用户模型,跟踪记录用户在Web上的浏览和检索过程,从大量数据中统计、分析和计算出用户的个性化信息需求。在国外,Fragoudis和Likothanassis6对几个典型的个性化服务系统LIRA7,Letizoa等采用的用户建模方法进行了综述和分析,指出用户建模在个性化服务系统中的重要地位。Pazzani和Binsusu8通过用户对浏览页面的标注获取用户感兴趣与不感兴趣的页面作为训练样本,而后计算单字的期望信息增益,选择期望信息增益大的128个单字构成用户模型。Chan9通过观察用户对页面中超链接的选择获取用户感兴趣与不感兴趣的页面作为训练样本,而后计算单字的期望互信息,选择期望互信息大的250个单字构成用户模型。Schwab10等通过观察用户对页面的选择获取用户感兴趣的页面作为训练样本,而后以出现在感兴趣页面中指定位置的单字构成用户模型。Adomavicious和Tuzhilin11采用数据挖掘方法对用户个体的访问记录进行挖掘,挖掘出来的关联规则以及用户登记的个人信息构成用户模型。在微博的用户模型研究方面,近年来国内学者做了大量研究工作。例如广东社会主义学院的余伟12设计了一个基于本体的微博用户行为分析模型构架。北京邮电大学的赵岩露13等提出了基于微博用户兴趣模型的发现算法。而国外对Twitter的用户模型研究也有很多。1.2.2 微博存在的问题虽然,近年来微博得到了空前的发展。相比于传统博客,微博传播模式更加便捷,更新的频率更高。作为新兴的媒体,目前仍存在很多问题。(1)很多用户感兴趣的有用信息,往往被迅速湮没。(2)微博信息过于简单,微博之间的联系松散、逻辑关系复杂,容易引起误解。(3)微博监管困难,对于敏感信息传播的预测和监控缺乏有效手段。1.2.3 微博用户模型构建的难点虽然用户建模技术已较为成熟,但针对微博这一特殊的平台,仍然存在了以下一些技术难点:(1)对微博信息收集时,如何能够获取到大量有效的数据。(2)微博信息短小精悍,对用户模型构建的准确性影响较大。1.3 本文研究内容及目标本文针对微博中存在的问题,试图对用户的微博内容进行分析,提取用户的兴趣,并建立微博用户模型,为微博信息推荐、舆情监控、微博营销等提供技术支持。1.3.1 研究内容本文研究基于本体的微博用户模型构建方法,具体研究内容有一下几个方面。(1)领域本体构建;(2)用户微博收集;(3)微博内容分析;(4)兴趣主题提取;(5)用户模型构建。1.3.2 研究目标针对本文的研究内容,制定了以下几项指标:(1)自动对搜集到的所有用户(实验10个以上)的所有微博(30条以上)进行分词;(2)自动统计每个用户的关键词词频;(3)合理计算每个用户模型中的兴趣度;(4)根据已有的本体库建立用户模型;(5)开发系统原型,验证提出的方法。1.4 本文组织结构整篇论文分为五章。第一章介绍了研究背景、研究意义,分析了用户模型研究现状以及存在的问题和难点,并提出了本文的研究内容以及研究目标。第二章主要介绍了本体的基本概念,并提出了基于维基百科的本体库构建方法。第三章首先介绍了用户模型的基本概念及其表示方法,其次着重介绍了微博用户模型的构建方法,主要分为特征词提取、兴趣度计算和用户模型的生成。第四章主要描述了微博用户模型构建系统设计与实现,展示了系统整体设计、数据库设计和各功能模块设计的内容。第五章对全文进行了总结,归纳了本文的主要工作与创新点,并指出了需要进一步研究的问题。第2章 基于维基百科的本体构建方法本章具体描述了基于维基百科的本体构建方法:介绍了本体的基本概念,并引出本文所使用的基于维基百科的本体构建方法。2.1 本体概述本节介绍了本体的基本概念以及目前研究学者常用的四种构建方法。2.1.1 本体的基本概念在计算机领域,1991年开始,研究者们对本体做了多次说明,它表示的含义也更加清晰明确,现在人们一般认为本体论是对概念化对象的明确表示和描述14。随着研究者们对本体研究的不断完善,本体的定义有很多种,以下是几种比较有代表性的定义。1991年,Neches15等给出了构成相关领域词汇的基本术语、关系,以及这些词汇外延的规则。1996年,Swartout16提出本体是一个知识库结构中术语集合,该结构中的术语是按照继承关系组织起来的,强调了本体中术语(Terms)的重要性。1993年,Gruber17提出本体是概念模型明确的规范说明。1
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号