资源预览内容
第1页 / 共64页
第2页 / 共64页
第3页 / 共64页
第4页 / 共64页
第5页 / 共64页
第6页 / 共64页
第7页 / 共64页
第8页 / 共64页
第9页 / 共64页
第10页 / 共64页
亲,该文档总共64页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
分类 编 - ?: T P39 1. 4 1密 级 :公开单 位 代码 : 10065- T 3 : 0920902 1研 究 生学位 论文论 文 题 目: 基 于 R SS 信 息源 的服 务 型机 器 人网络 检 索 系 统 的设 计 与 实 现生姓名 : 朱 会 亮 申请 学 位 级 别 :硕 士申请 专业 名称 : 计 算 机 应 用技 术研方向 : 网络 信 息 处 理指 导教 师 姓 名 : 孙 华 志专 业 技 术职 称 :教 授提 交 论文20 12 讣: 5天 津 师 范 大 学 硕 士 学 位论文摘 要随着 互 联 网技 术 的迅 猛 发展 ,网络 信 息过 载 问题越 来越 明显 ,如何 快 速 地 从海量信息 中获取所需 的部 分 ,成 为一个亟待解决 的问题 。R SS由于其 自身 的简洁性和通用性 ,改变 了信 息 的获取方式 ,通过聚合 网络 中 R SS 信息,解 决 了用户需登录多个 网站才 能搜索 到 自己需要 的 内容这 一 问题 。但 多数 R SS 新 闻 内容 具有 很大 的重复性 ,导致 检 索 到 的信 息重 复率 比较 高 , 内容 的关 联程度 不是很好 。本研 究是 以 R SS 信息源技术 为支撑 , 结合 2011 中国机器人大赛 家庭服 务组 比赛的实 际应 用 为研 究 背 景 ,为家 庭 服 务型机 器 人 量 身设 计 了 网络信 息 的检 索 功 能 。首先 对 网络 中相 关 的 X M L 文件 进 行 解 析 ,再 使 用 中文 分 词 和 词性 标 注 方 法 对 X M L 标题 进 行 词 性 标 注 和 处 理 ,然 后 按 円期 对 新 闻进 行 区分 和 分类 存储 , 并在 传 统 的 R SS检索技术上完成 了机器人根据用户给 出的关键 词来检索 R SS 新 闻信 息 、相关新 闻详细 内容检 索 以及过 滤 新 闻中相似 内容 等 功 能 ,使 得本 系统 能够 更 准 确 的 找到 网络 中相 关 的信 息 。最 后 经 过 系 统 运 行 以及 详 细 的统 计 和 对 比分 析 ,引 入准 确 率 和 召 回 率 , 以及F值 的评测 指标 ,得 到 了较 为理想 的结果 。该功 能模块 己成功应用 于 2011 年 中 国机 器人大赛家庭服务机器人 比赛 中,并取得 了 良好 的效果 。关键 词 : 网络化 机 器 人 ;服 务 型机 器 人 ;R SS ; 词 性 标 注ii大泮师范人,硕七学位论文 A b strac tW ith the rapid developm ent of Internet technology, the problem of netw orkinform ation overload is m ore and m ore obvious . H ow to obtain the required inform ationquickly from the m ass inform ation on the internet, w hi ch has becom e an urgentprobl em . R SS changed the w ay of obtaining inform ation because of its sim plicity andversatility. T he technology of R SS w hich can aggregate the inform ation on the internetm akes users find out the inform ation they need by the form at of R SS rather than login inm any portals to search for the i nform ation they need. B ut because of the repetitiveness ofm ost R SS new s, w hich lead to the high repetiti ve rate of inform ation, and lack of goodc o n n ectio n in th e c o n ten t o f n ew s.T he study is based on the R SS source of inform ation technology, com bined w ith thepractical application in the 2011 C hina fam ily-serving robots m atch as the background ofresearch to design the internet inform ation s search function for the fam ily-serving robot.Fi rstly, this study analyzes the X M L file, and tag the title of new s analyzed by using theopen m odule of C hinese w ord segm entation and speech tagging m ethods. T hen, thesenew s are differentiated and stored according to date. A nd according to the key w ords byusers afforded, robot can retrieve R S S new s and the detail of related new s, and filter thesim ilar contents of new s, w hich are based on the traditional R SS. So t his system can findthe relevant i nform ation m ore accurately on the i nternet.Fi nally, accordi ng to the operati on, statistics, com pari son and analysi s of system , andthe introduction of the value of P and R and the evaluation param eter, a good result i sachieved. T his functi on m odule has been successfully used in the 20 11 C hinafam ily-serving robots m atch, and achieved good effect.Key wo rds : N etw ork robots; serve robots; R S S ; speech taggingin大泮 师 范 人 学 硕 -h 学位 论文目 录第 1 章 绪论 11.1 机 器 人发 展 状 况 及 应 用 前景 11.1.1机 器 人 发展 概 述 11.1. 2服 务 M 机 器 人 31.1. 3机 器人 的 网络 化 41.2RSS 综 述 51. 2.1国外 R SS 技 术 的发展 51. 2 . 2国 内 R S S 技 术 的发 展 61. 3 本 论 文 的主要 研 究 内容 及组 织 结构 7第 2 章 机 器 人 网络 检 索 系 统 的相 关理 论 92 . 1 R S S 92.1.1R SS 新 闻 的相 关 概念 92.1. 2R SS 技 术 原 理 102.1. 3R SS2 . 0 规 范 122.1. 4R SS 技 术 的特 点 142.2词 性 标 注 152. 2.1中文 分 词 方 法 162. 2. 2词 性 标 注 方 法 182. 2. 3隐 马尔 可 大模 M192.3系 统 开 发 平 台 2 12.4本 章 小结 22第 3 章 系统 设 计 和实 现 243.1 系统 需 求 分 析 243.2系统 总体 设计 253.2.1系统 构 成 253 . 2. 2系统 流 程 273.3关键 词提 取模 块 293 . 3.】 R SS 文 件 佔 息 捉 取 293 . 3.2问忭注 处 理 293 . 3. 3) 器R S J 义 f 1 ? / mm ,( , L R S S j t f l jm R S S F c c d s :内, 项11 = _ 内容项H = 内 容 捉供 使 川 的 卞 符编 f i i和 ) 乜义 义伫i的 X M L 版 水 ,X M L l )- l J; r| 天津师范人学硕士学位论文 第 2 行 则 是 该 文 档 的 元 素 ,这 里 的含 义 是表 明这 是 一个 R SS2. 0 版 本 的文 件 。元 素下 面 的子 元 素 ,就 是 R SS Feeds 的 目录列 表 ,它 是 元 素 的唯一子 元 素 。在 下 包 括 3 个 必 备 的子 元 素 :,这 是 频 道 的标 题 或 名 称 ,通 常 情 况 下 ,它 和 站 点 页 面 内容 的 title 是 一-致的 ;,是和 站 点对 应 的 网页 内容 的链接 ,通 过它可 以直接 连 接到源 网页 中去 读取 完 整 的新 闻 内容 。, 这是对这条 RSS 新闻内容的概述信息。我们还可以增加一些可选元素来完善和丰富的信息,例如(版权声明) 、 (语言)等元素。具体的新闻摘要是依靠来实现的,一般一条新闻就是一个 1 下至少有一个或,其他项 则 可 以根 据 用 户 的需 要 进 行 添 加 。例 如 ,如 果用 户 有 获 得发 布 R 期 和 时 间信 息 的需要时,便可以增加兀素,它是 的可选子元素,它的内容是描述发 布 円期 和 时 间 。2.1. 4 R S S 技 术 的特 点R SS 技 术 所 具 备 的主要 特 点有 :(1 )获 取 信 息 的 时 效 性R SS阅读 器 是按 照 使 用 者 提 前 制 定好 的 更新 策 略 ,来 实现 与信 息源 数 据 的 同歩更 新 。 由于 “ 信 息 推 送 “ 是 R SS 技 术 的根 本理 念 之 一, 一旦 发现 订 阅 的 网站 中 的 网页 内容 有 更 新 时 ,R S S就 会 马上 把 新 的新 闻信 息 “ 推 送 “ 到 使用 者 的 阅读 器 中 ,这大 大 的提 高 了信 息 的价 值 性 和 实 时性 。(2 ) 低 成 本 的信 息 发 布R SS 是 一种 W 途 广 、轻 ; t 级 、扩 展性 人的 儿数 据 ) 义 ,足?种 联 合推 广 格 式 ,这 使 ?3 它 I T 以共 ? :多种 信 息 。JMI ., iIiT - R S S Feeds Ji 种 X M L 义件 ,具 有 标 准 化 、-14 -天津师范大学硕十学位论文 简单 化 、易 生成和 通用 性 等
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号