资源预览内容
第1页 / 共20页
第2页 / 共20页
第3页 / 共20页
第4页 / 共20页
第5页 / 共20页
第6页 / 共20页
第7页 / 共20页
第8页 / 共20页
第9页 / 共20页
第10页 / 共20页
亲,该文档总共20页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
什么是搜索引擎?第一组一、引擎(ynqng)v【英】enginev汉语释义:发动机的 核心部分,因此习惯 上常用引擎指发动机 它是整个汽车的动力 源泉。二、搜索引擎是指根据一定的策略、运用特定的计算机 程序从互联网上搜集信息,在对信息进行 组织和处理后,为用户提供检索服务,将 用户检索的相关信息展示给用户的系统。英译 search engine三、搜索引擎的组成搜索引擎的组成搜索器索引器检索器用户接口 下一页 v搜索器的功能是在互联网中漫游,发现和搜 集信息。它常常是一个计算机程序,不停地 运行。它要尽可能多、尽可能快地搜集各种 类型的新信息,同时因为互联网上的信息更 新很快,所以还要定期更新已经搜集过的旧 信息,以避免死链接和无效链接。返回v索引器的功能是理解搜索器所搜索的信息, 从中抽取出索引项,用于表示文档以及生成 文档库的索引表。返回v检索器的功能是根据用户的查询在索引库中 快速检出文档,进行文档与查询的相关度评 价,对将要输出的结果进行排序。检索器常用的信息检索模型有集合理论 模型、代数模型、概率模型和混合模型四种 。返回v 用户接口的作用是输入用户查询、显示 查询结果、提供用户相关性反馈机制。主要 的目的是方便用户使用搜索引擎,高效率、 多方式地从搜索引擎中得到有效、及时的信 息。用户接口的设计和实现使用人机交互的 理论和方法,以充分适应人类的思维习惯。用户输入接口可以分为简单接口和复杂 接口两种:简单接口只提供用户输入查询串 的文本框;复杂接口可以让用户对查询进行 限制 。四、工作原理n抓取网页n处理网页n提供检索服务抓取网页v每个独立的搜索引擎都有自己的网页抓取程 序。它会顺着网页中的超链接,连续的抓取 网页。被抓取的网页被称之为网页快照。由 于互联网中超链接的应用很普遍,理论上, 从一定的网页出发,就能搜集到大多数的网 页。处理网页v搜索引擎抓到网页后,还要做大量的工作, 才能提供检索服务。其中,最重要的就是提 取关键词,建立索引文件。其它还包括去除 重复网页、分词(中文)、判断网页类型、 分析超链接、计算网页的重要度等。提供检索服务v用户输入关键词进行检索,搜索引擎从索引 数据库中找到匹配该关键词的网页。五、搜索引擎分类全文搜索引擎目录索引类搜索引擎 按照工作方式的不同 元搜索引擎 非主流形式全文搜索引擎v从互联网上提取各个网站的信息而建立 的数据库中,检索与用户查询条件相匹 配的相关记录,然后按照一定的排列顺 序将结果返回给用户。目录索引类搜索引擎v虽然具有搜索功能,但严格意义上算不上是 真正的搜索引擎,仅仅是按照目录分类的网 站链接列表而已,用户完全可以不用进行关 键词查询,仅靠分类目录就可以找到所需信 息。元搜索引擎v元搜索引擎在接受用户查询请求时,同时在其 它多个引擎上搜索,并将结果返回给用户,在 搜索结果排列方面,有的直接来源引擎的排列 搜索结果,有的则按自定规则将结果重新排列 组合。非主流形式v除了上述三大类以外,还有以下几种非主流 形式: 集合式搜索引擎门户搜索引擎 免费链接列表六、作用v1.为网络用户提供便利v2.是研究网站用户行为的有效工具七、怎样成为一名搜索高手1.选择适当的查询词 2.表述准确 3.查询词与主题的关联程度和简练程度 4.根据网页特征选择查询词如何迅速、准确的在网上搜寻所需资料v找软件下载v找问题解决办法v找论文v找人v找产品的信息
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号