资源预览内容
第1页 / 共5页
第2页 / 共5页
第3页 / 共5页
第4页 / 共5页
第5页 / 共5页
亲,该文档总共5页全部预览完了,如果喜欢就下载吧!
资源描述
一、 什么是搜索引擎搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。搜索引擎的工作原理 搜索引擎的工作原理大致可以分为:1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。 3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。一 常用搜索引擎互联网浩如宇博如海,要找到自己想要的信息可如何是好?通过合理利用搜索引擎的搜索功能,将达到事半功倍的效果。搜索引擎是一种搜索工具,它的主要任务是在互联网中主动搜索其他网站的信息并对其自动索引,其索引内容存储在可供查询的大型数据库中。当用户利用搜索引擎查询信息时,它会提供包含该信息的相关网址及相应的链接。互联网上的搜索引擎工具基本上可分为两类:一类是综合型搜索引擎。包括通用型搜索引擎(如Google、百度等)和科学型搜索引擎(如Scrius、Google Scholar等);一类是针对某个专门领域的搜索引擎,如化学专业搜索引擎(ChemIndustry、ChemEngine 、ChemIndex等)。搜索引擎一般具有分类主题查寻和关键词查寻两种功能。前者是将搜索引擎收录的网址、文件,依据其内容、动态归档,点击分类名称,查看不同类的网址,也可以点击各网址上的标题,进入相应的网页去浏览更详细的信息;后者搜寻到的网页不是很多,但通过关键词可以查寻到更多更准确的信息,可以在输入框里填写关键词,然后提交查寻,这时系统将显示出检索到的与它们相关的网址、主页和简要信息。一般来说,通用型资源搜索引擎(如Google)在资源覆盖面有压倒性优势,Google成为检索化学信息最常用的工具。但由于其索引的资源无所不包,因此检索化学信息时常常会遇到的问题是检索结果集非常大、且包含许多与检索意图相关性小的内容。用户要获得自己需要的信息,常常要花费相当多的时间和精力。因此利用通用型资源搜索引擎获取化学信息尚有相当大的局限性。科技型搜索引擎此类工具既可用化学化工关键词搜索,又可直接从主页的化学化工学科类目录进入子目录进行检索。科技型搜索引擎虽然覆盖面向大众的信息极少,但检索的科学信息较多,有利于进行交叉科学的信息检索。不过此类搜索引擎终究不是单独面向化学化工资源的检索工具,因而对检索化学信息也有很大的局限性。建立面向某个主题、规模适度的搜索引擎成为很自然的选择。利用化学专业搜索引擎搜索带有专业特点的搜索词,其查全率和查准率较之一般综合搜索引擎要高。1、常用通用型搜索引擎Google搜索引擎 http:/www.google.com/ Google是目前世界上最优秀的支持多语种的搜索引擎之一。提供网站、图像、新闻组等多种资源的查询,也可以按照主体分类来浏览网页。Google的主要特点是容量大和查询准确。Google目录收录了10亿多个网址,这些网站的内容涉猎广泛,无所不有。Google擅长于为常见查询找出最准确的搜索结果,“手气不错”按钮会直接带您进入最符合搜索条件的网站,省时又方便。Google储存网页的快照,当存有网页的服务器暂时出现故障时您仍可浏览该网页的内容。 百度搜索引擎 http:/www.baidu.com/百度,2000年1月创立于北京中关村,是全球最大的中文搜索引擎。百度在中文互联网拥有优势,是世界上最大的中文搜索引擎。对重要中文网页实现每天更新,用户通过百度搜索引擎可以搜到世界上最新最全的中文信息。百度在中国各地分布的服务器,能直接从最近的服务器上,把所搜索信息返回给当地用户,使用户享受极快的搜索传输速度。雅虎搜索引擎 http:/www.yahoo.com/网易搜索引擎 http:/www.163.com/搜狐搜索引擎 http:/www.sohu.com新浪搜索引擎 http:/www.sina.com.cn搜狗搜索引擎 http:/www.sogou.com/2、常用科学型搜索引擎SCIRUS科学搜索引擎 http:/www.scirus.comElsevier于2001年4月推出了世界上的第一个科学技术搜索引擎Scirus,是目前互联网上最全面、综合性最强的科技文献门户网站之一。Scirus引擎的信息源主要是两部分:网页和期刊。目前Scirus已将1.67亿个与科学有关的网页编入索引中。这种搜索引擎网站的出现为科学家们在网络上和专有数据库中快速查找所需的信息打开了一道便捷之门。 Google Scholar http:/www.scholar.google.com/Google于2004年11月24日推出的免费学术搜索工具,引用牛顿的名言“站在巨人的肩膀上(Stand on the shoulders of giants)”作为口号。2006年1月11日,其面向国内用户的中文版“Google学术搜索”也正式推出。Google Scholar学术搜索引擎是一种纯学术性的搜索引擎,具有专业性强、覆盖面广、搜索功能好、使用便捷等特点,其搜索的范围涵盖几乎所有知识领域的高质量学术研究资料,包括论文、专业书籍以及技术报告等。 科学数据库跨库搜索引擎(OAI) http:/159.226.100.135/ejournal/SPT-OAIQuickSearch.phpOAI的全称为Open Archives Initiative Protocol for Metadata Harvesting,它的目标是:发展和促进在互操作能力方面的系列标准,以方便内容数据的高效分发。OAI的起因是为了加强以学术交流为目的的对电子印刷文档的访问,以及要保证科学数据在将来也可以访问的需求。CSDL作为OAI Service Provider,提供资源检索服务。科学视频搜索引擎 ScienceHack http:/sciencehack.com/ScienceHack是一专业视频类的搜索引擎。它独一无二的地方在于每一个视频都由一位科学家或工程师确认,目的是核实视频的精确性和质量,涉及的科学术语还会提供维基百科链接。 ISI Highlycited.com高引频著者网站 http:/isihighlycited.com高引频著者网站,列举世界最受瞩目的科学家的名单,是了解某个研究领域核心人物的最快捷的方法。 ISI不仅有科学家的列表,并且提供了包括科学家的履历、研究方向、已经出版的论文、图书等详细信息,特别提供了个人主页,为读者随时了解其研究动态提供了方便。3、常用化学专业搜索引擎化学工业资源搜索引擎 http:/www.chemindustry.com.cn/搜录了全球最优秀的化工产品生产厂家,是面向全球数据最全,信息量最大的化工专业网站!是化工行业主导目录和搜索引擎。化学搜索引擎 http:/www.chemonline.net/ 可全文检索4500个重要的化学化工网站。化学品搜索引擎 http:/www.chemindex.com/ 集化工产品、目录、网页为一体的全球化工搜索引擎。 化工专业搜索引擎 http:/www.chemspy.com 能够帮助你快速找到与化学和化工相关的数据库、期刊、专利等丰富的网络资源。化工搜索引擎 http:/www.chemyq.com/ 中国化工在线网的化工搜索,提供分类导航和关键词搜索。化学之门 http:/www.chemonline.net/chemdoor/default.asp 提供化学领域的网站分类目录、综合参考信息和网站推荐。也按关键词进行检索。4、Wikipedia维基百科网址:http:/www.wikipedia.org/网上互动式百科全书,提供新闻动态、历史上的今天及各主题之相关资源,包括人文、社会、自然、文化。维基百科(Wikipedia)是一个基于Wiki技术的多语言百科全书协作计划,也是一部用不同语言写成的网络百科全书,其目标及宗旨是为全人类提供自由的百科全书用他们所选择的语言书写而成的,是一个动态的、可自由访问和编辑的全球知识体。 维基百科全书,自2001年1月15日正式成立,由维基媒体基金会负责维持,截至2009年2月,维基百科条目数第一的英语维基百科已有270万条条目,而所有265种语言的版本共突破1,200万条条目,总登记用户也超越1,500万人,其中条目数前15名的维基百科共占总条目数的71%,大部分页面都可以由任何人使用浏览器进行阅览和修改,英语维基百科的普及也促成了其它计划,例如:维基新闻、维基教科书等计划的产生,虽然也造成对这些所有人都可以编辑的内容准确性的争议,但如果所列出的来源可以被审察及确认,则其内容也会受到一定的肯定。 中文维基百科于2002年10月24日正式成立,截至2009年2月,中文维基百科已拥有236,946条条目,此外尚有其他汉语系语言维基百科,包括:闽南语维基百科、粤语维基百科、文言文维基百科、吴语维基百科、闽东语维基百科、赣语维基百科及客家语维基百科等,皆是众多不同语言维基百科的成员之一。国内的搜索引擎有哪些?最近自己总结了一下,大致有以下这些搜索引擎。1、百度 百度搜索引擎目前包括:网页搜索、新闻搜索、图片搜索、MP3搜索、视频搜索等众多搜索引擎。其中,网页搜索市场占有率大。百度公司是李彦宏与徐勇与2001年1月1日在北京中关村成立的全资子公司百度网络技术(北京)有限公司,总公司于1999年底成立于美国硅谷。2001年08月百度正式发布Baidu搜索引擎Beta版,从而开始了独立提供搜索服务。2001年09月百度竞价排名首次启用,奠定了百度在搜索引擎行业龙头老大的地位。 2005年08月05日 百度公司在NASDAQ(纳斯达克)上市。2、谷歌 谷歌搜索引擎目前包括:网页搜索、图片搜索、视频搜索、地图搜索、购物搜索等搜索引擎。谷歌是google公司的中文名称,于2006 年4月12日正式启用。google由斯坦福大学的拉里佩奇(Larry Page)和赛吉布林(Sergey Brin ),于1998年9月7日在加州Menlo Park的朋友的车库里正式成立。 2005年7月,李开复加盟Google公
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号