资源预览内容
第1页 / 共26页
第2页 / 共26页
第3页 / 共26页
第4页 / 共26页
第5页 / 共26页
第6页 / 共26页
第7页 / 共26页
第8页 / 共26页
第9页 / 共26页
第10页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
搜索引擎试一试在百度里面,输入关键字“搜索引擎”,你发现什么?概念l(search engine)是指是指根据一定的策略、运根据一定的策略、运用特定的计算机程序用特定的计算机程序搜集互联网上的信息,搜集互联网上的信息,在对信息进行组织和在对信息进行组织和处理后,为用户提供处理后,为用户提供检索服务的系统。检索服务的系统。 历史19901990年,加拿大麦吉尔大学(年,加拿大麦吉尔大学(University of University of McGillMcGill)计算机学院的师生开发出)计算机学院的师生开发出ArchieArchie。当时,。当时,万维网万维网还没有出现,人们通过还没有出现,人们通过FTPFTP来共享交流资来共享交流资源。源。ArchieArchie能定期搜集并分析能定期搜集并分析FTPFTP服务器上的文件名信服务器上的文件名信息,提供查找分别在各个息,提供查找分别在各个FTPFTP主机中的文件。主机中的文件。用户必须输入精确的文件名进行搜索,用户必须输入精确的文件名进行搜索,ArchieArchie告告诉用户哪个诉用户哪个FTPFTP服务器能下载该文件。服务器能下载该文件。虽然虽然ArchieArchie搜集的信息资源不是网页(搜集的信息资源不是网页(HTMLHTML文件)文件),但和搜索引擎的基本工作方式是一样的:自动,但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,搜集信息资源、建立索引、提供检索服务。所以,ArchieArchie被公认为现代搜索引擎的鼻祖。被公认为现代搜索引擎的鼻祖。 互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。组成搜索引擎一般由搜索器、索引器、检索器和用户搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成:接口四个部分组成:搜索器:其功能是在互联网中漫游,发现和搜集搜索器:其功能是在互联网中漫游,发现和搜集信息;信息;索引器:其功能是理解搜索器所搜索到的信息,索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档从中抽取出索引项,用于表示文档以及生成文档库的索引表;库的索引表;检索器:其功能是根据用户的查询在索引库中快检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;果排序,并能按用户的查询需求合理反馈信息;用户接口:其作用是接纳用户查询、显示查询结用户接口:其作用是接纳用户查询、显示查询结果、提供个性化查询项。果、提供个性化查询项。工作原理抓取网页 每个独立的搜索引擎都有自己的网页抓取程序每个独立的搜索引擎都有自己的网页抓取程序(spiderspider)。)。SpiderSpider顺着网页中的超链接,连续顺着网页中的超链接,连续地抓取网页。地抓取网页。 处理网页处理网页 搜索引擎抓到网页后,还要做大量的预处理工搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。重复网页、分析超链接、计算网页的重要度。 工作原理提供检索服务 用户输入关键词进行检索,搜索引擎从索引数用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和于判断,除了网页标题和URLURL外,还会提供一外,还会提供一段来自网页的摘要以及其他信息。段来自网页的摘要以及其他信息。 信息搜集功能定期搜索即每隔一段时间(比如即每隔一段时间(比如GoogleGoogle一般是一般是2828天),天),搜索引擎主动派出搜索引擎主动派出“ “蜘蛛蜘蛛” ”程序,对一定程序,对一定IPIP地地址范围内的互联网站进行检索,一旦发现新的址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自网站,它会自动提取网站的信息和网址加入自己的数据库。己的数据库。 提交网站搜索 网站拥有者主动向搜索引擎提交网址网站拥有者主动向搜索引擎提交网址 信息推荐原理当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法(关联规则)通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。 搜索引擎的分类分为:全文搜索引擎、目录引擎、元搜索分为:全文搜索引擎、目录引擎、元搜索引擎引擎全文搜索引擎全文搜索引擎全文搜索引擎又可细分为两种,一种是拥有自全文搜索引擎又可细分为两种,一种是拥有自全文搜索引擎又可细分为两种,一种是拥有自全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(己的检索程序(己的检索程序(己的检索程序(IndexerIndexer),俗称),俗称),俗称),俗称“ “蜘蛛蜘蛛蜘蛛蜘蛛” ”(SpiderSpider)程序或)程序或)程序或)程序或“ “机器人机器人机器人机器人” ”(RobotRobot)程序,)程序,)程序,)程序,并自建网页数据库,搜索结果直接从自身的数并自建网页数据库,搜索结果直接从自身的数并自建网页数据库,搜索结果直接从自身的数并自建网页数据库,搜索结果直接从自身的数据库中调用,如据库中调用,如据库中调用,如据库中调用,如googlegoogle和百度;另一种则是租和百度;另一种则是租和百度;另一种则是租和百度;另一种则是租用其他引擎的数据库,并按自定的格式排列搜用其他引擎的数据库,并按自定的格式排列搜用其他引擎的数据库,并按自定的格式排列搜用其他引擎的数据库,并按自定的格式排列搜索结果,如索结果,如索结果,如索结果,如LycosLycos引擎。引擎。引擎。引擎。 搜索引擎的分类目录索引目录索引严格意义上算不上是真正的搜索引擎,仅仅是严格意义上算不上是真正的搜索引擎,仅仅是严格意义上算不上是真正的搜索引擎,仅仅是严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可按目录分类的网站链接列表而已。用户完全可按目录分类的网站链接列表而已。用户完全可按目录分类的网站链接列表而已。用户完全可以不用进行关键词(以不用进行关键词(以不用进行关键词(以不用进行关键词(KeywordsKeywords)查询,仅靠分)查询,仅靠分)查询,仅靠分)查询,仅靠分类目录也可找到需要的信息。类目录也可找到需要的信息。类目录也可找到需要的信息。类目录也可找到需要的信息。 淘宝()淘宝()搜索引擎的分类元搜索引擎元搜索引擎(META Search Engine)元搜索引擎在接受用户查询请求时,同时在其元搜索引擎在接受用户查询请求时,同时在其元搜索引擎在接受用户查询请求时,同时在其元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。他多个引擎上进行搜索,并将结果返回给用户。他多个引擎上进行搜索,并将结果返回给用户。他多个引擎上进行搜索,并将结果返回给用户。什么是元(什么是元(什么是元(什么是元(metameta)?)?)?)? 中国期刊网()中国期刊网()搜索引擎及网站推广头部内容与网站推广的关系 在一个网页中,在一个网页中,之间,就是一之间,就是一个页面的头部信息部分,个页面的头部信息部分,GoogleGoogle的蜘蛛优先抓的蜘蛛优先抓取网页时的头部文件信息的描述,和关键字描取网页时的头部文件信息的描述,和关键字描述,百度的蜘蛛的喜欢程度不如述,百度的蜘蛛的喜欢程度不如GoogleGoogle。如何。如何优化这部分的内容信息。优化这部分的内容信息。META content= name=keywords关键字这个代码放到头部关键字这个代码放到头部中去,文字长度一般介于中去,文字长度一般介于150150个字符左右,个字符左右,meta content=name=Description网站描述也放到头部中去,网站描述也放到头部中去,长度可以多关键字约大一些,约长度可以多关键字约大一些,约300300个字符左个字符左右。右。标题标题页面标题最好能反应当页面标题最好能反应当前的内容描述。前的内容描述。 页面内容与网站推广的关系 页面内容是指访问网站是生成的页面内容,通页面内容是指访问网站是生成的页面内容,通常是指生成的常是指生成的htmlhtml代码文件时代码文件时之间的内容。百度的蜘蛛更喜欢这里的东西,之间的内容。百度的蜘蛛更喜欢这里的东西,而且这里面除去而且这里面除去HtmlHtml代码标记后的前代码标记后的前300300个字个字符通常显示为搜索引擎的检索时的描述内容,符通常显示为搜索引擎的检索时的描述内容,也是用户检查网站内容的关键之一。也是用户检查网站内容的关键之一。 页面超级链接与网站推广之间的关系页面超级链接与网站推广之间的关系 页面超级链接,就是网络蜘蛛游历整个网站的线页面超级链接,就是网络蜘蛛游历整个网站的线索,索,W3CW3C标准里,就有一条页面超级链接失效到标准里,就有一条页面超级链接失效到一定程序,就不能通过一定程序,就不能通过W3CW3C认证;同样,失效的认证;同样,失效的超级链接也是网络蜘蛛对网站游历时,游历的一超级链接也是网络蜘蛛对网站游历时,游历的一种标准。超级链接有两种情况,种标准。超级链接有两种情况,A A同域下的链接,同域下的链接,GoogleGoogle的蜘蛛比较喜欢这种链接方式。的蜘蛛比较喜欢这种链接方式。B B不同域不同域的链接,百度比较喜欢这种方式。要想优化这部的链接,百度比较喜欢这种方式。要想优化这部分内容分内容GoogleGoogle采用采用Sitemap.xmlSitemap.xml文件提交,百度最文件提交,百度最好采用一个站长地图文件链接到主页。这里介绍好采用一个站长地图文件链接到主页。这里介绍一个免费工具(在线一个免费工具(在线sitemapsitemap生成工具,以生成生成工具,以生成googlegoogle所需的所需的Sitemap.xmlSitemap.xml文件和百度所需的文件和百度所需的HtmlHtml文件。不过需要安装文件。不过需要安装JavaJava虚拟机。生成这两个文虚拟机。生成这两个文件后都到到网站根目录,件后都到到网站根目录,Sitemap.xmlSitemap.xml到到GoogleGoogle去去提交,提交,Sitemap.htmlSitemap.html在网站的页面上做一链接就在网站的页面上做一链接就可以了。)可以了。) 蜘蛛的工作周期与网站的推广的关系百度的工作周期相对来说比百度的工作周期相对来说比googlegoogle短一些,百短一些,百度大约在度大约在1010天左右重新访问网站一次,天左右重新访问网站一次,GoogleGoogle大约在大约在1515天左右重新访问一次网站。由于一天天左右重新访问一次网站。由于一天之内不能游历全球所有的网站,如果推广网站之内不能游历全球所有的网站,如果推广网站时,能到更多的网站上提交相应的网站信息,时,能到更多的网站上提交相应的网站信息,也是加快蜘蛛收录网站内容的重要环节。也是加快蜘蛛收录网站内容的重要环节。 搜索引擎的自定义排名 这是搜索引擎公司益利的主要手段,搜索引擎公司由于可以自定义排名,和可以过滤一些关键字、词和网站,这样可以造成网站无法收录到搜索引擎的数据库中。如果长期内,你的网站在搜索引擎中没有什么变化,可以考虑调整你网站里的字、词和网站里的内容。 竞价排名l竞价排名是一些搜索引擎公司所竞价排名是一些搜索引擎公司所推出的一种按效果付费的网络推推出的一种按效果付费的网络推广方式,其具体做法是,广告主广方式,其具体做法是,广告主在购买该项服务后,通过注册一在购买该项服务后,通过注册一定数量的关键词,按照付费最高定数量的关键词,按照付费最高者排名靠前的原则,购买了同一者排名靠前的原则,购买了同一关键词的网站按不同的顺序进行关键词的网站按不同的顺序进行排名,出现在网民相应的搜索结排名,出现在网民相应的搜索结果中。果中。竞价排名竞价排名的基本特点是按点击付费,广告出现在搜索结果中(一般是靠前的位置),如果没有被用户点击,则不收取广告费。在同一关键词的广告中,支付每次点击价格最高的广告排列在第一位,下面其他位置同样按照广告主自己设定的广告点击价格高低来决定。 竞价排名特点按效果付费,广告费用相对较低;按效果付费,广告费用相对较低;广告出现在搜索结果页面,与用户检索内容高度广告出现在搜索结果页面,与用户检索内容高度相关,增加了广告的定位程度;相关,增加了广告的定位程度; 竞价广告出现在搜索结果靠前的位置,容易引起竞价广告出现在搜索结果靠前的位置,容易引起用户的关注和点击,因而效果比较显著;用户的关注和点击,因而效果比较显著;搜索引擎自然搜索结果排名的推广效果是有限的,搜索引擎自然搜索结果排名的推广效果是有限的,尤其对于自然排名效果不好的网站,采用竞价排尤其对于自然排名效果不好的网站,采用竞价排名可以很好弥补这种劣势;名可以很好弥补这种劣势; 广告主可以自己控制广告价格和广告费用;广告主可以自己控制广告价格和广告费用; 广告主可以对用户点击广告情况进行统计分析。广告主可以对用户点击广告情况进行统计分析。 搜索引擎的使用技巧搜索“网络广告”,word文档,如何实现?搜索引擎的使用技巧以下技巧仅限百度在百度搜索框中输入股票代码、列车车次或者飞机航班号,您就能直接获得您所需要的信息。例如,输入深发展的股票代码“000001” 如果只知道某个词的发音,却不知道怎么写,或者嫌某个词拼写输入太麻烦,该怎么办? 只要您输入查询词的汉语拼音。例如“chenguodong”搜索引擎使用技巧Windows 系统自带的计算器功能过于简陋,尤其是无法处理一个复杂计算式,很不方便。只需简单的在搜索框内输入计算式, 回车即可。 例如:log(sin(5)2)-3+pi 度量衡转换 例如:例如:-5-5摄氏度摄氏度=?=?华氏度华氏度 搜索引擎使用技巧Google技巧邮政编码和区号查询邮政编码和区号查询 ,例如:邮编 杭州;区号 台州手机归属地查询手机归属地查询 , 其它见:搜索引擎使用技巧百度与google均可巧妙地选择关键字。 例如“搜索引擎”比搜索引擎准确。很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PowerPoint、PDF等格式存在。在普通的查询词后面,加一个“:” 英汉互译,例如appleSite语法的使用。特定网页上搜索 site : site : 网址网址 关键词关键词
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号