资源预览内容
第1页 / 共13页
第2页 / 共13页
第3页 / 共13页
第4页 / 共13页
第5页 / 共13页
第6页 / 共13页
第7页 / 共13页
第8页 / 共13页
第9页 / 共13页
第10页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
基于Microsoft Office SharePoint Server 2007的 微软企业级网站搜索解决方案,2,解决方案综述,微软企业级网站搜索解决方案 , 基于SharePoint强大的搜索引擎,支持对各种形态的Web站点内容的搜索 爬取基于Form认证的网站 爬取基于图片数字认证的网站 爬取使用Ajax技术的网站 大量通过Javascript生成链接的网站 适用场景 企业内外门户的搜索引擎 竞争情报分析系统的搜索引擎,内容提要,客户面临的挑战 解决方案介绍 应用场景 解决方案架构 实现流程 关键技术 解决方案的商业价值,企业级Web站点搜索引擎面临的问题,形态多样的Web站点给爬网带来的困难 现在很多网站都是基于各自的Forms验证,该如何爬取? 有很多网站在基于Forms基础上还提供了数字图片认证方式,由该如何爬取? 有很多网站为了提供各种动态效果使用了Ajax技术,这又该如何爬取? 网站有大量链接都是通过JavaScript生成的,如何爬取呢?,应用场景举例,基于Forms认证及图片数字认证的网站 基于Ajax技术的网站,解决方案架构,Crawling Result,Search Center Content,解决方案实现流程,WebPart Crawling Config Crawled Log,Search Results,SharePoint Document Lib,DB,Web.Config,Task Queue,Crawler ConnectString in “crawlconfig.xml”,MOSS 2007 SharePoint Search Service,Target sites for Crawling Form authentication enabled Digital image authentication,1,2,3,4,Crawling Results List,5,6,关键技术,部署场景:小型部署,一台搜索服务器 同时提供搜索引擎所需的各项功能,部署场景:中型部署,3台搜索服务器 分别提供搜索引擎所需的各项功能 支持更多并发用户,部署场景:大型部署,多台搜索服务器 分别提供搜索引擎所需的各项功能 横向扩展的性能 支持更多并发用户,解决方案的优势及商业价值,高效省时 安装方便,提供安装程序,傻瓜式的安装步骤。 类似Microsoft SharePoint 2007内置爬网配置界面,使得配置操作简单明了。 基于Windows Service的爬网引擎,控制管理变得非常容易。 IT优势 通过WePart与SharePoint Document Library的良好支持,实现了与Microsoft SharePoint 2007无缝结合。 源代码开放 完全开放源代码,可以方便扩展及完善。 信息资源增加 通过本解决方案可以获取Internet上更多的有价值信息 快速实现企业内异架构系统的信息发现 企业内不同平台架构的信息可以通过本解决方案快速的集中到SharePoint搜索中心, 2006 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号