资源预览内容
第1页 / 共38页
第2页 / 共38页
第3页 / 共38页
第4页 / 共38页
第5页 / 共38页
第6页 / 共38页
第7页 / 共38页
第8页 / 共38页
第9页 / 共38页
第10页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
MOSS企业搜 索 深度挖掘李劼 商务解决方案技术专家 微软中国苏永锐 SharePoint技术解决方案专家 微软中国日程微软企业搜索解决方案概述搜索更多的文件格式和内容源类型互联网网站搜索与搜索结果整合条条大路通罗马:搜索管理的多样化我知道你不知道我知道:优化搜索结果的相关性搜索增强十全大补贴Microsoft Search Server 2008微软企业搜索解决方案概述企业搜索和互联网搜索有什么不同? 内容源不同内部门户网页文件共享服务器 SharePoint站点,Lotus Domino数据库,Exchange公用文件夹关系型数据库:SQL Server, Oracle, DB2, MySQL安全性要求不同谁能看,谁不能看? 搜索达到的深度不同各种类型文档的全文索引需求 IT管理角度的需求不同可管理爬网时段,可定制最佳匹配微软企业搜索解决方案概述基于MOSS2007的企业搜索解决方案技术架构 (I)索引器负载均衡爬网用户搜索请求Web前端索引内容传输查询服务器各种内容源微软企业搜索解决方案概述基于MOSS2007的企业搜索解决方案技术架构 (II)搜索更多的文件格式和内容源类型默认的文件格式就足够了吗? 文件格式:MOSS预装支持Office文档等格式 内容源:预装支持文件共享、SharePoint、网站、数据库、 Exchange PF、Lotus Notes怎么可能足够? 我要全文搜索CAD文档,我要提取元数据! 我有太多的PDF文档和RAR、ZIP压缩过的文档,你能全文 搜索吗? 我还想搜MP3的ID3 Tag,还想搜JPG的元数据搜索更多的文件格式和内容源类型MSSEARCH架构微软一直以来沿用的企业搜索架构SQL Server 2000, SQL Server 2005, SQL Server 2008Windows Desktop Search v1, v2, v3, v4(future)Windows Server Indexing ServiceWindows Vista, Windows 7SharePoint 2001, SharePoint 2003, SharePoint 2007, WSS 1/2/3, SharePoint 14 对于文件格式和内容源的扩展性 iFilter Protocol Handler搜索更多的文件格式和内容源类型基于MSSEARCH架构进行扩展 通过iFilter扩展支持全文搜索的文件格式 MOSS内置iFilter支持118种常用文件格式,加上各种网页后缀名可达 数百种 第三方iFilter数量众多RAR, ZIP, CAB, EXE, DWG, DWF, PDF, Visio将会推出Microsoft iFilter Pack,包括 TIF OCR方式搜索安装在MOSS上的时候注意注册表项 通过Protocol Handler扩展支持的内容源如果我不想通过BDC搜索数据库如果我的某个应用,要有自己独特的架构注意GetSecurityDescriptor ,有它就有安全 想要自己编?没问题!Windows 2003 Platform SDKMOSS SDK (v1.2)演示CAD文档搜索及展现李劼 商务解决方案技术专家 微软中国截图演示互联网网站搜索与搜索结果整合互联网网站技术的复杂性 现在很多网站都是基于各自的Forms验证,通过Cookie保存 验证信息,该如何爬取? 有很多网站在基于Forms基础上还提供了数字图片认证方式 ,由该如何爬取? 有很多网站为了提供各种动态效果使用了Ajax技术,这又该 如何爬取? 网站有大量链接都是通过JavaScript生成的,如何爬取呢?应用场景举例基于Forms认证及图片数字认证的网站基于Ajax技术的网站关键技术爬网模块 WinForm + .NET2.0 Webbrowser Control + MSHTML Control使用基于WinForm能充分利用windows的消息循环及其多线程 机制。使用.NET2.0 Webbrowser Control获取网页,可以利用IE内核 快速实现高效爬网网页分析基于IE内核的MSHTML 控件数字图片认证模块采用“Otsu阈值算法”二值化图片预处理采用“欧氏最小距离法”聚类分析识别图片数字 爬网配置模块 WebPart开发及数据库 的读取使用WebPart开发模板控件,快速开发WebPart使用MenuTemplate、SPGridView类实现与SharePoint Search Service的无缝集成在wss_minimaltrust.config文件中添加节点实现对数据库的读写 模板控件下载地址: http:/www.oceanstudio.net/Lists/List2/Attachments/24/VSeWSS -new%20version.zip演示GrabberX苏永锐 SharePoint技术解决方案专家 微软中国截图演示搜索管理的多样化条条大路通罗马 并不是只有用SharePoint那个Web界面才能管理爬网! 如果你是IT管理人员,你想要什么?用命令行方式管理爬网,使其更自动化 我讨厌Web缓慢的响应速度和Javascript,我要MMC或者Windows程 序方式的管理 我要批量添加Lotus Notes数据库作为爬网内容源MOM能不能监视SharePoint的爬网搜索状态 ?如果你是开发人员,你想要什么?我要把爬网的管理集成进自己的应用中我要更方便的调试管理爬网的方法搜索管理的多样化五湖四海来相会 PowerShell:下一代的万金油、大力丸 MOM SharePoint Manageability Kit:你太有才了 MOSS Search Admin:符合人类使用习惯的开源搜索管理 Windows Form程序 调用Web Service:想怎么搞,就怎么搞搜索管理Object ModelNamespace: Microsoft.Office.Server.Search.Administrat ion BestBet ContentSource CrawlRule Schedule Scope Ranking Mapping Keyword 演示搜索管理李劼 商务解决方案技术专家 微软中国截图演示优化搜索结果的相关性我知道你不知道我知道你不知道我知道你不知道 汉语分词:搜索引擎要懂中文WordBreaker(分词器)扩展 错别字?你是不是要找开源的中文的Did you mean功能噪声词:你别想找到我C:Program FilesMicrosoft Office Servers12.0DataConfignoisechs.txt 最佳匹配!企业内自己的“竞价排名” 红薯白薯地瓜皆是番薯:关键词的同义词、近义词C:Program FilesMicrosoft Office Servers12.0DataConfigtschs.xml截图演示优化搜索结果的相关性只有想不到,没有做不到 你自己的高级搜索Webpart 把MOSS搜索嵌入你自己的企业应用:WebService、OM Enterprise Search Query SyntaxKeyword+/-双引号Scope:TECHED Author:JieLiURLk=,v=,s=,start=,a=SQL SyntaxCONTAINS, LIKE, FREETEXTORDER BYSCOPEMetadata,Property,托管属性演示企业搜索查询语法李劼 商务解决方案技术专家 微软中国截图演示搜索增强十全大补贴坚持拿来主义一百年不变 中文版“你是不是要找” GrabberX,互联网网站抓取好帮手 MOSS Search Admin,用OM管理搜索 Faceted Search,搜索结果分类 Hot Search,用户热门搜索指南预定义搜索,给用户一个推荐选择 大量的示例!Enterprise Search Jumpstart Kit 1.0iFilter, Protocol Handler, Custom Security TrimmerMicrosoft Search Server 2008你们是第一批公开看到功能演示的人! 专业的企业搜索服务器,只做搜索 整合其他搜索引擎,包括你自己的应用 Express:要的就是免费 比Microsoft Office SharePoint Server 2007 for Search Enterprise Edition/ Standard Edition要好念太多了!Microsoft Search Server 2008第一时间带给你 可以单一服务器部署,也可以做服务器场(Express版本限 制为单一服务器部署) 数据库可以使用SQL Server或SQL Server Express如果用SQL Express,由于4G的数据库限制导致能爬的文档数为十 五万三十万用完全版本的SQL没有限制,但每一个Index不要超过五千万文档数 需要Windows 2003 SP1以上,或Windows 2008多语言支持 x86/x64架构Microsoft Search Server 2008第一时间带给你 安装速度超快,装好一个MOSSfS要一小时,MSS最简单装 只要20分钟全新的管理界面,搜索专注 增强的索引格式,更高的压缩比 优化的SQL访问,提高爬网、查询效率稳定性更好 完整索引PowerPoint格式文件Microsoft Search Server 2008第一时间带给你整合!整合! 只要外部应用搜索结果返回编码符合标准的XML,就可以在 MSS上用XSLT转换后展现非常简单的定义方式 已经有很多定义可以使用:通用搜索引擎:Live Search, Yahoo Search新闻搜索:Live News, Yahoo News, Google News图像、视频搜索:Yahoo Image Search, Flickr, Youtube专项搜索:MSDN, Technet, Google Blog, LinkedIn, WikiPediaMicrosoft Search Server 2008功能对比 数据库搜索MSS:不具备BDC,但可整合企业内其他应用的搜索结果,也可通 过PH扩展MOSS:用BDC或者Custom PH搜索数据库MOSS Update in 2008:同时具备BDC与搜索整合功能部署形式MSS Express:独立服务器部署MSS/MOSS:支持服务器场部署索引文档数量MSS/MSS Express:没有限制MOSS/MOSSfSEE:没有限制MOSSfSSE:五十万演示Microsoft Search Server 2008李劼 商务解决方案技术专家 微软中国截图演示答惑解疑Q&A参考资料MOSS SDK v1.2 http:/download.microsoft.comOTEC Forum http:/www.msotec.net:81/forumsMOSS Search Admin http:/www.codeplex.com/searchadmin GrabberX http:/www.codeplex.com/grabberx Faceted Search http:/www.codeplex.com/facetedsearch CN Did you mean? http:/www.codeplex.com/cndidyoumean 感感谢谢您参与此会您参与此会场场!您的意您的意见见与建与建议对议对 我我们们非常重非常重 要。要。请请您填写反您填写反馈馈表。表。 2007 Microsoft Corporation. All rights reserved. Microsoft,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号