第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
本文格式为Word版,下载可任意编辑FAST企业智能化海量信息搜索方案 XXXXX 企业探寻平台建议书 微软(中国)有限公司上海分公司 2022/4/20 目 录 一、工程背景 二、工程软硬件配置 2.1 运行平台软件配置 2.2 运行平台硬件配置 三、XXXXX企业探寻平台设计 3.1 总体目标 创办企业信息仓库 供给最好的探寻功能 3.2探寻平台总体架构 3.3供给最好的探寻功能(Best Search Technology) 实现文档级的安好探寻 探寻条件输入框的自动提示功能(Autocompletion) 可调整的相关性排序(Tunable Relevency) 实体提炼(Customizable Entity Extraction) 自动分类 自动聚类 先进的语言学处理功能 高亮度显示和直达功能 关键字 动态导航和动态钻取 探寻管理 四、企业探寻平台功能概要 探寻 探寻功能 探寻结果处理 索引 产品的索引机制? 产品是否支持增量式的索引更新?假设是,如何实现? 产品支持哪些类型的文档? 产品是如何处理和文档相关的元数据的? 产品如何支持XML文档的索引? 同一个引擎能否支持多个数据源的索引和探寻? 产品是否同时支持对文档的索引和检索? 索引的大小有限制吗?请细致解析。 4 5 5 5 8 8 8 8 9 11 11 12 12 14 17 17 17 18 18 18 18 22 22 22 26 29 29 30 30 34 34 34 34 34 索引的文档数量有限制吗?请细致解释。 网路信息采集 指点功能 管理和监测 管理工具 集成和客户化 集成 客户化与编程接口 安好性 应用安好 管理安好性 技术规格 平台支持 根本架构 部署和运作 可伸缩性 性能指标 可用性 国际化支持 附件 一 FAST ESP?系统架构 相关性 架构 可扩展性和性能 管理 附件 二FAST服务与培训? 附件 三FAST 背景 35 35 36 36 36 38 38 39 41 41 42 42 42 43 45 45 45 45 45 46 50 51 53 54 58 60 一、工程背景 企业员工都在努力工作使业务获得更大进展,当他们需要那些可以公开获取的信息时,他们知道如何通过互联网的探寻引擎找到.但是,当他们需要跟集团业务相关的学识时,他们需要的是企业探寻平台.。 客户和供给商使用XXXXX的门户网站探寻XXXXX相关的产品,服务和数据 。 因此,XXXXX需要建立一套系统,能让使用者分外简朴和便当地得到所需要的信息和学识,同时又需要符合IT管理上的安好性和可管理性 FAST根植于挪威,自1997年以来多年来专注于企业级中文信息挖掘领域,在中文语义分析、中文信息挖掘、人工智能、海量信息处理等方面一向处于业界的领先水平。本案利用FAST的独绝技术,向XXXXX集团建议增加营业收入和提高企业生产力的基于信息探寻平台的先进的商业运作理念的信息系统。 FAST梦想与XXXXX集团共享以往我们在信息系统创办中的一点阅历,容许投入充分的技术气力参与信息系统创办。为XXXXX系统创办付出一份气力。 二、工程软硬件配置 2.1 运行平台软件配置 操作系统: Windows 企业探寻平台软件:FAST Enterprise Search Platform (ESP) ESP软件包括: FAST ESPTM Key characteristics: ? ? On-the-fly data indexing; incremental document indexing Advanced query capabilities including proximity operators, multiple query terms, wild cards, inclusion/exclusion operators, text/integer/Boolean expressions, parametric search and search hit in context Developers SDKs and APIs for customizing document access, query- and result-processing, administration and presentation ? Advanced linguistics for any available language Web Crawler & File Traverser FAST JDBC Connector Search Business Center ? Configurable web crawler for indexing of documents retrieved from web servers, including HTML, PDF, XML, and 225+ other data formats FAST Security Access Module (SAM) FAST In-document Highlighting Categorization & Clustering Live Analytics and Navigation TMSupporting retrieval of searchable data from any JDBC compliant database Graphical tool for managing dictionaries, reporting, as wewll as controlling the ranking of results, optimization of ranking based on business requirements including absolute and relative boosting and analysis of query logs The Document Hit Highlighting feature enables you to create a search application where the end-user may browse through the query hits within the full context of a matching document. Automatic document classification into pre-defined categories, dynamic supervised and unsupervised results clustering Dynamic drill-down within results sets based on specified parameters (product attributes, geography, etc.). Support for full-text and multi-level sorting 2.2 运行平台硬件配置 单台机配置: (4 CPUs / 8G RAM / 15,000 RPM HDD / RAID) 节点数: 2台服务器 (Full fail-over mode) 系统规律布局图: 6
收藏 下载该资源
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号