资源预览内容
第1页 / 共15页
第2页 / 共15页
第3页 / 共15页
第4页 / 共15页
第5页 / 共15页
第6页 / 共15页
第7页 / 共15页
第8页 / 共15页
第9页 / 共15页
第10页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
开源BI平台选型Content1.BI系统概述2.主流开源BI系统3.建议选择4.Pentaho平台5.Pentaho计划BI系统介绍BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。组成系统:由数据仓库(或数据集市)、ETL流程、联机分析处理 (OLAP) 、查询报表、数据分析、数据挖掘等部分组成。中端BI,数据分析。高端BI,数据挖掘。低端:报表阶段。BI系统介绍Content1.BI系统概述2.主流开源BI系统3.建议选择4.Pentaho平台5.Pentaho计划主流开源BI系统介绍开源BI特点量级架构大数据支持中文Openi基于Java开发的Web应用,能对关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署;但目前已经不在发布单独版本,而是和pentaho集成,为其提供plugin轻使用Mondrian和Jpivot框架,报表引擎是jasperreport,数据挖掘接口是R-Project,相对来说开发和学习比较简单无不Bizgres卓越的数据处理性能,但目前已经没有维护了Pentaho以工作流为核心的、强调面向解决方案而非工具组件的BI套件,Pentaho偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。相对spagoBi来说功能较强,尤其是工作流一块做的相当不错。相关文档比较全重比较大的框架了,集成了相当多的开源项目,JfreeReport、Mondrian、Kettle、Weka基本都使用了。特别适合大型复杂项目的开发支持hbase,mapreduce支持SpagoBI使用java开发,有很强的扩展能力,相关文档较少。重TalendforETL,JasperReports无支持jasperjasperreport的支持最好,所以报表部分比较好,其它部分较弱轻使用Talend作为ETLContent1.BI系统概述2.主流开源BI系统3.建议选择4.Pentaho平台5.Pentaho计划建议选择基于以上的对比分析,建议选用pentaho作为我们的BI平台。优点:成熟稳定性:pentaho社区版目前还不断更新中, 目前最新版本5.2文档完备性:pentaho社区版的官方文档较完备,中文文档也较多。中文支持:报表支持中文。可扩展性:pentaho集成了很多优秀的开源组件,它集成了很多优秀的开源组件,如Weka做数据挖掘,Kettle做ETL工具,JfreeReport报表组件。支持大数据接入,如Hbase,mapreduce.劣势:重量级平台,它包含的组件很多,体系很庞大,学习掌握需要时间。虽然中文文档相对于其他开源平台为多,但多是老版本的,最新版本的文档只有英文。Content1.BI系统概述2.主流开源BI系统3.建议选择4.Pentaho平台5.Pentaho计划Pentaho介绍Pentaho介绍是一个统一,综合的开源商务智能平台套件(Suite),基于它,可以访问,集成,操作,可视化,分析各种数据来源,帮助你从数据中发现所需要的知识,有收费的EE版本和开源的CE版本。目前CE最新为5.2采用的开源组件:OLAP:Mondrian数据挖掘:WEKA报表:JFreeReportETL:kettle分为2大系统:BusinessAnalytics:BA组件,主要是可视化,报表,侧重于业务和展示。DataIntegration:DI组件,ETL工具等,侧重数据模型和转换。Pentaho介绍(BA)1个核心server:BAServer和userconsole:web界面用来管理用户创建的报表内容和业务逻辑,4个webbasedDesigner工具ReportDesigner:报表设计器Analyzer:过滤和可视化数据InteractiveReports:交互性报表环境DashboardDesigner:设计dashboard3个clientbasedDesigner工具:AggregationDesigner:从不同维度创建聚合表MetadataEditor:创建metadatadomain和modelSchemaworkbench:创建和编辑多维模型,为模型增加安全和计算Pentaho介绍(DI)1个server:DIServer:使用DIengine来做数据转换和基础4个Designer工具Spoon:定义job和转换的建模工具,转换:定义了数据的flow,job:包含了资源获取,执行其他转换。Kitchen:执行job的命令行,可以通过crontab调用Pan:执行Transformation的命令行Carte:远程执行job和transformation的webserver2个plugin:Instaview:使用模板来管理复杂的数据访问和准备 AgileBI: 提供一套BI的协助工具Content1.BI系统概述2.主流开源BI系统3.建议选择4.Pentaho平台5.Pentaho计划Pentaho计划鉴于pentaho是个庞大复杂的平台体系,学习掌握需要一定的时间和人员。但从其功能范围以及扩展性来看,一旦为我所用,则能避免很多重复的开发工作,并为后续的需求提供快捷的支持。Pentaho分为两大体系:BA和DI,建议分2人各专注一块,用约1个月的时间熟悉其使用,配置,开发。使用目前已有数据,建立ETL流程,建立演示环境,输出demo报表。后续再评估其效用,根据产品需求和内部规划,建立正式的生产BI平台,承担正式的产品需求,对外提供各种服务。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号