商务智能复习练习-－金锄头文库

关于数据仓库元数据的描述，下列不正确的是( )。A元数据描述了数据的结构、内容、码、索引等项内容B元数据内容在设计数据仓库时确定后，就不应该再改变C元数据包含对数据转换的描述D整个数据仓库系统的运行都是基于元数据的( )是在线分析处理的核心概念。A维 B时变性 C事实性 D分析开展数据挖掘的基本目的是( )。A建立数据仓库 B帮助用户作决策C从大量数据中提取有用信息 D对数据进行统计和分析将原始数据进行集成、变换、维度规约、数值规约是( ) 的任务。A频繁模式挖掘 B分类和预测 C数据流挖掘 D数据预处理常用的聚类分析一般属于( )。A半监督方法 B无监督方法 C监督方法 D弱监督方法关于强关联规则正确的说法是( )。A关联规则的支持度和置信度大于或等于用户指定的最小支持度和最小置信度B关联规则的支持度大于或等于用户指定的最小支持度C关联规则的置信度大于或等于用户指定的最小置信度D所有的频繁项集下面关于维的概念哪个是不正确的( )。A维是人们观察数据的特定角度B维的层次性是由观察数据细致程度不同造成的C“某年某月某日”是时间维的层次D“月、季、年”是时间维的层次数据集市是面向( ) 的特定应用，快速实现，成本低廉。A商场 B企业 C高层决策者 D业务单元或部门数据挖掘的结果是( )。A验证测验或探测业务查询 B揭示有兴趣的关联、聚类和分类 C明确的 D在少量源样本上是最正确的关联规则的核心是( )。A找出所有的项集 B计算出支持度和置信度C找出所有的关联规则 D找出所有的频繁项集( ) 中只有非零值才重要。A计数属性 B离散属性 C非对称二元属性 D对称属性某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的( )问题。A分类 B聚类 C自然语言处理 D关联规则发现 ID3 算法中信息增益是指( )。A信息的溢出程度 B信息的增加效益 C熵增加的程度最大 D熵减少的程度最大下列( )不是决策树的属性选择标准。A支持度 (关联规则中) B信息增益 Cgini指数 D2检验( )反映了关联规则的正确程度。A支持度 B置信度 C频繁度 D强度( )是构建数据仓库的重要环节，也是企业数据管理的核心。AETL B多维分析 C元数据 D概念模型将原始数据进行集成、变换、维度规约、数值规约是( )的任务。A数据预处理 B分类和预测C数据流挖掘 D 频繁模式挖掘关于强关联规则正确的说法是( )。A关联规则的支持度大于或等于用户指定的最小支持度B关联规则的置信度大于或等于用户指定的最小置信度C所有的频繁项集D关联规则的支持度和置信度分别大于或等于用户指定的最小支持度和最小置信度关于OLAP的特点下面正确的是( ) (1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A(1) (2) (3) B(1) (2) (3) (5)C(2) (3) (4) D(1) (2) (3) (4) (5)数据集市是面向( )的特定应用，快速实现，成本低廉。A商场 B企业 C业务单元或部门 D高层决策者下面关于维的概念哪个是不正确的( ) A维是人们观察数据的特定角度。B维的层次性是由观察数据细致程度不同造成的。C“月、季、年”是时间维的层次。D“某年某月某日”是时间维的层次。建立“数据仓库”的目的主要是( )。A规范管理数据 B联机分析与决策支持C更新数据方便 D日常事务处理下列( )属于决策树的属性选择标准。A信息增益 B置信度 C距离 D神经元关于元数据的描述不正确的是( ) A元数据可分为技术元数据和业务元数据B元数据是描述数据仓库内数据的结构和建立方法的数据C元数据的存储都是以数据库为基础的D元数据是数据仓库管理系统的重要组成部分数据仓库上的业务处理称作( )。 A联机事务处理 B联机分析处理C联机输入处理 D联机查询处理( )反映了关联规则的倾向程度。A支持度 B置信度 C频繁度 D强度( )中只有非零值才重要。A计数属性 B离散属性 C对称属性 D非对称二元属性ID3 算法中信息增益是指( )。A信息的溢出程度 B信息的增加效益 C熵增加的程度最大 D熵减少的程度最大常见的聚类方法是( )。AID3 BCART 决策树算法 CK-means DC4.5以下算法中( )是分类算法。 B 贝叶斯等包括决策树ADBSCAN 基于密度聚类算法 BC4.5 常见决策树算法 CK-means 云聚类 DEM 最大期望算法迭代算法建立“数据仓库”的目的主要是_。A规范管理数据B.日常事务处理 C更新数据方便 D.联机分析与决策支持数据集市的数据组织一般采用_模型。A星型模型 B雪花模型 C星网模型 D第三范式_是构建数据仓库的重要环节，也是企业数据管理的核心。A.ETL B.多维分析 C.元数据 D.概念模型数据集市是面向_的特定应用，快速实现，成本低廉。A.商场 B.企业 C.业务单元或部门 D.高层决策者_模型描述了数据仓库中多个事实表共享一个或多个维表的情况。A.星型模型 B.雪花模型 C. 关系模型 D.星系模型_属于操作型处理和分析型处理之间的一个中间层次。A.DB B.ODS C.DW D.ROALP关于OLAP和OLTP的说法,下列不正确的是_。A.OLAP事务量大,但事务内容比较简单且重复率高B.OLAP的最终数据来源与OLTP不一样C.OLTP面对的是决策人员和高层管理人员D.OLTP以应用为核心，是应用驱动的_是在线分析处理的核心概念。A.维 B.时变性 C.事实性 D.分析10、常用的聚类分析一般属于_ 。A.半监督方法 B.无监督方法 C.监督方法 D.弱监督方法当不知道数据所带标签时，可以使用_技术促使带同类标签的数据与带其他标签的数据相分离。A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链下列_不属于决策树的属性选择标准。A.信息增益 B.gini指数 C.维度 D.2 遗传算法借鉴了生物进化的概念，一般用于解决_问题。A.全局优化 B.局部优化 C.自然选择 D.变量筛选基于网格的聚类方法大多数是基于_。A.空间 B.时间 C.形状 D.密度聚类分析中，对属性非对称的二元变量的两个对象，一般采用_度量两者的距离。A.简单匹配系数 B.ID3系数 C.Jaccard系数 D.均值指数K-means算法比较简单，主要适用于_。A.凸型分布数据 B.凹型分布数据 C. 非数值型数据 D.图形数据不属于常用的分类方法是_。A.贝叶斯 B.决策树 C.支持向量机 D.K-modes关联规则的核心是_。A.找出所有的项集 B.计算出支持度和置信度C.找出所有的强关联规则 D.找出所有的频繁项集_是关联规则挖掘算法。A.FP增长算法 B.支持向量机 C.ID4 D.K-modes下列_不是移动智能商务的特点。A.智能型 B.移动性 C.复杂性 D.个性化开展数据挖掘的基本目的是_。A.建立数据仓库 B.帮助用户作决策C.从大量数据中提取有用信息 D.对数据进行统计和分析KDD是_。A. 数据挖掘与知识发现 B. 领域知识发现C. 文档知识发现 D. 动态知识发现将原始数据进行集成、变换、维度规约、数值规约是_的任务。A.频繁模式挖掘 B.分类和预测C. 数据预处理 D. 数据流挖掘数据仓库是随着时间变化的，下面的描述不正确的是_。A.