当前位置首页 > 北语网院> 正文

22秋《大数据技术与应用》作业_2

22秋《大数据技术与应用》作业_2

关联规则X→Y表示中X称为

0. 前件

1. 后件

2. 中间件

3. 以上都不对


关联规则X→Y表示中Y称为

0. 前件

1. 后件

2. 中间件

3. 以上都不对


决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是

0. ID3

1. C4.5

2. CART

3. 以上都不对


训练随机森林模型实例的语句是

0. from sklearn.tree import DecisionTreetClassifier

1. clf=DecisionTreetClassifier()

2. clf.fit(Xtrain,Ytrain)

3. predictions=clf.predict(Xtest)


创建模糊C均值聚类算法实例的语句是

0. from fcmeans import FCM

1. fcm=FCM(n_clusters=3)

2. fcm.fit(X)

3. fcm_labels=fcm.u.argmax(axis=1)


数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的下四分位数为

0. 2

1. 4

2. 6

3. 8


处理缺失值的方法有删除和()

0. 替换

1. 复制

2. 修改

3. 屏蔽


以下不是数据清洗的评价标准()

0. 数据的可信性

1. 数据的可用性

2. 数据清洗的代价

3. 数据准确性


创建随机森林模型实例的语句是

0. from sklearn.ensemble import RandomForestClassifier

1. rf.fit(Xtrain,Ytrain)

2. predictions=rf.predict(Xtest)


fromsklearn.neighborsimportLocalOutlierFactornclf=LocalOutlierFactor(n_neighbors=20)n从上面语句可以看出LOF实例的参数k取值为

0. 10

1. 20

2. 30

3. 40


属于基于聚类的异常值检测方法包括

0. MA滑动评价法

1. 3-Sigma方法

2. One-Class SVM

3. 基于K-Means聚类的异常检测


数据挖掘解决的问题包括

0. 数据预测

1. 发现数据内在结构

2. 发现关联性

3. 模式甄别


聚类分析可以用于

0. 顾客分组

1. 分类

2. 回归

3. 找出显著影响


数据挖掘(DataMining)则是知识发现(KDD)的核心部分,它指的是从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为

0. 规则

1. 概念

2. 规律

3. 模式


数据挖掘要解决的主要任务包括

0. 预测建模

1. 关联分析

2. 聚类分析

3. 异常检测


经过z分数标准化处理后,数据的绝对值都小于等于1

1.T

2.F


众数在一组数据中只有一个

1.T

2.F


定量数据包括无序数据和有序数据

1.T

2.F


经过z分数标准化处理后,数据的绝对值可以大于1

1.T

2.F


数据按照从小到大的顺序排列后,当数据个数为奇数时,中位数为中间三个数的平均值

1.T

2.F


经过z分数标准化处理后,数据均值为原数据平均值,标准差为原数据标准差

1.T

2.F


分箱法是针对连续的数值型数据中噪声进行处理

1.T

2.F


决策树每个“内部结点”对应于整体属性“测试”(test)

1.T

2.F


下四分位数是指数据从大到小排列排在第25%位置的数字,即最小的四分位数(下四分位数)

1.T

2.F


数据挖掘可以视为机器学习和数据库的交叉,它主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据

1.T

2.F


版权保护: 本文由老虎奥鹏原创,转载请保留链接: www.wsxueba.com

猜你喜欢