当前位置首页 > 北语网院> 正文

22秋《大数据技术与应用》作业_4

22秋《大数据技术与应用》作业_4

数据等级排序T的是

0. 定距等级定比等级定类等级定序等级

1. 定比等级定序等级定距等级定类等级

2. 定比等级定距等级定序等级定类等级

3. 定比等级定类等级定序等级定距等级


利用pandas处理数据缺失值时,用于填充缺失值的函数为

0. isnull

1. head

2. fillna

3. dropna


数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位数为

0. 20

1. 22

2. 20.5

3. 28


从软件库中导入孤立森林isolationforest算法类的语句是

0. from sklean.ensemble import IsolationForest

1. LocalOutlierFactor

2. clf= IsolationForest(max_samples=100,random_state=0)

3. clf.fit(X_train)

4. y_pred=clf.fit_predict(X)

5. y_pred_test = clf.predict(X_test)


以下不是大数据的特征()

0. 大量

1. 多样

2. 高速

3. 实时


pandas中用于合并表的方法为

0. Pandas中的merge方法

1. Pandas中的head方法

2. Pandas的tail

3. 以上都不对


以下不属于大数据分析方法的是()

0. 统计分析

1. 数学模型

2. 机器学习

3. 人工智能


fromfcmeansimportFCMnfcm=FCM(n_clusters=4)n从上面代码可以判断模糊C均值聚类的聚类数为

0. 1

1. 2

2. 3

3. 4


项集S={尿布,啤酒,牛奶,可乐},则项集S称为

0. 1项集

1. 2项集

2. 3项集

3. 4项集


训练孤立森林isolationforest实例的语句是

0. from sklean.ensemble import IsolationForest

1. LocalOutlierFactor

2. clf= IsolationForest(max_samples=100,random_state=0)

3. clf.fit(X_train)

4. y_pred=clf.fit_predict(X)

5. y_pred_test = clf.predict(X_test)


决策树结构包括

0. 根结点

1. 分支

2. 内部节点

3. 叶结点


定量数据包括

0. 连续数据

1. 离散数据

2. 定距等级数据

3. 定比等级数据


常用的描述统计分析方法包括

0. 对比分析法

1. 平均分析法

2. 交叉分析法

3. 以上都不对


常用的分类方法包括

0. 朴素贝叶斯分类器

1. 决策树

2. KNN

3. 以上都不对


大数据产生和发展条件()

0. 收集

1. 处理

2. 分析

3. 应用


z分数标准化是对离散数据进行标准化的方法

1.T

2.F


盖帽法是将某连续变量均值上下三倍标准差范围外的数值全部删除

1.T

2.F


Apriori算法中频繁2项集的每个项集长度均为2,但并非都是频繁的

1.T

2.F


数据挖掘的过程都是有统一一致的步骤的

1.T

2.F


数据按照从小到大的顺序排列后,当数据个数为偶数时,中位数为中间两个数任选一个

1.T

2.F


上四分位数是指数据从大到小排列排在第75%位置的数字,即最大的四分位数(上四分位数)

1.T

2.F


等深分箱方法是指每个分箱中样本取值范围一致

1.T

2.F


min-max标准化是对离散数据进行标准化的方法

1.T

2.F


定序数据层次比定距数据高

1.T

2.F


定性数据包括离散数据和连续数据

1.T

2.F


版权保护: 本文由老虎奥鹏原创,转载请保留链接: www.wsxueba.com

猜你喜欢