数据运营笔试判断题20例
小编:艳芬 1563阅读 2020.03.27
1. 关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。(错)
2. 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数(对)。
3. 先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。(错)
4. 如果规则 不满足置信度阈值,则形如 的规则一定也不满足置信度阈值,其中 是X的子集。(对)
5. 具有较高的支持度的项集具有较高的置信度。(错)
6. 聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。 (错)
7. 分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。(对)
8. 对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。 (对)
9. Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。 (错)
10.分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error). (对)
11. 在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。 (错)
12. SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier) (错)
13. 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。(错)
14. 聚类分析可以看作是一种非监督的分类。(对)
15. K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。(错)
16. 给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。(错)
17. 基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。(对)
18. 如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。(对)
19. 从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。(错)
20. DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。(对)
2. 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数(对)。
3. 先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。(错)
4. 如果规则 不满足置信度阈值,则形如 的规则一定也不满足置信度阈值,其中 是X的子集。(对)
5. 具有较高的支持度的项集具有较高的置信度。(错)
6. 聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。 (错)
7. 分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。(对)
8. 对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。 (对)
9. Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。 (错)
10.分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error). (对)
11. 在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。 (错)
12. SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier) (错)
13. 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。(错)
14. 聚类分析可以看作是一种非监督的分类。(对)
15. K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。(错)
16. 给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。(错)
17. 基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。(对)
18. 如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。(对)
19. 从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。(错)
20. DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。(对)
相关推荐
- 数据运营笔试判断题10例 1. 在Excel中,每一个单元格的地址是唯一的( )2. 表示绝对引用地址符号是$( )3. 新建工作簿的快捷键是Ctrl+N( )4. 工作表是构成单元格的最小单位( )5. 在Excel 中,汇总方式只能是求和( )6. 在Excel操作窗口中,单击工具栏中“合并居中”按…
- 数据运营笔试判断题15例 1. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。 (对)2. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。(对)3. 图挖掘技术在社会网络分析中扮演了重要的角色。(对)4. 模式为对…
- 数据运营简短工作总结 范文: 参加工作以来,在领导和同志的帮助下,我认真学习、刻苦钻研,积极为工作,各方面都取得了一定的进步,得到领导和同志的一致好评。现总结如下: 1、了解公司概况。从X月X日开始进入公司上班,因为我是刚参加社会工作不久来到公司上班的,所以在来到…
- 经典笔试题-JDBC及Hibernate篇 五、JDBC 及Hibernate:(共12 题:基础10 道,中等难度2 道)110、数据库,比如100 用户同时来访,要采取什么技术解决?【基础】 答:可采用连接池。111、什么是ORM?【基础】 答:对象关系映射(Object—Relational Mapping,简称ORM)是一种为了解决面向对象…