金令牌首页金令牌猎头十佳职业经理人评选最佳雇主评选加入俱乐部《职业经理人周刊》会员区薪酬调查报告

登录

《职业经理人周刊》猎头公司

职业经理人俱乐部首页 >> 经理人资讯 >> 技术研发 >> 今日视点 >> 正文

数据挖掘中的模式

《职业经理人周刊》猎头班长v微博微信：AirPnP 2021/2/9

企业职位经理人专访社区金令牌首页

猎头|自助猎头
兼职|推荐人才

1.数据挖掘的模式

1.1 数据挖掘模式的概念

著名猎头机构推荐金领职位

企业职位经理人专访社区会员

军工仪器研发制造--电子工程师/项目经理

30-50万

北京

电网侧储能初创公司-全钒液流储能-收购德国技术团队--CEO

150-200万

北京深圳

央企背景-全钒液流电池电堆设计高级工程师（全钒液流储能）

40-70万

河北深圳

新药/仿制药-研发系统-制剂部负责人CSO

60-70万

北京成都江苏

光电通信芯片-INP光芯片设计资深专家

80-150万

深圳青岛

语音操作系统产品经理（人工智能）

40-70万

北京天津

香港AI机器人-研发项目经理-图像处理/计算机视觉/机器学习算法

60-100万

香港海外

中国著名航空材料公司-冶金(金相)专家

150-300万

北京西安

数据挖掘功能用于指定数据挖掘任务发现的模式：一般而言，这些任务可以分为两类：描述性和预测性。描述性挖掘刻画目标数据中数据的一般性质。预测性挖掘任务在当前数据上进行归纳，以便做出预测。数据挖掘的功能和模式主要包括以下内容：

特征化和区分频繁模式、关联和相关性分析挖掘分类与回归聚类分析离群点分析2 类/概念：特征化和区分

2.1 类/概念描述

数据可以与类或概念相关联，可以通过下述方法得到：数据特征化：汇总所研究类（通常称为目标类）的数据；数据区分：将目标类与一个或多个可比较类（通常称为对比类）进行比较。顾客的概念包括bigSpenders和budgetSpenders，这种汇总的、简洁的、精确的描述方式就就为类/概念描述。数据特征化的方法数据特征化（data characterization）通过查询来收集对应于用户指定类的数据。例如，挖掘任务“汇总一年内在某商店花费5000美元以上的顾客特征”，统计结果可能是顾客的概况，如年龄在40~50、有工作、有很好的信用等级。数据特征化的输出可以用多种形式提供，例如饼图、条图、曲线、多维数据立方体和包括交叉表在内的多维表。结果描述可以用广义关系或规则（称作特征规则）形式提供。数据区分数据区分（data discrimination）是将目标类数据对象的一般特性与一个或多个对比类对象的一般性进行比较。目标类和对比类可以用户指定，而对应的数据对象可以通过数据库查询检索。例如，比较两组顾客——定期购买计算机产品的顾客和不经常购买这种产品的顾客。结果描述提供这些顾客比较的概况，例如频繁购买计算机产品的顾客80%在20-40岁之间，受过大学教育；而不经常购买这些产品的顾客60%或者年龄太大或太年轻或没有大学学位。3 关联分析

3.1 关联分析的内容

频繁模式频繁模式（frequent pattern）是在数据中频繁出现的模式，存在多种类型的频繁模式，包括频繁项集、频繁子序列（序列模式）和频繁子结构。频繁项集频繁项集一般是指频繁地在事务数据中一起出现的商品的集合，如小卖部中被许多顾客频繁一起购买的牛奶和面包。频繁子序列类似如顾客倾向于先购买便携机，再购买数码相机，然后再购买内存卡这样的模式。关联和相关性关联分析又称关联挖掘，就是在交易数据、关系数据或其他信息载体中，查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。

4 分类或回归

4.1 用于预测的分类

分类是这样的过程，它找出描述和区分数据类或概念的模型（函数），以便能够使用模型预测类标号未知的对象的类标号。

4.2 用于预测的回归

回归分析（regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

5 聚类分析

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析和和分类的区别在于分类又已知的类别标签，而聚类没有。

6 离群点分析

数据集中可能存在一些数据对象，他们与数据的一般行为或模型不一致，这些数据对象被称为离群点（outlier）。大部分数据挖掘方法将离群点视为噪音或异常而丢弃。然而，在一些应用中（如欺诈检测），罕见的事件可能比正常出现的事件更令人感兴趣。

(来源：深度学习生态圈)

生成长微博 在线投稿 设本站为首页 收藏本站 猎头服务

我们尊重原创者版权，除非我们确实无法确认作者以外，我们都会注明作者和来源。在此向原创者表示感谢。本网转载文章完全是为了内部学习、研究之非商业目的，若是涉及版权等问题，烦请联系 service@execunet.cn 或致电 010-85885475 删除，谢谢！

网友对该信息的评论（评论帖子仅为网友之间的交流，不代表本站的观点）		共1条评论
主题	作者	跟帖/点击	日期
·数据清洗你真的懂吗？	网友	0/797	2021/2/9

发表评论：

主题：
内容：
	匿名发表验证码：登录名：密码：个人企业

发帖须知：

一、请遵守中华人民共和国有关法律法规、《全国人大常委会关于维护互联网安全的决定》及《互联网新闻信息服务管理规定》。
二、请注意语言文明，尊重网络道德，并承担一切因您的行为而直接或间接引起的法律责任。
三、管理员有权保留或删除其管辖留言中的任意内容。
四、您在本站发表的言论，本站有权在网站内转载或引用。
五、发表本评论即表明您已经阅读并接受上述条款。

企业找猎头

职业经理人找猎头

□CTO相关资讯

□CTO焦点企业对话

□CTO相关猎头职位

京ICP备05025905号-1

京公网安备 110105001605号