几个基本概念模型(Model) vs模式(Pattern)数据挖掘的根本目的是将样本数据中隐藏的结构推广到整体(Population)模型:对数据集全局特征的描述或概括,适用于数据空间的所有点,例如聚类分析模式:对数据集局部有限特征的描述或概括,适用于数据空间的子集,例如关联分析算法(Algorithm):一个定义完整的过程,以数据为输入,生成模型或模式描述型挖掘(Descriptive) vs预测型挖掘(Predictive)描述型挖掘:概括数据,呈现数据的重要特征预测型挖掘:基于观察到的对象特征预测其其他特征描述型挖掘可作为目的,也可作为手段
数据挖掘的基础概念-腾讯大讲堂59-发现商业机会
相关推荐
观日月之行察天地之变腾讯大讲堂59数据挖掘与商业机会
你想通过数据挖掘发掘商机吗?腾讯大讲堂 59 期就为你了一个好的学习机会。从洞察用户行为到探索商业机会,这一系列的讲座内容相当实用。不仅可以了解到数据的基本概念,还能学习如何通过数据来指导决策,推动业务增长。内容包括如何利用数据进行客户细分、探索气象数据、以及如何运用 RapidMiner 等工具进行预测。你如果在数据这块有需求的话,绝对值得看看。
如果你对数据挖掘感兴趣,可以从《数据挖掘的基础概念》这篇文章入手,它了数据挖掘的基本原理和应用场景。想要深入了解如何利用数据来挖掘商业机会的话,不妨看看《洞悉用户行为,挖掘商业机遇》。如果你是想掌握更深入的技巧,是在商业智能上,《数据驱动的客户细分
数据挖掘
0
2025-06-15
洞悉用户行为,挖掘商业机遇:腾讯大讲堂59期
数据驱动决策:构建用户行为分析模型
精准的用户行为分析是挖掘商业机遇的关键。腾讯大讲堂59期以数据为基础,构建用户行为观察模型,助力企业洞察用户需求,制定有效的商业策略。
模型构建步骤:
定义观察窗口和表现窗口:
观察窗口:用于收集用户行为数据的时间段,例如2007年1月至3月。
表现窗口:用于观察用户行为结果的时间段,例如2007年5月至6月。
设置时间滞后(Time Lag):
Time Lag:为业务部门预留的操作时间,例如2007年4月。
交叉验证:
使用不同时间段的数据进行交叉验证,例如观察窗口为2007年2月至4月,表现窗口为2007年6月至7月,Time Lag为200
数据挖掘
14
2024-05-12
数据挖掘与知识发现腾讯大讲堂59期数据蕴含商机
数据挖掘的整个流程,蛮像咱们做前端调试的思路——先抓数据、再、搞出个“能用”的东西。腾讯大讲堂第 59 期这场讲得挺通透,提到 Fayyad 他们 1996 年那篇经典论文,老资料但经得住推敲,多基础逻辑到现在都还用得上。
“从数据挖掘到知识发现”的套路,其实跟优化用户行为路径、提炼核心指标那些流程像。数据不是重点,能从中挖出规律、发现机会才是关键。这场讲座里就提到不少实践经验,听完你会有种“啊,原来我早在搞数据挖掘了”的感觉。
想继续往深了挖,可以看看这些相关资料:像是《数据挖掘与知识发现综述》这篇,讲理论但不晦涩;还有《数据挖掘中的知识类别总览》,分类挺清楚,适合做知识图谱前的准备。
哦对
数据挖掘
0
2025-06-10
数据洪流中的商机:腾讯大讲堂59期
在这个数据爆炸的时代,数据挖掘技术的重要性日益凸显。早在1963年,IBM 7090处理600个案例时,就面临着“机器存储限制,一次只能考虑25个变量”的困境。如今,海量数据蕴藏着巨大的商机,等待我们去挖掘和利用。
数据挖掘
25
2024-05-19
数据蕴含商机:腾讯大讲堂59期带你玩转EDA
玩转数据,洞悉商机:探索性数据分析(EDA)
EDA,即探索性数据分析, 是一种灵活的数据分析方法,它无需预设严格的假设,而是通过可视化、分析残差、数据转换等方式,来揭示数据背后的结构和关系, 发现潜在的规律和商机。
EDA常用方法:
统计量: 均值、方差、根方差、协方差、峰度、偏度、相关系数等
统计图: 饼图、直方图、散点图、箱尾图等
模型: 聚类
EDA的优势:
直观易懂: 通过图表等可视化手段,将数据信息清晰地展现出来。
发现潜在规律: 帮助我们识别数据中的异常值、趋势和模式, 挖掘隐藏的商机。
验证假设: 为后续的建模和分析提供基础和方向。
腾讯大讲堂59期, 带你一起玩转E
数据挖掘
15
2024-05-14
数据掘金:腾讯大讲堂探秘商机
数据,蕴藏着无限商机,犹如金矿等待挖掘。腾讯研究院数据分析研究室专家Simon Jiang (江宇闻) 将于2009年2月24日腾讯大讲堂,与您共同探讨如何从数据中发现商业价值,洞察先机,决胜千里。
数据挖掘
9
2024-05-20
数据驱动的客户细分:腾讯大讲堂揭秘商机
“物以类聚,人以群分”,这句古语在商业领域同样适用。如何精准地将客户分类,找到最有价值的客户群体,是每个企业都在思考的问题。腾讯大讲堂第59期以“数据蕴含商机”为主题,探讨了如何利用数据进行客户细分,以及如何避免维度灾难。
传统的客户细分方法往往依赖人为经验,选取诸如地域、活跃程度等有限的维度。然而,随着数据量的爆炸式增长,维度也随之急剧增加,导致细分数目指数级增长,这就是所谓的“维度灾难”。人脑难以处理如此高维的数据,更无法从中有效地提取信息。
腾讯大讲堂指出,数据驱动的方法可以帮助我们克服维度灾难,实现更精准、高效的客户细分。通过机器学习等技术,我们可以从海量数据中自动识别关键特征,并进行
数据挖掘
15
2024-05-19
数据驱动业务增长:腾讯大讲堂解读闭环流程
如何利用数据洞察,构建闭环业务流程,驱动业务增长?腾讯大讲堂为您揭秘!
闭环流程构建步骤:
现有流程评估: 深入分析现有业务流程,识别关键环节和瓶颈。
数据采集/ETL: 建立完善的数据采集体系,高效整合多源数据。
数据分析/数据挖掘: 应用数据分析和挖掘技术,深入洞察客户行为和市场趋势。
流失客户分析: 精准识别流失客户群体,分析流失原因。
计划和设计挽留行动: 基于数据分析结果,制定精准的客户挽留策略。
执行挽留行动: 将挽留策略付诸实践,采取针对性措施。
挽留行动评估: 评估挽留行动效果,衡量投资回报率。
挽留结果调整: 根据评估结果,不断优化挽留策略,提升效率。
应用流程: 将成功经
数据挖掘
12
2024-05-19
腾讯大讲堂10-Customer Engagement各方法差异与用户研究方法论
CE 各方法的差异,是腾讯大讲堂第 10 期的干货之一,适合你做用户研究、产品设计时当作方法论参考。内容挺全的,讲了怎么从用户动机、行为习惯、数据挖掘等角度,找准目标群体,优化设计策略。
像用深度访谈、焦点小组这类传统方式,比较适合挖掘用户的真实想法和场景行为;
而数据建模、眼动实验这些呢,更偏自动化和可视化,适合做验证类研究,比如你要用户注意力分布,就有用。
里面的表述没有太学术,但信息量挺大。比如提到跟用户回家的移动体验室,听起来有点意思,其实就是现场还原使用环境,观察更真实的使用动作。
不管你是搞营销策略的,还是做UI/UX设计的,都能找到点启发。尤其在要“用户说了不算,得看行为”的项目
数据挖掘
0
2025-06-14