LDA模型(MATLAB版)- LDA:旧式主题建模(Python版)
本项目通过Gibbs采样推理实现LDA(潜在狄利克雷分配)。
优势:
契合度
加速Gibbs采样过程
参考:
@article {heinrich2005parameter,title = {用于文本分析的参数估计},作者= {Heinrich,G.},journal = {Web:,year = {2005}}}
注意:
Gibbs采样速度较慢,难以检查收敛性。
结果不佳,可能是语料库规模较小所致。
不同运行的结果可能有很大差异。
主题建模工具:
David Blei的收藏
UMass的Mallet
斯坦福主题建模工具箱
Mark Steyvers和Tom Griffiths编写
Matlab
12
2024-05-15
协议主题数据仓库模型介绍及建模过程
协议主题(Agreement)数据仓库模型是金融机构用来管理客户契约关系的数据模型。该模型涵盖了账户、合同、存款账户、贷款账户、凭证、投资成交单、卡访问介质、申请单等协议范畴。该模型用于存储和处理协议数据,以支持产品、事件、渠道、当事人、资产、财务、区域、营销、内部机构等方面的业务分析和决策制定。
算法与数据结构
20
2024-04-30
mathematical-modeling-master数学建模代码合集
数学建模的代码资料挺全的,适合初学和进阶。压缩包里不仅有各种建模案例代码,还有不少工具包,像是 Python 的 NumPy、SciPy,甚至有 MATLAB、Maple 的用法,能帮你快速上手建模流程。不光有代码,还有文档,基础到进阶都能照顾到。如果你平时做数据、写优化算法,或者搞机器学习,挺值得收藏一份。尤其是压缩包结构清晰,按主题分了目录,比如优化算法、统计、机器学习等,看着就舒服,想学哪个就点进去看,方便。建议配合实际问题练习一遍,效果更好。
算法与数据结构
0
2025-06-30
TD数据仓库模型介绍及建模过程的产品主题特征
产品主题的特征在TD数据仓库模型中扮演重要角色,它们定义了数据存储和处理的方式。在建模过程中,确保这些特征能够充分体现产品的核心价值和功能。
算法与数据结构
19
2024-07-16
客户信息主题维度设计模型
客户基本信息模块
模块功能: 用于分析客户数量和客户属性。
事实表: 客户信息事实表
度量: 客户数量
数据粒度: 每个客户每月计算一次收益,事实表每条记录代表一个客户的属性。事实表存放一年以内的数据,超过十年的数据按月滚动,最初的数据汇总后从事实表卸出。
相关维度:
客户详细资料维度
客户性别维度
客户年龄层次维度
客户在网时间维度
客户消费层次维度
客户信用度层次维度
是否大客户维度
交费类型维度
地理维度
客户流失概率层次维度
客户挽留价值层次维度
成为大客户概率层次维度
数据挖掘
16
2024-05-19
当事人主题Party-TD数据仓库模型详解及建模流程
当事人主题(Party)指银行服务的各种对象,包括个人或对公客户、潜在客户、代理机构、雇员等。业务系统中的个人客户、对公客户、支付交易对手、潜在客户等都是当事人的范畴。详细介绍了Party-TD数据仓库模型的建模过程及其应用。
算法与数据结构
16
2024-07-13
数据库聚焦
深入探讨DB2数据库的知识体系与实际操作技巧,助力提升数据库技能。
DB2
17
2024-04-30
聚焦主题技术-b-66284en_fanuc picture操作_中文_v04_01
4.3元数据管理是描述数据的数据,用于描述数据仓库的语言。通过元数据,分析查询引擎能够理解数据仓库的结构和各类系统对象。元数据作为沟通的桥梁,实现了数据与操作模块的独立。亿信BI的元数据包括:1) 主题表的描述信息 2) 维表的描述信息 3) 度量和维度的描述信息 4) 报表定义 5) 查询的定义 6) 门户 7) 权限信息。亿信BI提供统一的WEB界面来管理元数据。4.4聚焦主题技术是亿信BI处理海量数据的有效方法,通过减少主题表的维度或增大维度的颗粒度,可以显著减少主题表的数据行数。一个几千万行的主题表可能会被聚焦为只有几十万行,这个过程称为聚焦。在聚焦主题上进行分析比在原始主题上更为高效
算法与数据结构
8
2024-08-11
模型预测控制PMSM聚焦控制MATLAB仿真
此MATLAB仿真使用模型预测控制技术控制PMSM的速度。
Matlab
14
2024-05-26