最新实例
多层关联冗余过滤关联规则挖掘
多层关联规则里的冗余问题,挺让人头疼的,尤其是在数据量大的时候。冗余过滤就是个不错的工具,能帮你把“祖先关系”导致的重复规则过滤掉,逻辑清爽不少。用在那种需要分层挖掘的场景,比如商品分类、用户行为,效果还蛮的。 多层结构的数据,比如商品分“食品-零食-饼干”这几级,多时候你会挖出一堆类似的规则。其实上层已经有了,下层再出来一条,就是冗余。靠人工一个个过?太费劲。用这个过滤方案,效率高不少。 Apriori这种算法你肯定用过吧?配合这类过滤机制一起用,能大大提升输出规则的质量。不只是多,更重要的是准。有些规则看着热闹,其实一点价值都没有,这一步能帮你把水分滤掉。 顺带一提,想深入挖的话,可以看看
Wise Goto-Block自动创建Simulink源块
块名自动生成 From 块的功能,真的是省心又高效,适合做Simulink模型的你。只要你改了Goto-Block的块名,对应的From-Block就会自动出来,名字、标记都一起搞定,还省去手动同步的麻烦,蛮贴心的。 颜色也会跟源块一样,界面整洁,看着就舒服。比如你给Goto命名为SignalOut,那From马上就叫SignalOut,连标记名也一并设置好了。对做模型调试的你来说,减少出错的点,节奏也快多了。 命名规则也比较统一,块名里自动加上Goto和From后缀,模型一眼就能看清流向结构,调试的时候也更顺手。不少同事用了都说“还不错”,尤其是大型模型里跳转多的场景,用这个工具真的爽。 如
Apache Hive 2.1.1数据仓库工具
Apache Hive 的 2.1.1 版本,算是比较稳定又好用的一版。HQL 语法和 SQL 挺像的,熟悉关系型数据库的你,上手会快。查询是跑在 Hadoop 集群上的,Hive 中间会把 SQL 转成 MapReduce 或 Tez 任务,执行效率还不错。 Hive Metastore是核心组件之一,记录了表结构、分区啥的,MySQL 做元数据库比较常见,配好之后,查询、建表都省心。 bin目录里是各种启动脚本,比如hive命令行,还有hiveserver2服务端,方便远程连接。你要是用 JDBC/ODBC 连 BI 工具数据,也没问题,Hive 支持得挺全。 想优化点性能?可以用分区和桶
强公司自动化预算模板演示-互联网+大数据时代的经营分析报告
强公司的自动化预算模板演示,逻辑清晰、模块分明,用起来确实挺顺。适合做利润、汇率调整这些比较头疼的内容,尤其对接大数据和自动化之后,省了不少事。嗯,不只是财务看得明白,产品和运营看报表也轻松多了。 预算模板的核心是自动化建模,像商品流通行业的、互联网+的财务场景,这套方案都能 hold 住。对预算精度要求高的公司,直接套这个逻辑框架,效果还蛮不错。 自动化脚本和SQL 部署部分也比较贴心,像Redis和MySQL的安装部署都有现成的模板,改改参数就能跑。如果你用的是Apache Spark做数据清洗,脚本整合也自然,响应也快。 顺带一提,还有一个自助式的数据治理模块,适合不爱写代码的同事——点
ECharts数据可视化实战教程
数据可视化的事儿,绕不开 Echarts,是做前端开发的你,肯定多少接触过。《Echarts 从基础到上手实战》这套课程,属于那种一步一步带你把图画漂亮的类型,从折线图、饼图一直到异步加载、主题自定义,内容覆盖得还挺全。一开始就讲清楚了为啥要做可视化——不是让老板看着爽,而是能一眼看出问题和趋势。课程讲得也不绕,基础讲完就开始实战,什么图该用在什么场景,也有案例说清楚。官方文档的阅读方法也有教,这点挺贴心。毕竟多时候卡住是因为不会查文档,讲师直接教你怎么找配置、怎么调图,效率高多了。图表类型这一块讲得蛮细的,柱状图、散点图这些用得多的,课程里都举了不少例子。有些混搭图你平时不太会碰,它也教你怎
总管家免费版CRM客户管理系统
图形导航的客户管理系统,操作起来直观又省心,哪怕你是第一次接触 CRM,跟着提示一步步来也完全没压力。总管家的免费版,主打一个“够用不花钱”,功能做得还挺全,客户、销售、库存、财务一套都带,适合个人或者刚起步的小团队。客户管理做得比较细,比如联系记录、回访提醒、来源分类都支持,还能导出 Excel,方便对接别的工具。销售跟单这块挺好用,日志、报价单、销售单一应俱全,还能查销售排行,看谁卖得好一目了然。数据安全也做得不错,系统会自动备份,哪怕电脑出问题,重装系统后也能恢复数据继续用。它的自定义功能蛮灵活的,比如你想改下单据模板,换成自己公司样式,分分钟搞定。整体用下来,响应快、界面不复杂,设置项
精选C++仅头文件库合集
精选的仅标头 C++库的资源合集,整理得挺用心的,内容丰富,分类清晰,查找方便。涵盖了从并发、密码安全到图像、GUI等一大票方向,几乎你能想到的模块都能在这找到点线索。 纯头文件的设计用起来也蛮爽,直接#include,省去编译库的麻烦。适合那种喜欢轻量项目的朋友,写起小工具或者嵌入式项目挺方便的。 并发模块下的几款库响应还蛮快,适合做高性能组件。比如你要写个多线程的日志系统,里面的资源就对路子。图像那部分,也能找到一些适合和OpenCV混搭用的小工具。 还有几个配套文章,像这个《机器学习与梯度下降算法 C++ 实现》就比较贴合当前的 AI 热潮。顺手看下也许能用得上。 如果你经常折腾 C++
GeoDa入门教材
GeoDa 的入门教材,挺适合刚接触空间数据的你。界面直观,操作也简单,哪怕不懂统计模型也能玩得转。像创建Choropleth Map、刷选图层、做EDA这些,一步步带着你做,思路清楚,节奏不快。探索性数据的环节也蛮实用,像散点图矩阵、并行坐标图这些,一般在 R 里搞起来不太友好,但 GeoDa 图形交互做得比较到位。而且还能生成Point Shape File、Polygon Shape File,像泰森多边形这些,GeoDa 有现成功能,效率挺高。想快速上手空间可视化?这套 Workbook 可以说是性价比不错的切入点。建议配合下面这些相关文章看,内容跨度大,从PostgreSQL到Arc
VINS全局位姿图优化解析
全局位姿图优化的威力,真的挺猛。VINS 系统不仅靠视觉和 IMU 双保险,还能在整个地图层面做全局调整,定位准得一批,尤其是在你做大场景 SLAM 时,效果。哦对了,它还能自动初始化,IMU 和相机的配合也能在线校,开发起来少不少麻烦。 多传感器融合是它的一大亮点,相机+IMU 组合拳打得稳。你拿它跑动态环境,像室内机器人或无人机,都能稳住,不容易飘。预阶段把图像和 IMU 数据都得干干净净,效率也不低。 滑动窗口优化用得也比较聪明,局部优化先跑起来,速度快,系统也不容易卡顿。像用高斯-牛顿法这类经典方法,配上 VINS 的结构,效率还不错。如果你也在搞视觉里程计或者定位导航,真可以研究下这
δ-开放集聚类拓扑聚类方法
δ-开放集的聚类思路还蛮有意思的,尤其适合那种形状不规则、数据分布不太平均的复杂数据集。你只要输入一个δ值,它就能帮你把数据切得细致,还能自动识别噪声点,挺智能的。 不光能高维数据,在 Olivetti 人脸数据库上的表现也不错。比起那些只能球形簇的传统方法,比如 K-means,它更像是“拓扑流派”的聚类方式,玩法不一样。 哦对了,它还有个升级版,能搞定那种密度差别大的数据集。如果你平时喜欢玩模式识别、数据挖掘、聚类这一类的算法实验,可以试试它,是在人脸、图像、或者非结构化数据时。 有需要的话,下面这些资源你也可以顺手看看,有代码也有讲义,挺全的: 聚类工具-MATLAB 模式识别应用