基于 PGConf.CN 2019 大会刘澎演讲的培训 PPT,对中国开源生态系统的现状和能力进行了深入分析。
中国开源生态与能力现状分析
相关推荐
NoSQL现状分析
经历了多年的激烈讨论,现在是对NoSQL现状进行阶段性总结的时候。NoSQL的发展如此迅速,以至于难以简单概括其成就和不足。在多个领域,NoSQL不仅在行业内取得了显著成就,也在学术界获得了认可。高校开始将NoSQL纳入课程,不再仅仅教授传统数据库。深入学习关系型数据库仍然重要,而NoSQL作为补充是不可或缺的。在短短几年间,NoSQL领域爆发性增长,产生了数百个新数据库,nosql-database.org列出了150个这样的数据库,包括一些较古老的对象数据库。
NoSQL
21
2024-07-12
数据挖掘技术与应用现状分析
数据挖掘技术及其应用现状探析
一、数据挖掘技术概述
数据挖掘 (Data Mining, DM) 是从海量、不完整、有噪声、模糊、随机的数据集中提取出隐含的、未知的、有潜在用处的信息和知识的过程。随着大数据和信息技术的发展,这项技术变得越来越重要。
二、数据挖掘过程
数据挖掘过程通常可以分为以下几个阶段:
数据准备:这是数据挖掘的第一步,包含数据选取和数据预处理两个子步骤。
数据选取:根据用户需求从原始数据库中选取目标数据。
数据预处理:包括数据清洗、缺失值处理、异常值检测、数据转换和数据归约等。 例如,通过数据清洗去除噪声数据,通过数据转换将连续型数据转换为离散型数据等。
数据挖掘:
数据挖掘
17
2024-11-06
取料机应用现状与发展趋势分析
取料机的实际应用,挺能设备在码头、仓储这些场景里到底好不好用。神华天津那边的案例挺有代表性,用的数据也实在,常见问题、预控办法都摆在那儿了。你要是搞自动化设备的,尤其是大宗物料的,这篇文章还蛮值得一看。文里也提到几个技术瓶颈,像定位精度和远程控制延迟这些,基本就是行业难点了。想做点改进或者搞技术选型的,可以从这篇里找到不少参考。
统计分析
0
2025-06-14
2019年中国大数据产业发展现状与趋势
受政策环境利好、技术持续革新以及数字应用普及等因素驱动,2018年中国大数据产业规模达到4384.5亿元,预计到2021年将突破8000亿元,达到8070.6亿元。大数据产业的蓬勃发展正推动传统产业转型升级,为经济增长注入新活力,并为智慧城市建设和数字经济发展提供有力支撑。
算法与数据结构
12
2024-05-28
数据分析能力进阶图谱
数据的能力进阶图谱是那种你看一眼目录就觉得靠谱的资源,结构清晰,内容扎实。它从最基本的数据清洗讲到高级的机器学习,不会一下子塞太多概念,而是一步步带着你往上走,挺适合边学边实践的朋友。
数据清洗、探索性这些基础内容安排得比较贴地气,拿来就能用,像是你平时 Excel 或数据库的那点事,都能找到参考方法。比如数据清洗那块,提到了好几个实用工具,OpenRefine、Kettle这些都蛮好上手,尤其适合不太想写代码的用户。
进阶内容里,像预测建模、机器学习也都有覆盖,案例也挺多,不会枯燥。比如房价预测的数据集就典型,适合练手,也能让你对模型训练有个基本的感觉,不会一上来就被吓退。
还有一点我比较喜
统计分析
0
2025-06-16
统计稳定状态SPC过程能力分析
统计过程控制里的统计稳定状态,讲白了就是过程有没有跑偏。只要图上没有“出圈”的点,就算是统计稳定状态,靠的是控制图的判异准则来判断。技术稳定状态呢,更贴近业务和客户需求,要看Cp、Cpk这些指标,才知道你这工艺靠不靠谱。这块我还挺推荐几个文章的,像单边控制图 SPC 过程能力,讲得比较细。还有R 控制图,用起来简单直观,适合初学者上手。过程监控方面,用控制图监控过程也还不错,图例清楚,能快速定位异常。不过要注意,统计稳定≠技术稳定,别混着用了。一个过程就算数据稳定,也根本不达标。如果你做品质控制或制程,蛮建议把SPC和过程能力一起看,搭配用更靠谱。
统计分析
0
2025-06-17
Metabase:开源 BI 分析利器
Metabase,一款开源的商业智能(BI)分析工具,让数据分析变得更简单。无需编写代码,即可轻松连接数据库、构建直观的可视化图表,并与团队分享洞察。
统计分析
17
2024-05-19
Piwik:开源网站分析工具
Piwik是一款与Google Analytics(GA)和百度统计类似的开源网站分析系统,让您能够深入了解网站流量和用户行为。
统计分析
22
2024-05-20
单边控制图SPC过程能力分析
如果你在做统计过程控制(SPC)时,会遇到一些比较具体的挑战,比如说,如何单边控制图的情况下计算 Cp 和 Cpk?嗯,这其实是一个常见的问题,但答案也不复杂。单边控制图其实就是指只能监控一个方向的变动,比如只关心上限或下限的超标。计算 Cp 和 Cpk 时,你得重点关注那个有实际限制的方向。例如,当只有上限时,Cp 和 Cpk 的计算就会侧重于如何控制过程变动以避免超标,而不再是对称的上下控制区间。这个可以通过几个工具来完成,其中有些工具了相当便捷的计算方式。你可以参考一下几个相关的资源,它们会你更好地理解和应用这些控制图的计算方法。
统计分析
0
2025-06-13