本系列展示大数据领域的新研究和应用,以及当前正在开发的计算工具和技术。鼓励包含具体的示例和应用。该系列的范围包括社交网络、传感器网络、数据中心计算、天文学、基因组学、医疗数据分析、大规模电子商务等领域的题目,还包括其他潜在贡献者提出的相关主题。
大数据的高性能计算
相关推荐
面向大数据的 高性能计算:方法与应用
面向大数据的 高性能计算:方法与应用
本书探讨了面向数据密集型应用的新兴高性能架构、提升数据处理效率的新型分析策略,以及机器学习、生命科学、神经网络和神经形态工程等多个领域的前沿应用。
全书结构分为两大部分。第一部分涵盖大数据架构,包括云计算系统和异构加速器,并介绍了面向内存架构和设备的新兴 3D IC 设计原则。第二部分展示了大数据在多个领域的新兴应用案例,包括生物信息学、深度学习和神经形态工程。
主要内容包括:
涵盖 Hadoop/Spark 等分布式系统在内的各种大数据架构
面向大数据应用的基于加速器的解决方案,例如基于 GPU 的加速技术
面向内存架构和设备的新兴 3D IC 设计
算法与数据结构
10
2024-05-23
高性能大数据数据库GridDB介绍
GridDB是一种高性能、高可扩展性和高可靠性的大型数据数据库,其数据模型类似于KVS(键值存储),特别适合存储时序数据,如传感器数据。它设计灵活,能够轻松应对大量传感器的数据存储需求。系统具备高可靠性,采用了先进的节点结构。
NoSQL
16
2024-09-13
Ignite 高性能内存计算
Apache Ignite 提供高性能内存计算。
算法与数据结构
18
2024-04-30
Spark:大数据计算的利刃
Spark,如同Hadoop生态系统中的MapReduce、Hive和Storm,是一种通用的 大数据计算框架。它集成了多种计算框架:Spark Core用于离线计算,Spark SQL用于交互式查询,Spark Streaming用于实时流式计算,Spark MLlib用于机器学习,Spark GraphX用于图计算,涵盖了大数据领域的各种计算需求。
Spark专注于大数据的计算,而Hadoop则更侧重于大数据的存储(例如HDFS、Hive、HBase)以及资源调度(Yarn)。 Spark与Hadoop的结合,被视为大数据领域最具潜力和前景的组合。
spark
23
2024-05-12
GPU加速高性能数据并行计算
数据库技术的进步、数据挖掘应用的兴起、生物基因技术的不断发展以及历史数据规模的爆炸式增长, 都对高性能计算提出了更高的要求。虽然分布式系统可以部分解决大型计算问题, 但是其通信开销大、故障率高、数据存取结构复杂且开销大、数据安全性和保密性难以控制等问题依然存在。而计算机处理器, 特别是GPU技术的快速发展, 为高性能数据并行计算提供了新的解决方案。
数据挖掘
11
2024-05-19
云计算与大数据的结合
大数据架构设计,包括云计算与大数据的关系;各行业大数据计算架构案例等
Hadoop
13
2024-07-31
大数据认知计算——李德毅院士
本PPT包含四章内容:人类认知的可计算性、大数据时代的自然语言处理技术、智能驾驶中的视听觉认知、云模型和数据场等物理学方法在不确定性认知中的应用。大数据时代的认知计算是否会促进认知科学的发展,值得思考。
算法与数据结构
19
2024-05-13
云计算大数据实战详解
循序渐进掌握云计算大数据离线计算,了解编程步骤的每一个细节。
算法与数据结构
20
2024-05-13
云计算和大数据详解PPT
云计算和大数据密不可分,如同硬币的正反面。大数据的处理必须依赖于分布式架构,以处理海量数据。其特点在于分布式数据挖掘。大数据技术依赖于云计算的分布式处理、分布式数据库、云存储和虚拟化技术。它是一种成本较低、快速采集、处理和分析大规模数据的新一代技术。大数据技术的发展使得处理海量数据变得更加便捷、经济且快速,已经成为各行业商业模式改变的重要驱动力。本资源详细介绍了大数据和云计算的基本概念、技术及其应用。包括绪论、大数据环境下的云计算架构、大数据关键技术与应用、云存储、云服务与云安全、云计算应用、虚拟化技术、Hadoop和Spark平台、分布式文件系统及并行计算框架、分布式数据存储与大数据挖掘。
Hadoop
18
2024-07-13