我们通常说的分布式系统其实是分布式软件系统,即支持分布式处理的软件系统,它是在通信网络互联的多处理机体系结构上执行任务的,包括分布式操作系统、分布式程序设计语言及其编译(解释)系统、分布式文件系统和分......
2012-11-08 关键字:Apache Hadoop技术经常与大数据概念联系在一起,它们常常同时出现在各种行业会议和媒体报道中。而IT人员、咨询顾问和行业分析师已经逐渐达成共识,Hadoop只是诸多大数据技术中的一种。......
2012-11-06 关键字:HDFS和MapReduce是Hadoop的两大核心。而整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持的,并且它会通过MapReduce来实现对分布式并行任务处理的程序支持。......
2012-11-02 关键字:Hadoop这一备受瞩目的技术随着大数据的发展愈发火爆起来,许多厂商以拥有Hadoop或类似技术进入大数据领域。在刚刚举办的Strata+Hadoop World大会上,这些厂商就发布了各自的大数据产......
2012-11-01 关键字:最近很多人都在讨论Spark这个貌似通用的分布式计算模型,国内很多机器学习相关工作者都在研究和使用它。Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发。那么Spark和Ha......
2012-10-31 关键字:近期人气颇高的Cloudera公司在Strata大会上发布了实时SQL查询引擎Impala,一时间引起了业界的广泛关注。Impala将同之前的的MapReduce一起成为Cloudera Hadoop......
2012-10-30 关键字:日前,SAP发布新的程序更新包,并将在Hadoop中集成分析和数据库技术,包括倍受追捧的HANA内存数据库平台和Sybase IQ(列式数据库)。另外,SAP还宣称该程序包将与Hadoop、SAP D......
2012-10-30 关键字:数据存储主要有两种方式:Database和FileSystem,后面发展出了Object-oriented storage,但是总的来看就是存储结构化和非结构化数据两种。 DB开始是为了结构化数据存储......
2012-10-30 关键字:Splunk宣布Splunk Hadoop Connect和Splunk App for HadoopOps现已全面上市。Splunk Hadoop Connect可提供双向集成,轻松可靠地完成在Sp......
2012-10-26 关键字:越来越多的企业开始使用Hadoop来对大数据进行处理分析,但Hadoop集群的整体性能却取决于CPU、内存、网络以及存储之间的性能平衡。而在这篇文章中,我们将探讨如何为Hadoop集群构建高性能网络,......
2012-10-26 关键字: