从0.23.0开始,Hadoop开始支持分布式NameNode,通过NameNode federation的形式实现。这样实现了NameNode的横向扩展,使得Hadoop集群的规模可以达到上万台。......
2012-04-20 关键字:2012年4月18日消息,由InfoQ主办的QCon大会于2012年4月18日到4月20日在北京召开。在今天下午举办的“大数据和NoSQL"分会场中,百度分布式高级研发专家杨栋发表主题演讲《Beyon......
2012-04-19 关键字:MapReduce是一种编程模式,在很大程度上借鉴了函数式语言。它主要的思想是分而治之(divide and conquer)。将一个大的问题切分成很多小的问题,然后在集群中的各个节点上执行,这既是M......
2012-04-19 关键字:移动互联网的兴起,尤其是智能移动终端的广泛普及使得企业数据与日俱增,在这其中,互联网行业是首先受到海量数据冲击的行业之一。很多依赖于互联网的企业不得不着手解决由海量大数据引发的一系列问题。大数据的问题......
2012-04-15 关键字:2012年4月13日,由IT168(ITPUB、IXPUB、ChinaUnix)主办的2012中国数据库技术大会(DTCC)在北京隆重召开。大会第三天,以“海量数据处理与Hadoop应用”为主题的圆桌......
2012-04-15 关键字:2012年4月13日,由IT168(ITPUB、IXPUB、ChinaUnix)主办的2012中国数据库技术大会(DTCC)在北京隆重召开。大会第三天,百度基础架构部高级工程师孙桂林发表了主题为“百度......
2012-04-15 关键字:Hadoop 具备出色的大数据集处理能力,在获取、存储、管理和分析数据方面远远超越传统的数据库软件工具。随着来自各种来源的数据日益增长,如何有效地利用这一信息成为了很多组织面临的一个难题。Hadoop......
2012-04-13 关键字:大数据将成为代替云计算的新一代热门话题。这是必然的结果:随着时间的推移,企业产生的数据量已经越来越大了,这些数据包括客户购买偏好趋势、网站访问和习惯、客户审查数据等等;......
2012-04-13 关键字:2012年4月13日第三届“数据库技术大会”将在北京召开,本次大会是IT168、ITPUB、IXPUB、ChinaUnix联合主办。在过去两年里我们举办的前两届数据库技术大会都取得了很大的成功,参加会......
2012-04-05 关键字:Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发。那么Spark和Hadoop有什么不同呢?1,Spark的中间数据放到内存中,对于迭代运算效率比较高。2,Spark比Ha......
2012-04-01 关键字: