无论你如何将Hadoop与Spark进行对比,无论Spark生态多么成熟和完善,其底层终归要基于HDFS,毕竟这是目前最成熟的分布式底层文件系统,几乎没有哪家公司愿意重新花费精力研发一个全新的文件系统......
2018-08-13 关键字:在大数据库领域,Python是最常被使用的编程语言,因此了解与其相关的数据分析工具是很有必要的。如果你正在使用virtualenv、pyenv或其他变体在自己的环境中运行Python,那么,可以尝试本......
2018-08-09 关键字:年初,笔者开始调研Hadoop在国内企业的应用现状,在前期的互联网企业应用现状调研中,笔者发现目前比较知名的互联网企业基本都在使用Hadoop,其生态组件,比如HDFS、Zookeeper、MapRe......
2018-08-08 关键字:Kafka是一种高吞吐量的 分布式 发布订阅消息系统,它可以处理消费者规模的网站中所有动作流数据。Kafka的目的是通过Hadoop 并行加载机制统一线上和离线消息处理,并通过 集群 提供实时消息。本......
2018-08-06 关键字:提起Hadoop,我们就可以想到大数据;提起Oracle,我们就可以想到数据库。国内确实有不少企业习惯于将Hadoop作为数据库使用,因此将其与数据库领域同样占据重要位置的Oracle进行对比是有意义......
2018-08-03 关键字:消息队列Kafka是一个分布式的、高吞吐量、高可扩展性消息队列服务,广泛用于日志收集、监控数据聚合、流式数据处理、在线和离线分析等,是大数据生态中不可或缺的产品之一,阿里云提供全托管服务,用户无需部署......
2018-08-01 关键字:众所周知,Yarn是大数据核心调度组件,其使用覆盖率非常高。在“Hadoop是否已失宠”的选题调研中,不少专家都对Yarn这一核心组件的生命力表达了自己的看法。......
2018-07-31 关键字:在Hadoop 1.0中,HDFS的单NameNode设计带来诸多问题,包括单点故障、内存受限制约集群扩展性和缺乏隔离机制(不同业务使用同一个NameNode导致业务相互影响)等。为了解决这些问题,H......
2018-07-30 关键字:本文将具体解读如何借助大数据和云计算技术解决数据孤岛,烟囱开发,技术门槛等痛点,满足用户多元化、复杂的需求,降低数据开发、管理的难度。......
2018-07-26 关键字:本次IT168拿到的是MAXHUB 75英寸标准版会议平板产品(产品型号SM75CA,以下简称MAXHUB),满足你企业高效会议的白板、演示、视频会议需求!......
2018-07-10 关键字: