在单一DataNode管理多个磁盘的情况下,执行普通写操作时的每个磁盘用量比较平均。但是,添加或者更换磁盘将会导致DataNode磁盘用量严重不均衡,传统的HDFS均衡器关注点是DataNode之间(......
2018-08-14 关键字:HDFS是基于Java的文件系统,可在Hadoop生态系统中提供可扩展且可靠的数据存储。因此,我们需要了解基本的HDFS配置和命令才能正常使用它。在使用之前,我们首先讨论如何配置安装HDFS。Hado......
2018-08-13 关键字:无论你如何将Hadoop与Spark进行对比,无论Spark生态多么成熟和完善,其底层终归要基于HDFS,毕竟这是目前最成熟的分布式底层文件系统,几乎没有哪家公司愿意重新花费精力研发一个全新的文件系统......
2018-08-13 关键字:作为CEO,数字化转型战略是弯道超车还是颠覆? 作为CIO,如何衡量数字化转型是否成功? 作为COO,数字化转型如何提升公司的运营效率? 作为CMO,数字化转型如何推动业绩增长? ......
2018-08-10 关键字:年初,笔者开始调研Hadoop在国内企业的应用现状,在前期的互联网企业应用现状调研中,笔者发现目前比较知名的互联网企业基本都在使用Hadoop,其生态组件,比如HDFS、Zookeeper、MapRe......
2018-08-08 关键字:8月3日下午,2018(第三届)中国大数据产业生态大会盛大揭晓“2018中国大数据企业50强”。自2016年开始,中国大数据产业生态联盟已经连续两年推出“中国大数据企业50强”榜单。......
2018-08-07 关键字:近日,IBM Watson Build 2018 大中华区挑战赛随着北京和上海站的完美收官,第一轮THINK环节已经结束。睿至大数据凭借“公交线网优化和运力调优系统”顺利晋级至第二阶段。......
2018-08-06 关键字:8月3日下午,中国刑事诉讼法学研究会会长 中国政法大学诉讼法学研究院院长卞建林、最高人民检察院检察技术信息研究中心主任赵志刚、中国政法大学教授刘玫莅临睿至大数据北京总部视察指导,同时详细了解了睿至大数......
2018-08-06 关键字:Kafka是一种高吞吐量的 分布式 发布订阅消息系统,它可以处理消费者规模的网站中所有动作流数据。Kafka的目的是通过Hadoop 并行加载机制统一线上和离线消息处理,并通过 集群 提供实时消息。本......
2018-08-06 关键字:数据科学家是干什么的呢?哪些地方需要数据科学家?怎么样才能成为数据科学家?如果你正因为这些问题而犹豫要不要开始学习数据科学,那么我可以告诉你,成为数据科学家其实非常简单。......
2018-08-03 关键字: