Google一直在努力围绕Google Cloud构建更深入的企业业务,但在推广和营收方面始终落后于亚马逊的AWS和微软的Azure。为了改变这一情况,谷歌最近收购了一家名为Cask Data的初创公......
2018-05-17 关键字:通常,企业在知晓编写代码和构建内部解决方案所需的成本和复杂性之后,首先会意识到对ETL工具的需求。提取,转换和加载(ETL)工具使企业能够在不同的数据系统中访问有意义且可用的数据。企业也可尝试组装开源......
2018-05-17 关键字:数据驱动进化优化算法用来解决计算代价昂贵的问题,也有看到应用在其它优化领域,如鲁棒优化问题,大规模优化问题等,因为这些问题求解过程也耗费大量计算时间,其本质还是减少真实问题的评估次数。此外,离线的数据......
2018-05-16 关键字:随着数据规模的不断扩大,传统的RDBMS难以满足OLAP的需求,本文将介绍如何将Oracle的数据实时同步到阿里云的大数据处理平台当中,并利用大数据工具对数据进行分析。OGG(Oracle Golde......
2018-05-16 关键字:大家好,我来自清华大学自动化系,主要做机器学习和图像识别的研究。现在人工智能很流行,机器学习也推到风口浪尖上,图像识别已经变成产品,新闻媒体告诉我们AlphaGo、AlphaGo zero已经战胜了人......
2018-05-16 关键字:过去的几个月中,我参加了一些公司数据科学、机器学习等方向初级岗位的面试。我面试的这些岗位和数据科学、常规机器学习还有专业的自然语言处理、计算机视觉相关。我参加了亚马逊、三星、优步、华为等大公司的面试,......
2018-05-15 关键字:“不服跑个分?”是一个老梗了。虽然,我们不能盲目崇信跑分,但跑分的确是一种比较直观反映软硬件性能的方式。不过,相比手机跑个分,数据库性能测试却要复杂的多…… ......
2018-05-15 关键字:本文介绍如何在E-MapReduce上使用Kafka Connect实现同步RDS binlog数据。在我们的业务开发中,往往会碰到下面这个场景:业务更新数据写到数据库中,业务更新数据需要实时传递给下......
2018-05-14 关键字:数据量的爆发与计算力的提升,驱动着人工智能产业的蓬勃发展。同时,在众多技术的突破与相互融合之下,整个人类社会走向运行智能化、生产关系虚拟化的变革。随着人工智能技术的不断突破与广泛应用,我们也开始逐步实......
2018-05-11 关键字:随着苏宁大数据平台的规模越来越大,HDFS集群Namenode逐渐出现性能瓶颈,特别是在凌晨任务的高并发期,Namenode的RPC响应延迟较高,单次写RPC请求甚至超过1s,严重影响了集群的计算性能......
2018-05-09 关键字: