工具

勤奋 踏实 自信 兼容

首先看看机器学习的定义: “A computer program is said to learn from experience E with respect to some class of tasksT and performance measureP if its performance at tasks inT, as measured by P, improves with experience...

发布 0 条评论

一、hive中的join inner join 等价于 join, 可以理解为 join 是 inner join 的缩写;left join 等价于 left outer join ;right join 等价于 right outer join; 二、 left join(左联接) 返回包括左表中的所有记录和右表中联结字段相...

发布 0 条评论

拿到了用户标签行为数据,相信大家都可以想到一个最简单的个性化推荐算法。这个算法的描述如下所示: 1)统计每个用户最常用的标签。 2)对于每个标签,统计被打过这个标签次数最多的物品。 3)对于一个用户,首先找到他常用的标签,然后...

发布 0 条评论

hadoop distcp -D ipc.client.fallback-to-simple-auth-allowed=true -log /temp/tianhailong/ webhdfs://10.11.4.240:50070/test/tianhl webhdfs://10.11.1.10/user/hive 遇到的坑: 1、数据所在的集群所有机器,需要配置同步集群...

发布 0 条评论

维度表示你要对数据进行分析时所用的一个量, 比如你要分析产品销售情况, 你可以选择按类别来进行分析,或按区域来分析. 这样的按..分析就构成一个维度。前面的示例就可以有两个维度:类型和区域。另外每个维度还可以有子维度(称为属性...

发布 0 条评论

小象《Hadoop 2.X大数据平台V3》 链接:http://pan.baidu.com/s/1nvS7GFJ 密码:tqng 《Spark 1.X 大数据平台V2》11月份班 链接:http://pan.baidu.com/s/1sl6KOGX 密码:qlea 深入浅出Hive企业级架构优化、Hive Sql优化、压缩和分布...

发布 0 条评论

跑了一下CMU博士Tom Murphy的人工智能程序来玩任天堂的超级马里奥,虽然是2013年就出来了,但是还是很激动呀。 这是他本人的博客:http://radar.spacebar.org/ 资源都在这个网上有:http://www.cs.cmu.edu/~tom7/mario/ 在文章的最下...

发布 0 条评论

Presto不是什么 虽然Presto一直被一些个人或者团体称为 数据库 ,但是Presto并不是数据库。 千万不要以为Presto可以解析SQL,那么Presto就是一个标准的数据库。Presto并不是传统意义上的数据库。Presto并不是MySQL、PostgreSQL或者Ora...

发布 0 条评论

下载elasticsearch的zip包,elasticsearch的版本是2.2.1 ps:elasticsearch的api随版本更新的速度快,这里边需要查看对应版本的api文档 解压后安装,elasticsearch的访问地址: http://localhost:9200/ { "name" : "...

发布 0 条评论

https://yunpan.cn/cqPmZzZ9QgUmK 访问密码 9920   hive视频下载

发布 0 条评论