Find the Underlying Structure of Big Data by Machine Learning with Spark | QQ群: 452154809

最新发布 第2页

单向街的夏天 Find the Underlying Structure of Big Data by Machine Learning with Spark

Spark

Spark 数据统计分析利器

Spark 数据统计分析利器
熟悉Spark的数据分析API,更加方便我们的数据分析、特征分析、模型评价工作,示例如下: 1 DoubleRDDFunctions val sc = new SparkContext(new SparkConf) ...

Bin 2周前 (10-14) 410℃ 2喜欢

Spark

Spark 资源管理和YARN应用程序模型

Spark 资源管理和YARN应用程序模型
Spark和MapReduce使用YARN管理集群资源的简单比较。 继MapReduce之后,最著名的Apache YARN应用要数Apache Spark了。在Cloudera,我们通过努力让Spark-on-YARN(SPARK-1101)保持稳定,...

Bin 2周前 (10-14) 130℃ 1喜欢

算法详解

随机森林简明教程

随机森林简明教程
Random Forest是加州大学伯克利分校的Breiman Leo和Adele Cutler于2001年发表的论文中提到的新的机器学习算法,可以用来做分类,聚类,回归,和生存分析,这里只简单介绍该算法在分类上的应用。 Random F...

Bin 2周前 (10-13) 100℃ 2喜欢

特征工程

样本采样及特征选择

样本采样及特征选择
基于特征化工程进行用户特征化,结合相关的机器学习算法对业务进行挖掘建模,在广告的精准投放、预测、风控等领域中应用的非常广泛。无论是有监督的学习分类算法,还是无监督的聚类也罢,都需要建立特征向量,对特征进行预处理;其中对于有监督的训练时,还需要进行样本的筛选。本...

Bin 2周前 (10-13) 98℃ 1喜欢

数据平台

大数据计算平台搭建方法论

大数据计算平台搭建方法论
CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述.该模型将一个KDD工程分为6个不同的,但顺序并非完全不变的阶段。数据库知识发现 1: business understanding: 即商业理解. 在第一个阶段我们必须从商业的角度上面了解...

Bin 3周前 (10-11) 83℃ 1喜欢