Skip to main content

2 posts tagged with "机器学习笔记"

View All Tags

· 18 min read
Yandi LI

@作者: 机器学习算法 @迪吉老农

最近使用GBDT时,想通过分布式进行训练,尝试了一些框架,但原理不太了解。有些东西与同事讨论后,也还不甚明了,于是专心看了一下文档,在此记录一下。

1、分布式原理

常用分布式训练方式,应该是参数服务器。worker把sample的统计结果推送到单台参数服务器机器上,参数服务器汇总后,再推送到worker端。有点类似于单reducer的方式。

相比于参数服务器的中心化方案,这里提到的都是去中心化方案。

· 6 min read
Yandi LI

AUC这个指标在排序问题里经常用到,之前也有个模糊的印象,就是一个排序正确的比例。

这个模糊印象是,

  • 分母是选两个例子的的方式数
  • 分子是这两个例子的预测顺序正确的次数

但是今天看了一个python的实现,发现不是很能理解里面的公式,于是查了一下维基百科的定义,