标签归档：Deep Learning

大规模机器学习

本文覆盖Coursera Machine Learning Week 10的内容。

大数据集的学习（Learning with large data set）
如果我们回顾过去10年机器学习的发展历史，你会发现现在的学习算法效果比之前要好很多，其中一个重要的原因是现在比以前拥有更多可以供训练的数据。所以有人会说拥有更多的数据比算法更重要：“It’s not who has the best algorithm that wins, it’s who has the most data.”。所以这篇文章会介绍一些在大数据规模下的机器学习技巧。
先回顾一下之前的梯度下降公式：
$$\theta_{j} := \theta_{j} – \alpha\frac{1}{m}\sum_{i=1}^{m}\left ( h_{\theta}\left ( x^{(i)}\right )- y ^{(i)}\right ) x_{j}^{(i)}$$
上面公式中$m$的值可能会很大，比如$m$等于一个亿，不要以为这个数据量很大，在实际应用中是很常见的。如果还是按照之前的方法进行梯[……]

继续阅读

Machine Learning-推荐系统（Recommender Systems）

发表评论

本文覆盖Coursera Machine Learning Week 9的内容。这篇文章看似公式很复杂，但实质上内容还是比较简单的，就是基于最基本的线性回归，其实很容易理解的。

一、问题描述

推荐系统是机器学习在工业界的一个非常重要的应用，虽然它在学术界并不怎么被重视。今天你看到的大部分网站里使用的推荐系统，比如Amazon，淘宝，豆瓣等，它们基本都采用了机器学习技术，今天我们花点时间总结下推荐系统的相关知识。
例子：预测电影评分
假设我们有一些数据，它包含了不同用户对不同电影的评分情况（0-5分），其中?表示该用户没有看过这部电影，这些数据用一个表格表示如下：

Movie
Alice(1)
Bob(2)
Carol(3)
Dave(4)

Love at last
5
5
0
0

Romance forever
5
?
?
0

Cute puppies of love
?
4
0
?

Nonstop car chases
0
0
5
4

Sward[……]

继续阅读

Machine Learning-异常检测(Anomaly Detection)

1条回复

本文覆盖Coursera Machine Learning Week 9的内容。
一、问题描述
假设我们现在要构建一个模型来判断某一个飞机发动机是否有问题，我们选取的特征如下：

$x_{1}$ = 发热

$x_{2}$ = 抖动

原始数据集：$\left \{ x^{(1)},x^{(2)}, … ,x^{(m)} \right \}$在坐标轴上的分布如下图所示：

很明显上图数据点的分布是有规律可寻的：越往中心越密集，越往边缘越稀疏。也就是说大部分数据点都散落在中心位置，而小部分散落在边缘位置。那么我们就可以说如果一个测试点$x_{test}$越靠近中心点，那么它是正常引擎的可能性就越大；如果他远离中心点，则它很可能就是异常的引擎。这就是异常检测，他在很多领域都有应用，比如它可以监测网站的异常用户、监测机房电脑运转是否正常等。

二、算法

高斯分布(Gaussian distribution)
看到上图的分布我们很容易想到一个模型：高斯分布(Gaussian distribution)，也就是正态分布(Normal distribu[……]

继续阅读

永远的热河路

A man can be destroyed but Not Defeated.

标签归档：Deep Learning

大规模机器学习

Machine Learning-推荐系统（Recommender Systems）

一、问题描述

Machine Learning-异常检测(Anomaly Detection)