Yu's-Blog

余心所善,九死未悔!


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

Python机器学习基础教程

发表于 2018-06-17   |   更新于 2018-06-17 | 分类于 机器学习 | 阅读次数:
字数统计: 50,963字 | 阅读时长 ≈ 226 分钟

监督学习

监督机器学习问题主要有两种问题,分别为叫作:分类(classification)和回归(regression)

  • 泛化:在测试集上成功预测的能力。
  • 过拟合和欠拟合:过于拟合训练集上的数据,过于选择简单的数据,最佳的模型应该是两者中间,才会使泛化能力最强。
  • 模型复杂的与数据集大小的关系:数据集中包含的数据点的变化范围越大,在不发生过拟合的前提下你可以使用的模型就越复杂。
    收集更多数据,适当构建更复杂的模型,对监督学习任务往往特别有用。

一些样本数据集

一个模拟的二分类数据集示例forge数据集,它有两个特征。下列代码将绘制一个散点图,将此数据集的所有数据点可视化。

阅读全文 »

Python简介

发表于 2018-06-16   |   更新于 2018-06-17 | 分类于 python基础 | 阅读次数:
字数统计: 2,354字 | 阅读时长 ≈ 8 分钟

python简介——人生苦短,我用Python

 C程序犹如拿着剃刀在刚打过蜡的地板上劲舞。——Waldi Ravens
C++学起来很难,因为它天生如此。——佚名
Java从很多方面来说,就是简化版的C++。——Michael Feldman
接下来请欣赏与众不同的表演。——巨蟒剧团之《飞翔的马戏团》

阅读全文 »
1…45
YuJianZhe

YuJianZhe

4939yujianzhe@gmail.com

14 日志
7 分类
20 标签
GitHub 微博
© 2018 YuJianZhe | Site words total count: 106.6k
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.4