Yu's-Blog

余心所善,九死未悔!


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

Python语言之IO文件操作

发表于 2018-06-29   |   更新于 2018-07-05 | 分类于 Python语言 | 阅读次数:
字数统计: 7,710字 | 阅读时长 ≈ 33 分钟

      I/O在计算机中是指Input/Output,也就是Stream(流)的输入和输出。这里的输入和输出是相对于内存来说的,Input Stream(输入流)是指数据从外(磁盘、网络)流进内存,Output Stream是数据从内存流出到外面(磁盘、网络)。程序运行时,数据都是在内存中驻留,由CPU这个超快的计算核心来执行,涉及到数据交换的地方(通常是磁盘、网络操作)就需要IO接口。

阅读全文 »

Python数据分析(四)——挖掘建模

发表于 2018-06-27   |   更新于 2018-07-05 | 分类于 数据分析 | 阅读次数:
字数统计: 8,810字 | 阅读时长 ≈ 33 分钟

      经过数据探索与数据预处理,得到了可以直接建模的数据。根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、时序模式和离群点识别等模型。

阅读全文 »

Python数据分析(三)——数据预处理

发表于 2018-06-22   |   更新于 2018-07-05 | 分类于 数据分析 | 阅读次数:
字数统计: 2,381字 | 阅读时长 ≈ 8 分钟

      在数据挖掘中,海量的原始数据中存在着这大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据继承、转换、规约等一系列的处理,该过程就是数据预处理。
      数据预处理一方面是要提高数据的质量,另一个方面是要让数据更好地适应特定挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。

阅读全文 »
12345
YuJianZhe

YuJianZhe

4939yujianzhe@gmail.com

14 日志
7 分类
20 标签
GitHub 微博
© 2018 YuJianZhe | Site words total count: 106.6k
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.4