数据处理和分析

本课程讲述数据处理和分析技术知识, 培训内容可以拆分及同其他相关课程进行组合。 使用SQL语言读写数据并进行分析, 通过使用Excel工具和Python交互式界面处理数据, 学习Kettle ETL项目,完整了解数据抽取、转换、发布处理分析全过程。

时间2~3天。

SQL

  • 关系数据库结构
  • Select查询
  • 使用函数
  • 聚合分组
  • 子查询和视图
  • 联结表
  • 数据更新
  • 高级处理
  • 事务和游标

Excel 快速数据分析

  • 数据整理和图表分析
  • 透视表和函数使用

Python简述

  • IPython Notebook
  • 绘图和可视化
  • NumPy库
  • pandas库

Kettle ETL

  • ETL 技术概念
  • Kettle 项目介绍
  • 数据抽取
  • 清洗校验
  • 数据转换和处理
  • 数据发布
  • ETL 数据生命期管理
  • 调度和监控