1. 数据分析第1步:提出问题 - 我们要分析哪些业务指标?2. 数据分析第2步:理解数据 - 熟悉 Excel 的工作界面 - Excel各个字段表示什么含义? - Excel中有哪些数据类型? - 数据的基本操作3. 数据分析第3步:如何使用Excel清洗数据? - Excel中常用的函数如何使用? - 如何去除数据列空格? - 如何规范数据源中错误格式的值? - 如何拆分单元格? - 时间格式数据如何处理? - 如何对数据进行排序和筛选?4. 数据分析第4步:如何获取业务指标? - 如何搭建数据透视表? - 如何使用vlookup进行数据分析? - 如何使用搜索引擎解决遇到的问题?5. 项目实战:招聘网站信息分析 - 哪些城市对数据分析师职位的需求量比较大? - 数据分析师在不同城市的平均薪资对比- 找到数据分析师工作需要哪些技能?
一、数据分析步骤:
提出问题、理解数据、数据清洗、构建模型、数据可视化。
Excel的数据类型:字符串(文本类型)、数字类型、逻辑类新
数据清洗步骤:
(1) 选择子集
尽量隐藏不需要的数据,例如某列不需要选择,单击右键 隐藏
显示隐藏操作:
(2) 列名重命名
更改列表名称
(3) 删除重复值
选择 数据 删除重复项
(4) 缺失值处理
1) 如何统计缺失了多少条数据?
2) 如何定位到所有缺失值?
在 开始--查找和选择--定位条件
3) 如何用人工一次性补全所有缺失值?
Crtl 选中所有,在一个格中输入 然后再ctrl+enter
(5)一致化处理
例如对日期进行处理
对数据进行分列处理:
选择 数据——〉分列
(6)数据排序
(7)异常值处理
二、常用的函数
AVERAGE
FIND 查找一个字符串在另一个字符串中出现的起始位置。FIND(要查找的字符串,字符串在单元格的位置)
Find函数进行定位时,总是从指定位置开始,返回找到的第一个匹配字符串的位置,而不管其后是否还有相匹配的字符串。
LEFT/RIGHT
MIND(字符串所在单元格位置,开始位置,截取长度)
例如 统计最高薪水和最低薪水:7k-12k
清洗数据时,把大写K换成小写k
检查最低薪水和最高薪水:数据-》刷选,查看有没有异常值,例如20k以上的情况,工资面议的
把去它去掉单独勾选异常值进行处理。
最低薪水用 left
多表关联查询---vlookup函数
找什么、在哪找、第几列、是准确找还是就近找
三、快捷键整理
快速选中某个区域:ctrl+shit+上下键