数据分析的基本技能

从人力市场搜罗一下,大概可以得到一下基本技能关键词:

SQL、python
可视化、统计、建模
指标、增长

那么,对于一个数据分析同学,这些技能基础要求是什么?

SQL
首先,增删改查的技能是不够,join语法是sql技能的起点。作为一门函数式语言,往往实现跟逻辑相关,而不是实现相关。
SQL至少掌握以下知识点:
1、大表join可能存在的问题
2、日期处理、字符处理的相关方法
3、hive sql、mysql sql的简单区别
4、聚合函数关于null的处理方式

python
脚本语言是数据的基础,python至少掌握以下知识点:
1、基本语法,做到看得懂
2、字符处理,列表处理,做到能用、能查
3、pandas、numpy,做到数据清洗和统计
4、可视化,python作为可视化承载,跟pandas结合,可以得到更详细的数据

可视化
我们一般知道很多图表,也基本能用饼图、曲线图、散点图、直方图、盒形图等等。但是,“可视化”可能不只是知道这些图表。
“可视化” 更重要的是 传达的观点跟图形的匹配程度。至少掌握以下关系的图形表达:
1、构成
2、关联
3、对比
4、层级

指标
“指标”其实是业务相关,数据分析工作首先需要摸清业务模式、用户来源、数据埋点、数据存储方式。
如果只知道技能,不知道业务,是无法设计指标的,也无法开展工作。所以谈“指标”,我们谈什么?
1、整体app 或 大盘指标,比如:新增用户、日活用户、累计用户、次日留存用户、7天留存用户
2、运营指标:路径转化、CTR、漏斗分析
3、主要人群:人口属性、标签

统计
统计主要指统计推断,从企业运营活动运营,从统计上给出是否“靠谱”的决断。你可以用统计的方法,也可以看趋势拍脑袋。
统计主要使用:
1、假设检验
2、异常分析

建模
一般建模=机器学习,当你需要挖掘更多的信息,给出指导性意见,至少掌握几个基本的机器学习方法:
1、逻辑回归
2、决策树
3、朴素贝叶斯
4、随机森林
5、xgboost

增长
“增长”其实业务目标,跟经验相关,做“增长”也是做用户运营,主要有:
1、用户分群分析-分群
2、活动系统搭建-触达
3、活动规划-策略

只有给 用户推荐合适的策略,才能达到增长的目标。

数据分析的基本技能