菜单

CFA一级 入坑笔记-Statistical Concepts and Market Returns

十一月 24, 2019 - CFA
  1. 统计量分为
    1. 描述性统计量 descriptive statistics
      • 从大量数据中提取出来的特征量
    2. 统计学统计量 Inferential statistics
      • 从小样本中得出的特征量(用以推断总体的特征)
  2. 测量尺度 Measurement Scales
    1. 定类尺度Nominal scales
      • 随便分类,比如股票为1,债券为2,不动产为3等等
    2. 定序尺度Ordinal scales
      • 排列名次
    3. 定矩尺度Interval scales
      • 比如温度,可以得出温差等等
    4. 定比尺度Ratio scales
      • 可以比较,0代表什么也没有
  3. 算数平均A>几何平均G>调和平均H:都是用来衡量“集中趋势Central Tendency”
    • Arithmetic mean: μ=∑Xi / N
    • Geometric mean: G=(X1*X2…..Xn)^(1/N)
      • 几何平均是开根号,所以要求根号下数值不为负数!
    • Harmonic mean: H=N/(∑1/Xi)
      • 一般用来平均价格,比如说每个月买1000rmb股票,买了3个月了,其单价分别为3,4,5,那么这三个月买的股票的平均成本是,3/(1/3+1/4+1/5)=3.83
  4. 中位数median:因为算数平均容易被极端数影响,所以中位数是一个较好的指标,因为它仅仅是排序而已,不考虑数值大小。
  5. 众数mode:出现次数最多的数值
    1. 1个mode:unimodal
    2. 2个mode:bimodal
    3. 3个mode:trimodal
  6. 分位数Quantile
    • Quartile 四分位
    • Quintile 五分位
    • Decile 八分位
    • Percentile 百分位
    • 给定一个升序数列,给定一个位置y%如75%的数,其位置应该位于: Location(y)=(n+1)*(y/100)的地方
      • 如给定下列数列:8%,10%,12%,13%,15%,17%,17%,18%,19%,23%
      • 第三个四分位的数应该位于
        • location (75)=(10+1)*(75/100)=8.25,即位于升序序列的第8.25个位置,
  7. 标准差 standard deviation
    1. 总体标准差,用n来除
    2. 样本标准差,用n-1来除
      1. 因为小样本来推算总体时候,如果用n来除,将会过大(有偏估计量),因此用n-1来调整,为无偏估计量(当然,背后有数学理论支撑,此处仅需要知道)
  8. 切比雪夫不等式 Chebyshev’s Inequality
    1. 观测样本落在+-k个标准差内的将不少于1-1/k^2
      • 比如,落在1.25个标准差里的样本数量占总体比例不少于1-1/1.25^2 =36%
  9. 峰度kurtosis
    1. 给定样本的峰度
      • g2=(四阶中心矩)/(2阶中心矩(即方差)的平方)-3
    2. lepto+kurtic:尖峰态,大于3
    3. meso+kurtic:就是正态分布的形状,为3
    4. platy+kurtic:低峰态,小于3
    5. excess kurtosis:超值峰度,大于3叫尖尖,小于3叫低低
  10. 偏度skew
    1. mean=median=mode: symmetric对称
    2. mean>median>mode:postive (right)skew
    3. mean<median<mode: negative (left) skew
    4. skew(x)=3阶中心矩/方差的3次方

 

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注