【统计学】论统计学知识点

今天药忘吃喽~ 2022-05-15 15:12 415阅读 0赞

文章目录

    • 论统计学知识点
      • 前言
      • 一、 图形可视化
        • 说明
        • 具有哪些图形?
      • 二、数据度量标准
      • 三、概率分布
      • 四、统计假设检验
      • 五、相关和回归
      • 总结
      • 说明

论统计学知识点

前言

  1. 统计学在数据分析的基础上,研究如何测定,收集,整理,归纳和分析数据规律,以便给出正确消息的学科。它在数据挖掘,自然语言处理,机器学习中都被广泛使用,比如博主之前的那篇关于[规则与统计相结合的词义消岐方法研究学习笔记][Link 1],其中作者就用到了统计学。

一、 图形可视化

说明

  1. 所谓的图形可视化就是将自己的数据利用图形(各种各种的图形)展现出来,这样对于用户来说无疑是最直观的,最具明显的来分析自己的数据。比如博主最近遇到项目上的一个关于器件价格的一个问题,就是将指定的器件按照它的购买价格,购买时间使用图形可视化(折线图),这样我们就能很“舒服”的了解这个器件的基本信息。

具有哪些图形?

  1. 饼图
  2. 条形图
  3. 热力图
  4. 折线图
  5. 箱线图
  6. 散点图
  7. 雷达图
  8. 仪表图

    例如图形如下所示
    饼图:
    在这里插入图片描述
    条形图:
    在这里插入图片描述
    这里就不一一列举了。
    资源
    在这里插入图片描述
    相应的案例:
    在这里插入图片描述
    获取链接: https://download.csdn.net/download/jiajikang_jjk/10751628

二、数据度量标准

  1. 平均数
  2. 中位数
    说明:
    奇数 n 个数值,则中位数位置: n + 1 2 \frac{n+1}{2} 2n+1​
    偶数 n 个数值,则中位数位置: n 2 \frac{n}{2} 2n​
  3. 众数
  4. 期望
  5. 方差
    X是服从分布F的随机变量,如果 E ( X ) E(X) E(X) 是随机变数X的期望值(平均数u=E[X]),则随机变量X或者分布F的方差是:
    V a r ( X ) = σ 2 = ∑ E ( X − u ) 2 N Var(X)=\sigma^2=\frac{\sum{E(X-u)^2}}{N} Var(X)=σ2=N∑E(X−u)2​
    连续随机变量
    如果随机变数X是连续分布,并对应概率密度函数 f ( x ) f(x) f(x),则方差是
    V a r ( X ) = σ 2 = ∫ ( x − u ) 2 f ( x ) d x = ∫ x 2 f ( x ) d x − u 2 Var(X)=\sigma^2=\int(x-u)^2f(x)dx=\int x^2f(x)dx-u^2 Var(X)=σ2=∫(x−u)2f(x)dx=∫x2f(x)dx−u2 此处 u的期望值 u = ∫ x f ( x ) d x u=\int xf(x)dx u=∫xf(x)dx
    离散随机变量
    如果随机变数X是具有概率质量函数的离散概率分布 x 1 → p 1 , . . . x n → p n x_1 \rightarrow p_1,…x_n \rightarrow p_n x1​→p1​,…xn​→pn​, 则:
    V a r ( X ) = ∑ i = 1 n p i ( x i − u ) 2 = ∑ i = 1 n ( p i x i 2 ) − u 2 Var(X)=\sum_{i=1}^{n}p_i(x_i-u)^2=\sum_{i=1}^{n}(p_ix_i^2)-u^2 Var(X)=∑i=1n​pi​(xi​−u)2=∑i=1n​(pi​xi2​)−u2
  6. 标准差
    方差开方就是标准差
  7. 标准分

三、概率分布

  1. 几何概率
  2. 二项分布
  3. 正态分布
  4. 泊松分布

四、统计假设检验

  1. 假设检验是推论统计假设的一种方。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估计未知参数就会希望根据结果对未知的真正参数值做出适当的推论。假设检验的种类包括:t检验,z检验,卡方检验,F检验,等等。

这里博主只是提出知识点,并不过多深究(论述统计学的知识点)

五、相关和回归

  • 相关
    1: 正线性相关
    2:负线性相关
  • 回归
    1:最佳拟合线预测
    2:线性回归
    3:逻辑回归

总结

  1. 以上五个部分的简单概括,都是关于统计学的相关知识点。前言也说明了关于统计学用到的范围特别的广泛。所以运用好统计学是非常重要的。

说明

本文翻译出处:《自然语言处理理论与实战》

发表评论

表情:
评论列表 (有 0 条评论,415人围观)

还没有评论,来说两句吧...

相关阅读

    相关 社会统计学重点

    1.社会调查研究的步骤:1.确定课题。2.了解情况。3.建立假设。4.确定概念和测量方法。5.涉及问卷。6.试填问卷。7.调查实施。8.校核与登录。9.统计分析与命题的检验。资

    相关 统计学原理 导论

    举出一个统计没有用途的领域名称比举出一个统计作为其组成部分的领域名称要困难得多。 ——Robert Johnson 我们相信上帝,除此之外,我们只相信数据。 ——James

    相关 统计学认识

    统计学认识 总论: 统计学是在资料分析的基础上,研究测定、收集、整理、归纳和分析反映数据资料,以便给出正确消息的科学。这一门学科自17世纪中叶产生并逐步发展起来,它广泛地应用

    相关 详尽!统计学知识大梳理

    点击上方“机器学习与生成对抗网络”,关注星标 获取有趣、好玩的前沿干货! 来源:海豚数据科学实验室 编辑:深度学习冲鸭 著作权归作者所有,文仅分享,侵权 道德经云:”道