在线学AI

人工智能数学基础:统计学

人工智能工程师的统计学 补习课程表

7
发表时间:2025-08-21 23:20作者:雨季


人工智能工程师的统计学 补习课程表

人工智能数学基础:统计学

一、课程概述

统计学是人工智能领域的核心数学基础,为处理数据和不确定性提供了理论框架。在机器学习、深度学习、自然语言处理、计算机视觉等 AI 子领域中,统计学被广泛应用于数据预处理、模型构建、参数估计、模型评估和优化等关键环节。对于希望在人工智能领域有所建树的工程师而言,扎实的统计学基础是必不可少的。

本课程表旨在帮助有工作经验但基础薄弱的学习者系统掌握统计学知识,从基础概念到高级应用,结合人工智能实际需求,构建完整的知识体系。通过循序渐进的学习,学习者将能够理解和应用统计学的基本理论与方法,为进一步学习机器学习、深度学习等 AI 核心技术打下坚实的数学基础。

1.1 学习目标

通过本课程的学习,你将能够:

理解统计学的基本概念和理论框架,掌握描述性统计和推断性统计的基本方法

掌握概率分布的定义和性质,熟悉常见概率分布及其应用场景

理解参数估计和假设检验的基本原理,掌握常用的估计和检验方法

掌握回归分析的基本原理和方法,包括线性回归、逻辑回归等

理解多元统计分析方法,如主成分分析、聚类分析、因子分析等

掌握贝叶斯统计的基本原理和应用,如贝叶斯分类器和贝叶斯网络

理解统计学习方法在人工智能中的应用,如支持向量机、决策树等

能够将统计学知识应用于机器学习和人工智能的实际问题中

1.2 学习路径说明

本课程表按照从易到难、知识依赖的顺序设计,共分为七个学习模块,每个模块包含若干知识点。学习时应严格按照顺序进行,前一个模块是后一个模块的基础。每个知识点都包含学习要求、学习时长建议、学习资源、难点总结、课后练习和过关考试,确保全面掌握。

1.3 学习资源说明

本课程表推荐的学习资源包括:

国内高校优质 MOOC 课程

国际知名大学公开课

经典教材及配套辅导书

人工智能领域统计学应用案例解析

数学软件使用教程(如 Python 科学计算库)

、学习建议

2.1 学习方法建议

理论联系实际:统计学的概念较为抽象,学习时应结合具体的实际问题,如图像处理、文本分类、推荐系统等人工智能应用场景,加深对理论知识的理解。

多做练习:统计学是一门需要大量练习的学科,应通过大量的习题巩固所学知识,特别是概率计算、参数估计和假设检验等方面的题目。

使用数学软件:学习过程中应结合 Python 等数学软件进行统计计算和数据分析,提高解决实际问题的能力。推荐使用的库包括 NumPy(矩阵运算)、SciPy(统计模块)、Matplotlib(可视化)、Pandas(数据分析)、Scikit-learn(机器学习库)等。

理解概念本质:避免死记硬背公式和定理,应深入理解概念的本质和内在联系,如概率分布的特性、统计量的意义、假设检验的原理等。

定期总结:定期对所学知识进行总结,建立知识框架,梳理各知识点之间的联系,形成完整的知识体系。

2.2 学习工具推荐

数学软件强烈建议一边学习理论,一边用编程工具练习!!!

Python 科学计算库:NumPy(矩阵运算)、SciPy(统计模块)、Matplotlib(可视化)、Pandas(数据分析)

机器学习库:Scikit-learn(包含统计模型和方法)

深度学习库:TensorFlow、PyTorch(包含概率编程工具)

学习平台:

国家高等教育智慧教育平台:提供大量优质的统计学课程

中国大学 MOOC:汇聚国内多所高校的统计学相关课程

Coursera、edX:提供国际知名大学的统计和机器学习课程

辅助学习工具:

数学公式编辑器:帮助编写和理解复杂的数学公式

思维导图工具:帮助梳理知识结构和概念关系

在线统计计算工具:如 Wolfram Alpha、RapidTables 等

2.3 学习进度管理

制定学习计划:根据课程表的安排,制定详细的学习计划,合理分配每天的学习时间,确保按时完成学习目标。

阶段性目标:将整个学习过程分为若干阶段,每个阶段设定明确的学习目标,如完成一个模块的学习并通过相应的过关考试。

学习记录:记录每天的学习内容、遇到的问题和解决方法,便于复习和总结。

定期复习:定期复习已学内容,强化记忆,避免遗忘,特别是概率分布、参数估计和假设检验等核心内容。

模拟考试:在每个模块学习结束后,进行模拟考试,检验学习效果,及时发现和解决问题。

鼓励

本课程表系统地梳理了人工智能领域所需的统计学知识,从基础概念到高级应用,结合实际案例,帮助学习者建立扎实的统计学基础。通过按照本课程表的顺序学习,你将能够掌握统计学的核心概念和方法,并能够应用这些知识解决人工智能领域的实际问题。

统计学是人工智能的基石,也是提升逻辑思维和数据处理能力的重要工具。希望本课程表能够帮助你克服学习困难,建立对统计学的兴趣和信心,为未来的人工智能学习和研究打下坚实的数学基础。

记住,学习数学需要耐心和坚持,遇到困难时不要气馁,多思考、多练习、多交流,相信你一定能够掌握这门重要的数学工具!
若过程中有任何疑问,可关注公众号(iLearnAI)进专家群交流,不要放弃!

             


四、课程表

详细的学习课程如下:

大类

序号

知识点

学习要求

学习时长建议

学习资源

难点总结

课后练习

过关考试

描述性统计基础
1
数据类型与描述性统计量
•理解数据的类型(数值型、分类型)及其特点
•掌握集中趋势的度量(均值、中位数、众数)
•掌握离散程度的度量(方差、标准差、极差、四分位数间距)
•理解分布形态的度量(偏态、峰态)
•能够应用描述性统计量分析实际数据
建议 10 小时(理论学习 5 小时,练习 5 小时)
1.国家高等教育智慧教育平台《统计学原理》第一章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《统计学》(浙江大学)第一章
https://www.icourse163.org/course/ZJU-1206719809
3.《统计学》(贾俊平,第八版)第一章
•不同类型数据的适用统计量容易混淆,需结合数据类型选择合适的统计量
•标准差和方差的单位不一致,需注意理解其实际意义
•偏态和峰态的计算和解释较为抽象,需结合图形理解
1.计算给定数据集的均值、中位数、众数
2.计算给定数据集的方差、标准差、四分位数间距
3.分析不同数据集的偏态和峰态特征
4.比较不同班级学生成绩的集中趋势和离散程度
•笔试:描述性统计量的计算及性质
•应用题:利用描述性统计量分析实际数据集(如学生成绩、产品质量数据)

2
数据可视化
•理解数据可视化的重要性和基本原则
•掌握常见数据可视化工具(柱状图、折线图、散点图、直方图、箱线图等)
•能够根据数据类型和分析目的选择合适的可视化方法
•掌握数据可视化的基本操作(如坐标轴设置、标题添加、颜色调整等)
•能够通过可视化发现数据中的规律和异常值
建议 12 小时(理论学习 6 小时,练习 6 小时)
1.国家高等教育智慧教育平台《统计学原理》第二章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《数据可视化》(中国人民大学)
https://www.icourse163.org/course/RUC-1206740807
3.《Python 数据可视化实战》(李佳等)
•不同图表类型的适用场景容易混淆,需通过大量实例区分
•坐标轴的刻度和范围设置需要根据数据特点合理调整
•颜色选择和标签设置对可视化效果影响较大,需注意美学原则
1.使用 Python 的 Matplotlib 库绘制不同类型的图表(柱状图、折线图、散点图)
2.使用 Seaborn 库绘制直方图和箱线图
3.根据给定数据集选择合适的可视化方法并解释原因
4.分析可视化结果中的异常值和数据分布特征
•操作题:使用 Python 实现不同类型数据的可视化
•应用题:利用数据可视化分析实际问题(如销售趋势分析、用户行为分析)
概率基础
3
概率基本概念
•理解随机现象、随机试验的概念
•掌握样本空间和随机事件的定义及表示方法
•理解事件间的关系(包含、相等、互斥、对立等)及运算(并、交、差)
•掌握概率的统计定义、古典定义和公理化定义
•掌握概率的基本性质和运算法则
建议 12 小时(理论学习 6 小时,练习 6 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第一章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第一章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第一章
•概率的公理化定义较为抽象,需要深入理解各个公理的含义
•事件间的关系和运算容易混淆,需通过大量实例巩固
•古典概率的计算需要正确识别样本空间和事件的基本事件数
1.证明概率的加法公式:P (A∪B) = P (A) + P (B) - P (AB)
2.计算简单古典概率问题(如掷骰子、摸球等)
3.应用概率的基本性质解决实际问题
•笔试:随机事件和概率的基本概念及计算
•应用题:利用概率性质解决实际问题(如彩票中奖概率计算)

4
条件概率与独立性
•理解条件概率的概念,掌握条件概率的计算公式
•掌握乘法公式、全概率公式和贝叶斯公式
•理解事件独立性的概念,掌握独立事件的性质和判定方法
•能够应用条件概率和独立性概念解决实际问题
建议 14 小时(理论学习 7 小时,练习 7 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第二章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第二章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第二章
•全概率公式和贝叶斯公式的应用条件和适用场景容易混淆
•事件独立性与互斥性的区别需要清晰理解
•贝叶斯公式中先验概率、后验概率和似然概率的概念区分
1.证明条件概率的性质:P (A∪B|C) = P (A|C) + P (B|C) - P (AB|C)
2.应用全概率公式和贝叶斯公式解决实际问题(如疾病诊断、可靠性分析)
3.判断事件的独立性,并应用独立性简化概率计算
•笔试:条件概率和独立性的概念及计算
•应用题:利用贝叶斯公式解决实际问题(如垃圾邮件过滤)
随机变量与概率分布
5
随机变量与分布函数
•理解随机变量的概念及其分类(离散型和连续型)
•掌握分布函数的定义和性质
•能够利用分布函数计算概率
•理解离散型随机变量的概率分布律及其性质
•理解连续型随机变量的概率密度函数及其性质
建议 16 小时(理论学习 8 小时,练习 8 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第三章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第三章
•随机变量概念的抽象性,需要结合具体实例理解
•分布函数的右连续性容易被忽略
•连续型随机变量概率密度函数与分布函数的关系需要深入理解
1.证明分布函数的性质:单调不减、右连续、F (-∞)=0,F (+∞)=1
2.给定分布函数,求相应的概率密度函数(连续型)或概率分布律(离散型)
3.应用分布函数计算概率
•笔试:随机变量和分布函数的基本概念及计算
•应用题:根据实际问题建立随机变量模型,并求其分布函数

6
常见离散型随机变量
•理解 0-1 分布、二项分布、泊松分布、几何分布等常见离散型随机变量的定义和背景
•掌握常见离散型随机变量的概率分布律及其性质
•理解泊松定理的内容和应用条件
•能够应用常见离散型随机变量模型解决实际问题
建议 14 小时(理论学习 7 小时,练习 7 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第三章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第三章
•不同离散型分布的适用场景容易混淆,需通过大量实例区分
•泊松定理的理解需要结合极限过程
•几何分布的无记忆性需要深入理解
1.证明泊松分布的概率和为 1
2.应用二项分布和泊松分布解决实际计数问题
3.比较不同离散型分布的异同点
•笔试:常见离散型随机变量的分布律及性质
•应用题:根据实际问题选择合适的离散型分布模型并求解

7
常见连续型随机变量
•理解均匀分布、指数分布、正态分布等常见连续型随机变量的定义和背景
•掌握常见连续型随机变量的概率密度函数和分布函数
•理解正态分布的重要性及其性质
•能够应用常见连续型随机变量模型解决实际问题
建议 16 小时(理论学习 8 小时,练习 8 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第三章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第三章
•正态分布的概率密度函数形式复杂,需要理解其参数的意义
•指数分布的无记忆性与几何分布类似,但适用场景不同
•连续型随机变量在某一点的概率为零的理解
1.证明均匀分布和指数分布的概率密度函数积分等于 1
2.计算正态分布的概率(利用标准正态分布表)
3.应用连续型随机变量模型解决实际问题(如等待时间、测量误差等)
•笔试:常见连续型随机变量的概率密度函数和分布函数
•应用题:根据实际问题选择合适的连续型分布模型并求解

8
随机变量函数的分布
•理解随机变量函数的概念
•掌握离散型随机变量函数分布的求法
•掌握连续型随机变量函数分布的求法(分布函数法和公式法)
•能够应用随机变量函数分布解决实际问题
建议 12 小时(理论学习 6 小时,练习 6 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第三章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第三章
•连续型随机变量函数分布的求解过程较为复杂,需注意积分区间的确定
•当函数不是严格单调时,公式法的应用需要特别注意
•随机变量函数分布的实际应用需要结合具体问题灵活处理
1.求离散型随机变量函数的分布律
2.求连续型随机变量函数的概率密度函数
3.应用随机变量函数分布解决实际问题(如物理量转换问题)
•笔试:随机变量函数分布的求法
•应用题:利用随机变量函数分布解决实际问题(如测量转换问题)
统计推断基础
9
抽样分布
•理解总体、个体、样本和统计量的概念
•掌握样本均值、样本方差等常用统计量的计算方法
•理解抽样分布的概念
•掌握正态总体的抽样分布定理
•掌握 χ² 分布、t 分布和 F 分布的定义、性质及分位点
•能够应用抽样分布解决实际问题
建议 16 小时(理论学习 8 小时,练习 8 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第六章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第六章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第六章
•统计量的概念需要与随机变量区分开来
•χ² 分布、t 分布和 F 分布的定义较为抽象,需结合图形理解
•正态总体的抽样分布定理需要系统掌握
1.计算样本均值、样本方差等统计量
2.查表求 χ² 分布、t 分布和 F 分布的分位点
3.应用正态总体抽样分布定理解决实际问题
•笔试:抽样分布的基本概念及应用条件
•应用题:利用抽样分布定理解决实际问题(如样本容量确定)

10
参数估计
•理解参数估计的基本概念和类型(点估计和区间估计)
•掌握矩估计法和最大似然估计法
•理解估计量的评价标准(无偏性、有效性和一致性)
•掌握单个正态总体均值和方差的区间估计
•掌握两个正态总体均值差和方差比的区间估计
•能够应用参数估计方法解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第八章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第八章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第八章
•最大似然估计法的求解过程较为复杂,需熟练掌握求导和极值求解方法
•估计量的评价标准需要结合具体例子理解
•区间估计的置信水平和置信区间的关系需要深入理解
•不同情况下的区间估计方法需要正确选择
1.应用矩估计法和最大似然估计法估计总体参数
2.评价估计量的无偏性、有效性和一致性
3.计算正态总体参数的置信区间
4.应用参数估计方法解决实际问题(如产品质量控制)
•笔试:参数估计的方法及评价标准
•应用题:利用参数估计方法解决实际问题(如市场调研数据分析)

11
假设检验
•理解假设检验的基本思想和步骤
•理解两类错误的概念及其关系
•掌握单个正态总体均值和方差的假设检验
•掌握两个正态总体均值差和方差比的假设检验
•理解假设检验与区间估计的关系
•能够应用假设检验方法解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.国家高等教育智慧教育平台《概率论与数理统计》第九章
https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981
2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第九章
https://higher.smartedu.cn/course/62354d049906eace048e8e44
3.《概率论与数理统计》(盛骤等,第七版)第九章
•假设检验的基本思想较为抽象,需要结合实例理解
•两类错误的概率 α 和 β 的关系需要深入理解
•不同情况下的假设检验方法需要正确选择
•假设检验的拒绝域和接受域的确定需要精确计算
1.应用假设检验方法检验正态总体的均值和方差
2.分析假设检验中的两类错误
3.应用假设检验方法解决实际问题(如产品质量检验)
•笔试:假设检验的基本思想和方法
•应用题:利用假设检验方法解决实际问题(如新药疗效检验)
回归分析
12
简单线性回归
•理解回归分析的基本概念和作用
•掌握简单线性回归模型的建立方法
•掌握最小二乘法估计回归系数的方法
•理解回归方程的统计检验(F 检验、t 检验)
•理解拟合优度的度量(判定系数 R²)
•能够应用简单线性回归模型解决实际问题
建议 18 小时(理论学习 9 小时,练习 9 小时)
1.国家高等教育智慧教育平台《统计学原理》第五章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《回归分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
3.《统计学》(贾俊平,第八版)第十二章
•最小二乘法的数学推导较为复杂,需理解其几何意义
•回归方程的统计检验需要正确选择检验统计量
•判定系数 R² 的计算和解释需要结合具体例子
1.应用最小二乘法建立简单线性回归方程
2.对回归方程进行统计检验(F 检验、t 检验)
3.计算判定系数 R² 并解释其意义
4.应用简单线性回归模型进行预测
•笔试:简单线性回归模型的建立及检验
•应用题:利用简单线性回归模型解决实际问题(如销售额预测)

13
多元线性回归
•理解多元线性回归模型的基本概念和假设条件
•掌握多元线性回归模型的参数估计方法
•理解多元回归方程的统计检验(F 检验、t 检验)
•理解多重共线性的概念及其检验方法
•理解自变量选择的方法(向前选择、向后剔除、逐步回归)
•能够应用多元线性回归模型解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.国家高等教育智慧教育平台《统计学原理》第六章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《回归分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
3.《统计学》(贾俊平,第八版)第十三章
•多元回归模型的矩阵表示较为抽象,需理解其数学原理
•多重共线性的诊断和处理方法需要系统掌握
•自变量选择的方法需要结合具体问题灵活应用
1.建立多元线性回归模型并进行参数估计
2.对多元回归方程进行统计检验
3.检验和处理多重共线性问题
4.应用自变量选择方法优化回归模型
5.应用多元线性回归模型解决实际问题
•笔试:多元线性回归模型的建立及检验
•应用题:利用多元线性回归模型解决实际问题(如房价预测)

14
非线性回归与逻辑回归
•理解非线性回归模型的基本概念和类型
•掌握非线性回归模型的参数估计方法
•理解逻辑回归模型的基本原理和假设条件
•掌握逻辑回归模型的参数估计方法
•理解逻辑回归模型的预测和分类
•能够应用非线性回归和逻辑回归模型解决实际问题
建议 18 小时(理论学习 9 小时,练习 9 小时)
1.国家高等教育智慧教育平台《统计学原理》第七章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《回归分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
3.《统计学》(贾俊平,第八版)第十四章
•非线性回归模型的参数估计通常需要迭代方法,计算较为复杂
•逻辑回归模型的因变量为二分类变量,需理解其概率意义
•逻辑回归模型的参数解释需要结合对数优势比
1.建立非线性回归模型并进行参数估计
2.建立逻辑回归模型并进行参数估计
3.应用逻辑回归模型进行分类预测
4.比较不同回归模型的预测效果
•笔试:非线性回归和逻辑回归模型的建立及应用
•应用题:利用逻辑回归模型解决实际分类问题(如客户流失预测)
多元统计分析
15
聚类分析
•理解聚类分析的基本概念和类型
•掌握距离和相似性度量的方法
•掌握系统聚类法的基本原理和步骤
•掌握 K 均值聚类法的基本原理和步骤
•理解聚类结果的评价方法
•能够应用聚类分析方法解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.国家高等教育智慧教育平台《统计学原理》第九章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《多元统计分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
3.《多元统计分析》(何晓群,第六版)第七章
•不同距离度量方法的选择对聚类结果影响较大,需结合数据特点选择
•系统聚类法的计算量较大,需理解其算法原理
•K 均值聚类法对初始聚类中心敏感,需掌握合适的初始化方法
1.计算不同数据点之间的距离(欧氏距离、曼哈顿距离等)
2.应用系统聚类法对数据集进行聚类分析
3.应用 K 均值聚类法对数据集进行聚类分析
4.评价聚类结果的合理性
•笔试:聚类分析的基本原理和方法
•应用题:利用聚类分析方法解决实际问题(如客户分群)

16
主成分分析与因子分析
•理解主成分分析的基本原理和步骤
•掌握主成分分析的数学模型和几何意义
•理解因子分析的基本原理和步骤
•掌握因子载荷矩阵的估计方法
•理解因子旋转的目的和方法
•能够应用主成分分析和因子分析方法解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.国家高等教育智慧教育平台《统计学原理》第十章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《多元统计分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
3.《多元统计分析》(何晓群,第六版)第四章、第五章
•主成分分析的数学推导较为复杂,需理解其降维的本质
•因子分析的公共因子和特殊因子的解释需要结合实际问题
•因子旋转的方法(正交旋转和斜交旋转)需要正确选择
1.应用主成分分析方法对数据集进行降维
2.计算主成分的贡献率和累计贡献率
3.应用因子分析方法对数据集进行因子提取
4.进行因子旋转并解释因子的实际意义
•笔试:主成分分析和因子分析的基本原理和方法
•应用题:利用主成分分析和因子分析方法解决实际问题(如市场调研数据分析)

17
判别分析
•理解判别分析的基本概念和类型
•掌握距离判别法的基本原理和步骤
•掌握 Fisher 判别法的基本原理和步骤
•掌握贝叶斯判别法的基本原理和步骤
•理解判别分析的评价方法
•能够应用判别分析方法解决实际问题
建议 18 小时(理论学习 9 小时,练习 9 小时)
1.国家高等教育智慧教育平台《统计学原理》第十一章
https://higher.smartedu.cn/course/679d5620225d72705ec9d847
2.中国大学 MOOC《多元统计分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
3.《多元统计分析》(何晓群,第六版)第八章
•不同判别分析方法的适用条件需要区分清楚
•Fisher 判别法的数学推导较为复杂,需理解其投影思想
•贝叶斯判别法需要正确估计先验概率和类条件概率密度
1.应用距离判别法对数据集进行分类
2.应用 Fisher 判别法对数据集进行分类
3.应用贝叶斯判别法对数据集进行分类
4.比较不同判别分析方法的分类效果
•笔试:判别分析的基本原理和方法
•应用题:利用判别分析方法解决实际问题(如信用风险评估)
统计学习方法在 AI 中的应用
18
贝叶斯统计基础
•理解贝叶斯统计的基本思想和与经典统计的区别
•掌握先验分布、似然函数和后验分布的概念和计算方法
•理解共轭先验分布的概念和性质
•掌握贝叶斯估计的方法(后验期望估计、最大后验估计等)
•能够应用贝叶斯理论解决简单的参数估计问题
建议 16 小时(理论学习 8 小时,练习 8 小时)
1.中国大学 MOOC《贝叶斯统计》(华东师范大学)
https://www.icourse163.org/course/ECNU-1206640804
2.《贝叶斯统计》(茆诗松等)
3.人工智能中的贝叶斯方法(CSDN 博客)
https://blog.csdn.net/qq_34222839/article/details/147521275
•贝叶斯统计的基本思想与经典统计有较大差异,需要转变思维方式
•后验分布的计算可能涉及复杂的积分,需要掌握数值计算方法
•共轭先验分布的选择需要结合具体问题
1.应用贝叶斯定理计算后验分布
2.选择合适的先验分布并计算后验分布
3.应用贝叶斯估计方法估计总体参数
4.应用贝叶斯理论解决实际问题(如疾病诊断)
•笔试:贝叶斯理论的基本概念和计算
•应用题:利用贝叶斯理论解决实际问题(如参数估计)

19
贝叶斯网络
•理解贝叶斯网络的基本概念和表示方法
•掌握贝叶斯网络的联合概率分布分解
•理解条件独立性在贝叶斯网络中的表示
•掌握贝叶斯网络的学习方法(结构学习和参数学习)
•掌握贝叶斯网络的推断方法(精确推断和近似推断)
•能够应用贝叶斯网络解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.《机器学习》(周志华)第七章
2.贝叶斯网络及其应用(CSDN 博客)
https://blog.csdn.net/qq_34222839/article/details/147521275
3.贝叶斯网络在人工智能中的应用(腾讯云开发者社区)
https://cloud.tencent.com/developer/article/2523367
•贝叶斯网络的结构学习是 NP 难问题,需要理解启发式搜索方法
•精确推断的计算复杂度高,需要掌握近似推断方法
•贝叶斯网络的应用需要结合具体领域知识
1.构建简单的贝叶斯网络模型
2.学习贝叶斯网络的结构和参数
3.应用贝叶斯网络进行概率推断
4.应用贝叶斯网络解决实际问题(如医疗诊断)
•笔试:贝叶斯网络的基本概念和推断方法
•应用题:利用贝叶斯网络解决实际问题(如风险评估)

20
统计学习理论基础
•理解统计学习理论的基本概念和框架
•掌握经验风险最小化和结构风险最小化原则
•理解 VC 维的概念和意义
•掌握支持向量机的基本原理和算法
•理解核技巧在支持向量机中的应用
•能够应用统计学习理论分析和解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.《机器学习》(周志华)第七章
2.统计学习理论基础(CSDN 博客)
https://blog.csdn.net/qq_34222839/article/details/147521275
3.支持向量机在人工智能中的应用(腾讯云开发者社区)
https://cloud.tencent.com/developer/article/2523367
•VC 维的数学定义较为抽象,需理解其直观意义
•支持向量机的数学推导较为复杂,需掌握其几何意义
•核函数的选择对支持向量机的性能影响较大,需结合数据特点选择
1.推导支持向量机的最大间隔分类超平面
2.应用核技巧解决非线性分类问题
3.应用支持向量机解决实际分类问题
4.比较不同核函数在支持向量机中的性能差异
•笔试:统计学习理论的基本概念和支持向量机原理
•应用题:利用支持向量机解决实际问题(如手写数字识别)

21
决策树与随机森林
•理解决策树的基本概念和构造方法
•掌握信息增益、信息增益比和基尼指数等特征选择标准
•理解决策树的剪枝方法(预剪枝和后剪枝)
•掌握随机森林的基本原理和算法
•理解集成学习的基本思想和方法
•能够应用决策树和随机森林解决实际问题
建议 20 小时(理论学习 10 小时,练习 10 小时)
1.《机器学习》(周志华)第四章
2.决策树与随机森林(CSDN 博客)
https://blog.csdn.net/qq_34222839/article/details/147521275
3.决策树在人工智能中的应用(腾讯云开发者社区)
https://cloud.tencent.com/developer/article/2523367
•不同特征选择标准的计算和比较需要系统掌握
•决策树的剪枝方法需要结合具体问题选择
•随机森林的集成策略需要理解其降低方差的原理
1.应用信息增益和基尼指数构造决策树
2.对决策树进行剪枝处理
3.应用随机森林算法解决分类问题
4.比较决策树和随机森林的性能差异
•笔试:决策树和随机森林的基本原理和方法
•应用题:利用决策树和随机森林解决实际问题(如客户流失预测)
高级统计方法在 AI 中的应用
22
时间序列分析基础
•理解时间序列的基本概念和类型
•掌握时间序列的平稳性检验方法
•理解自相关函数和偏自相关函数的概念和性质
•掌握 ARIMA 模型的基本原理和建立步骤
•理解季节性时间序列模型的基本原理
•能够应用时间序列分析方法解决实际问题
建议 18 小时(理论学习 9 小时,练习 9 小时)
1.中国大学 MOOC《应用时间序列分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
2.《应用时间序列分析》(王燕,第五版)
3.时间序列分析在人工智能中的应用(CSDN 博客)
https://blog.csdn.net/qq_34222839/article/details/147521275
•时间序列的平稳性检验需要掌握 ADF 检验等方法
•ARIMA 模型的定阶需要结合自相关和偏自相关函数图
•季节性时间序列模型的处理较为复杂,需理解季节分解的方法
1.检验时间序列的平稳性
2.计算时间序列的自相关函数和偏自相关函数
3.建立 ARIMA 模型并进行预测
4.应用季节性时间序列模型进行预测
•笔试:时间序列分析的基本原理和方法
•应用题:利用时间序列分析方法解决实际问题(如销售额预测)

23
生存分析基础
•理解生存分析的基本概念和术语
•掌握生存函数和风险函数的定义和性质
•掌握 Kaplan-Meier 估计法
•理解 Cox 比例风险模型的基本原理和应用条件
•掌握 Cox 比例风险模型的参数估计方法
•能够应用生存分析方法解决实际问题
建议 16 小时(理论学习 8 小时,练习 8 小时)
1.中国大学 MOOC《生存分析》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
2.《生存分析》(易丹辉)
3.生存分析在人工智能中的应用(CSDN 博客)
https://blog.csdn.net/qq_34222839/article/details/147521275
•生存分析中的删失数据处理方法需要系统掌握
•Kaplan-Meier 估计法的计算步骤较为复杂,需理解其非参数特性
•Cox 比例风险模型的比例风险假设需要检验
1.应用 Kaplan-Meier 估计法估计生存函数
2.检验 Cox 比例风险模型的比例风险假设
3.建立 Cox 比例风险模型并解释结果
4.应用生存分析方法解决实际问题(如产品寿命分析)
•笔试:生存分析的基本原理和方法
•应用题:利用生存分析方法解决实际问题(如患者生存时间分析)

24
非参数统计方法
•理解非参数统计的基本概念和特点
•掌握符号检验、Wilcoxon 符号秩检验等单样本非参数检验方法
•掌握 Mann-Whitney U 检验、Wilcoxon 秩和检验等两样本非参数检验方法
•掌握 Kruskal-Wallis 检验等多样本非参数检验方法
•理解秩相关分析方法(Spearman 秩相关、Kendall τ 相关)
•能够应用非参数统计方法解决实际问题
建议 16 小时(理论学习 8 小时,练习 8 小时)
1.中国大学 MOOC《非参数统计》(中国人民大学)
https://www.icourse163.org/course/RUC-1206719809
2.《非参数统计》(吴喜之)
3.非参数统计在人工智能中的应用(CSDN 博客)
https://blog.csdn.net/qq_34222839/article/details/147521275
•非参数检验方法的适用条件需要与参数检验方法区分
•秩相关系数的计算和解释需要结合具体例子
•多样本非参数检验方法的多重比较问题需要处理
1.应用符号检验和 Wilcoxon 符号秩检验分析单样本数据
2.应用 Mann-Whitney U 检验和 Wilcoxon 秩和检验分析两样本数据
3.应用 Kruskal-Wallis 检验分析多样本数据
4.计算 Spearman 秩相关系数和 Kendall τ 相关系数
•笔试:非参数统计方法的基本原理和应用条件
•应用题:利用非参数统计方法解决实际问题(如不同疗法效果比较)



参考资料

[1] 《人工智能本科专业知识体系与课程设置》笔记 https://blog.csdn.net/yalecaltech/article/details/117378537

[2] Statistics for AI Data Science and Business Analysis - 2025 https://www.udemy.com/course/statistics-probability-for-data-science/?srsltid=AfmBOopQdVyg4KIEskHrctVU70kZ3xKzRQ-1kwK76JQYu4mhbV9klvB0

[3] AAI 500 - Probability and Statistics for Artificial Intelligence | University of San Diego Online Degrees https://onlinedegrees.sandiego.edu/classes/probability-and-statistics-for-artificial-intelligence-maai-500/

[4] 课程 - 国家高等教育智慧教育平台 https://www.chinaooc.com.cn/course/679d5620225d72705ec9d847

[5] 人工智能四年课程-抖音 https://www.iesdouyin.com/share/video/7524910208696110372/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&from_aid=1128&from_ssr=1&iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&mid=7524910231655385907&region=&scene_from=dy_open_search_video&share_sign=fXwxUleyDSZregFaf4vSZofC.R7iH_sltxnvoHolRWI-&share_track_info=%7B%22link_description_type%22%3A%22%22%7D&share_version=280700&titleType=title&ts=1755788157&u_code=0&video_share_track_ver=&with_sec_did=1

[6] 人工智能,必学教材有哪些?大学生-抖音 https://www.iesdouyin.com/share/video/7119058515536137502/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&from_aid=1128&from_ssr=1&iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&mid=7119058607010040606&region=&scene_from=dy_open_search_video&share_sign=awXXet67bc1FrMrP7Bo8GP1TY.1tuDb_rMp.l3aII0Y-&share_track_info=%7B%22link_description_type%22%3A%22%22%7D&share_version=280700&titleType=title&ts=1755788158&u_code=0&video_share_track_ver=&with_sec_did=1

[7] 数学分析的推演、高等代数的矩阵,C语言与Python的代码闪烁,微观经济学的图表交织,还有数学建模时的思维碰撞。这些画面,藏着四川轻化工大学应用统计学的硬核课程表~-抖音 https://www.iesdouyin.com/share/video/7532109717997980987/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&from_aid=1128&from_ssr=1&iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&mid=7532109700024912678&region=&scene_from=dy_open_search_video&share_sign=yQH3K04uCz7hh.16nZ2nc0HgQG9lRRO8ixKClhwe3Ng-&share_track_info=%7B%22link_description_type%22%3A%22%22%7D&share_version=280700&titleType=title&ts=1755788157&u_code=0&video_share_track_ver=&with_sec_did=1

[8] AI 高手之路 #3:概率统计——AI 世界的“天气预报”_ai优化数据的后验概率结果-CSDN博客 https://blog.csdn.net/liu1983robin/article/details/145945521

[9] ai人工智能中的概率论与统计学原理与python实战:1.概率论基础知识及其在ai中的应用1.背景介绍概率论和统计学 https://juejin.cn/post/7310412285884760090

[10] 人工智能数学基础(六):数理统计-CSDN博客 https://blog.csdn.net/2302_80961196/article/details/147639722

[11] AI人工智能中的概率论与统计学原理与Python实战:Python实现图像识别1.背景介绍 人工智能(Artificia - 掘金 https://juejin.cn/post/7313978011367391283

[12] AI人工智能中的概率论与统计学原理与Python实战:Python实现自然语言处理_51CTO博客_概率论 人工智能 https://blog.51cto.com/universsky/8997075

[13] 人工智能基础课03数学基础-窥一斑而知全豹:数理统计-CSDN博客 https://blog.csdn.net/fegus/article/details/130239942

[14] 统计学在人工智能中的应用剖析-洞察分析.docx - 人人文库 https://m.renrendoc.com/paper/374911293.html


分享到: