大类 | 序号 | 知识点 | 学习要求 | 学习时长建议 | 学习资源 | 难点总结 | 课后练习 | 过关考试 |
描述性统计基础 | 1 | 数据类型与描述性统计量 | •理解数据的类型(数值型、分类型)及其特点 •掌握集中趋势的度量(均值、中位数、众数) •掌握离散程度的度量(方差、标准差、极差、四分位数间距) •理解分布形态的度量(偏态、峰态) •能够应用描述性统计量分析实际数据 | 建议 10 小时(理论学习 5 小时,练习 5 小时) | 1.国家高等教育智慧教育平台《统计学原理》第一章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《统计学》(浙江大学)第一章 https://www.icourse163.org/course/ZJU-1206719809 3.《统计学》(贾俊平,第八版)第一章 | •不同类型数据的适用统计量容易混淆,需结合数据类型选择合适的统计量 •标准差和方差的单位不一致,需注意理解其实际意义 •偏态和峰态的计算和解释较为抽象,需结合图形理解 | 1.计算给定数据集的均值、中位数、众数 2.计算给定数据集的方差、标准差、四分位数间距 3.分析不同数据集的偏态和峰态特征 4.比较不同班级学生成绩的集中趋势和离散程度 | •笔试:描述性统计量的计算及性质 •应用题:利用描述性统计量分析实际数据集(如学生成绩、产品质量数据) |
| 2 | 数据可视化 | •理解数据可视化的重要性和基本原则 •掌握常见数据可视化工具(柱状图、折线图、散点图、直方图、箱线图等) •能够根据数据类型和分析目的选择合适的可视化方法 •掌握数据可视化的基本操作(如坐标轴设置、标题添加、颜色调整等) •能够通过可视化发现数据中的规律和异常值 | 建议 12 小时(理论学习 6 小时,练习 6 小时) | 1.国家高等教育智慧教育平台《统计学原理》第二章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《数据可视化》(中国人民大学) https://www.icourse163.org/course/RUC-1206740807 3.《Python 数据可视化实战》(李佳等) | •不同图表类型的适用场景容易混淆,需通过大量实例区分 •坐标轴的刻度和范围设置需要根据数据特点合理调整 •颜色选择和标签设置对可视化效果影响较大,需注意美学原则 | 1.使用 Python 的 Matplotlib 库绘制不同类型的图表(柱状图、折线图、散点图) 2.使用 Seaborn 库绘制直方图和箱线图 3.根据给定数据集选择合适的可视化方法并解释原因 4.分析可视化结果中的异常值和数据分布特征 | •操作题:使用 Python 实现不同类型数据的可视化 •应用题:利用数据可视化分析实际问题(如销售趋势分析、用户行为分析) |
概率基础 | 3 | 概率基本概念 | •理解随机现象、随机试验的概念 •掌握样本空间和随机事件的定义及表示方法 •理解事件间的关系(包含、相等、互斥、对立等)及运算(并、交、差) •掌握概率的统计定义、古典定义和公理化定义 •掌握概率的基本性质和运算法则 | 建议 12 小时(理论学习 6 小时,练习 6 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第一章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第一章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第一章 | •概率的公理化定义较为抽象,需要深入理解各个公理的含义 •事件间的关系和运算容易混淆,需通过大量实例巩固 •古典概率的计算需要正确识别样本空间和事件的基本事件数 | 1.证明概率的加法公式:P (A∪B) = P (A) + P (B) - P (AB) 2.计算简单古典概率问题(如掷骰子、摸球等) 3.应用概率的基本性质解决实际问题 | •笔试:随机事件和概率的基本概念及计算 •应用题:利用概率性质解决实际问题(如彩票中奖概率计算) |
| 4 | 条件概率与独立性 | •理解条件概率的概念,掌握条件概率的计算公式 •掌握乘法公式、全概率公式和贝叶斯公式 •理解事件独立性的概念,掌握独立事件的性质和判定方法 •能够应用条件概率和独立性概念解决实际问题 | 建议 14 小时(理论学习 7 小时,练习 7 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第二章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第二章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第二章 | •全概率公式和贝叶斯公式的应用条件和适用场景容易混淆 •事件独立性与互斥性的区别需要清晰理解 •贝叶斯公式中先验概率、后验概率和似然概率的概念区分 | 1.证明条件概率的性质:P (A∪B|C) = P (A|C) + P (B|C) - P (AB|C) 2.应用全概率公式和贝叶斯公式解决实际问题(如疾病诊断、可靠性分析) 3.判断事件的独立性,并应用独立性简化概率计算 | •笔试:条件概率和独立性的概念及计算 •应用题:利用贝叶斯公式解决实际问题(如垃圾邮件过滤) |
随机变量与概率分布 | 5 | 随机变量与分布函数 | •理解随机变量的概念及其分类(离散型和连续型) •掌握分布函数的定义和性质 •能够利用分布函数计算概率 •理解离散型随机变量的概率分布律及其性质 •理解连续型随机变量的概率密度函数及其性质 | 建议 16 小时(理论学习 8 小时,练习 8 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第三章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第三章 | •随机变量概念的抽象性,需要结合具体实例理解 •分布函数的右连续性容易被忽略 •连续型随机变量概率密度函数与分布函数的关系需要深入理解 | 1.证明分布函数的性质:单调不减、右连续、F (-∞)=0,F (+∞)=1 2.给定分布函数,求相应的概率密度函数(连续型)或概率分布律(离散型) 3.应用分布函数计算概率 | •笔试:随机变量和分布函数的基本概念及计算 •应用题:根据实际问题建立随机变量模型,并求其分布函数 |
| 6 | 常见离散型随机变量 | •理解 0-1 分布、二项分布、泊松分布、几何分布等常见离散型随机变量的定义和背景 •掌握常见离散型随机变量的概率分布律及其性质 •理解泊松定理的内容和应用条件 •能够应用常见离散型随机变量模型解决实际问题 | 建议 14 小时(理论学习 7 小时,练习 7 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第三章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第三章 | •不同离散型分布的适用场景容易混淆,需通过大量实例区分 •泊松定理的理解需要结合极限过程 •几何分布的无记忆性需要深入理解 | 1.证明泊松分布的概率和为 1 2.应用二项分布和泊松分布解决实际计数问题 3.比较不同离散型分布的异同点 | •笔试:常见离散型随机变量的分布律及性质 •应用题:根据实际问题选择合适的离散型分布模型并求解 |
| 7 | 常见连续型随机变量 | •理解均匀分布、指数分布、正态分布等常见连续型随机变量的定义和背景 •掌握常见连续型随机变量的概率密度函数和分布函数 •理解正态分布的重要性及其性质 •能够应用常见连续型随机变量模型解决实际问题 | 建议 16 小时(理论学习 8 小时,练习 8 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第三章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第三章 | •正态分布的概率密度函数形式复杂,需要理解其参数的意义 •指数分布的无记忆性与几何分布类似,但适用场景不同 •连续型随机变量在某一点的概率为零的理解 | 1.证明均匀分布和指数分布的概率密度函数积分等于 1 2.计算正态分布的概率(利用标准正态分布表) 3.应用连续型随机变量模型解决实际问题(如等待时间、测量误差等) | •笔试:常见连续型随机变量的概率密度函数和分布函数 •应用题:根据实际问题选择合适的连续型分布模型并求解 |
| 8 | 随机变量函数的分布 | •理解随机变量函数的概念 •掌握离散型随机变量函数分布的求法 •掌握连续型随机变量函数分布的求法(分布函数法和公式法) •能够应用随机变量函数分布解决实际问题 | 建议 12 小时(理论学习 6 小时,练习 6 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第三章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第三章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第三章 | •连续型随机变量函数分布的求解过程较为复杂,需注意积分区间的确定 •当函数不是严格单调时,公式法的应用需要特别注意 •随机变量函数分布的实际应用需要结合具体问题灵活处理 | 1.求离散型随机变量函数的分布律 2.求连续型随机变量函数的概率密度函数 3.应用随机变量函数分布解决实际问题(如物理量转换问题) | •笔试:随机变量函数分布的求法 •应用题:利用随机变量函数分布解决实际问题(如测量转换问题) |
统计推断基础 | 9 | 抽样分布 | •理解总体、个体、样本和统计量的概念 •掌握样本均值、样本方差等常用统计量的计算方法 •理解抽样分布的概念 •掌握正态总体的抽样分布定理 •掌握 χ² 分布、t 分布和 F 分布的定义、性质及分位点 •能够应用抽样分布解决实际问题 | 建议 16 小时(理论学习 8 小时,练习 8 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第六章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第六章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第六章 | •统计量的概念需要与随机变量区分开来 •χ² 分布、t 分布和 F 分布的定义较为抽象,需结合图形理解 •正态总体的抽样分布定理需要系统掌握 | 1.计算样本均值、样本方差等统计量 2.查表求 χ² 分布、t 分布和 F 分布的分位点 3.应用正态总体抽样分布定理解决实际问题 | •笔试:抽样分布的基本概念及应用条件 •应用题:利用抽样分布定理解决实际问题(如样本容量确定) |
| 10 | 参数估计 | •理解参数估计的基本概念和类型(点估计和区间估计) •掌握矩估计法和最大似然估计法 •理解估计量的评价标准(无偏性、有效性和一致性) •掌握单个正态总体均值和方差的区间估计 •掌握两个正态总体均值差和方差比的区间估计 •能够应用参数估计方法解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第八章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第八章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第八章 | •最大似然估计法的求解过程较为复杂,需熟练掌握求导和极值求解方法 •估计量的评价标准需要结合具体例子理解 •区间估计的置信水平和置信区间的关系需要深入理解 •不同情况下的区间估计方法需要正确选择 | 1.应用矩估计法和最大似然估计法估计总体参数 2.评价估计量的无偏性、有效性和一致性 3.计算正态总体参数的置信区间 4.应用参数估计方法解决实际问题(如产品质量控制) | •笔试:参数估计的方法及评价标准 •应用题:利用参数估计方法解决实际问题(如市场调研数据分析) |
| 11 | 假设检验 | •理解假设检验的基本思想和步骤 •理解两类错误的概念及其关系 •掌握单个正态总体均值和方差的假设检验 •掌握两个正态总体均值差和方差比的假设检验 •理解假设检验与区间估计的关系 •能够应用假设检验方法解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.国家高等教育智慧教育平台《概率论与数理统计》第九章 https://higher.smartedu.cn/course/65aeef7ebb5c5a8025763981 2.中国大学 MOOC《概率论与数理统计》(安徽农业大学)第九章 https://higher.smartedu.cn/course/62354d049906eace048e8e44 3.《概率论与数理统计》(盛骤等,第七版)第九章 | •假设检验的基本思想较为抽象,需要结合实例理解 •两类错误的概率 α 和 β 的关系需要深入理解 •不同情况下的假设检验方法需要正确选择 •假设检验的拒绝域和接受域的确定需要精确计算 | 1.应用假设检验方法检验正态总体的均值和方差 2.分析假设检验中的两类错误 3.应用假设检验方法解决实际问题(如产品质量检验) | •笔试:假设检验的基本思想和方法 •应用题:利用假设检验方法解决实际问题(如新药疗效检验) |
回归分析 | 12 | 简单线性回归 | •理解回归分析的基本概念和作用 •掌握简单线性回归模型的建立方法 •掌握最小二乘法估计回归系数的方法 •理解回归方程的统计检验(F 检验、t 检验) •理解拟合优度的度量(判定系数 R²) •能够应用简单线性回归模型解决实际问题 | 建议 18 小时(理论学习 9 小时,练习 9 小时) | 1.国家高等教育智慧教育平台《统计学原理》第五章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《回归分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 3.《统计学》(贾俊平,第八版)第十二章 | •最小二乘法的数学推导较为复杂,需理解其几何意义 •回归方程的统计检验需要正确选择检验统计量 •判定系数 R² 的计算和解释需要结合具体例子 | 1.应用最小二乘法建立简单线性回归方程 2.对回归方程进行统计检验(F 检验、t 检验) 3.计算判定系数 R² 并解释其意义 4.应用简单线性回归模型进行预测 | •笔试:简单线性回归模型的建立及检验 •应用题:利用简单线性回归模型解决实际问题(如销售额预测) |
| 13 | 多元线性回归 | •理解多元线性回归模型的基本概念和假设条件 •掌握多元线性回归模型的参数估计方法 •理解多元回归方程的统计检验(F 检验、t 检验) •理解多重共线性的概念及其检验方法 •理解自变量选择的方法(向前选择、向后剔除、逐步回归) •能够应用多元线性回归模型解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.国家高等教育智慧教育平台《统计学原理》第六章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《回归分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 3.《统计学》(贾俊平,第八版)第十三章 | •多元回归模型的矩阵表示较为抽象,需理解其数学原理 •多重共线性的诊断和处理方法需要系统掌握 •自变量选择的方法需要结合具体问题灵活应用 | 1.建立多元线性回归模型并进行参数估计 2.对多元回归方程进行统计检验 3.检验和处理多重共线性问题 4.应用自变量选择方法优化回归模型 5.应用多元线性回归模型解决实际问题 | •笔试:多元线性回归模型的建立及检验 •应用题:利用多元线性回归模型解决实际问题(如房价预测) |
| 14 | 非线性回归与逻辑回归 | •理解非线性回归模型的基本概念和类型 •掌握非线性回归模型的参数估计方法 •理解逻辑回归模型的基本原理和假设条件 •掌握逻辑回归模型的参数估计方法 •理解逻辑回归模型的预测和分类 •能够应用非线性回归和逻辑回归模型解决实际问题 | 建议 18 小时(理论学习 9 小时,练习 9 小时) | 1.国家高等教育智慧教育平台《统计学原理》第七章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《回归分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 3.《统计学》(贾俊平,第八版)第十四章 | •非线性回归模型的参数估计通常需要迭代方法,计算较为复杂 •逻辑回归模型的因变量为二分类变量,需理解其概率意义 •逻辑回归模型的参数解释需要结合对数优势比 | 1.建立非线性回归模型并进行参数估计 2.建立逻辑回归模型并进行参数估计 3.应用逻辑回归模型进行分类预测 4.比较不同回归模型的预测效果 | •笔试:非线性回归和逻辑回归模型的建立及应用 •应用题:利用逻辑回归模型解决实际分类问题(如客户流失预测) |
多元统计分析 | 15 | 聚类分析 | •理解聚类分析的基本概念和类型 •掌握距离和相似性度量的方法 •掌握系统聚类法的基本原理和步骤 •掌握 K 均值聚类法的基本原理和步骤 •理解聚类结果的评价方法 •能够应用聚类分析方法解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.国家高等教育智慧教育平台《统计学原理》第九章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《多元统计分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 3.《多元统计分析》(何晓群,第六版)第七章 | •不同距离度量方法的选择对聚类结果影响较大,需结合数据特点选择 •系统聚类法的计算量较大,需理解其算法原理 •K 均值聚类法对初始聚类中心敏感,需掌握合适的初始化方法 | 1.计算不同数据点之间的距离(欧氏距离、曼哈顿距离等) 2.应用系统聚类法对数据集进行聚类分析 3.应用 K 均值聚类法对数据集进行聚类分析 4.评价聚类结果的合理性 | •笔试:聚类分析的基本原理和方法 •应用题:利用聚类分析方法解决实际问题(如客户分群) |
| 16 | 主成分分析与因子分析 | •理解主成分分析的基本原理和步骤 •掌握主成分分析的数学模型和几何意义 •理解因子分析的基本原理和步骤 •掌握因子载荷矩阵的估计方法 •理解因子旋转的目的和方法 •能够应用主成分分析和因子分析方法解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.国家高等教育智慧教育平台《统计学原理》第十章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《多元统计分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 3.《多元统计分析》(何晓群,第六版)第四章、第五章 | •主成分分析的数学推导较为复杂,需理解其降维的本质 •因子分析的公共因子和特殊因子的解释需要结合实际问题 •因子旋转的方法(正交旋转和斜交旋转)需要正确选择 | 1.应用主成分分析方法对数据集进行降维 2.计算主成分的贡献率和累计贡献率 3.应用因子分析方法对数据集进行因子提取 4.进行因子旋转并解释因子的实际意义 | •笔试:主成分分析和因子分析的基本原理和方法 •应用题:利用主成分分析和因子分析方法解决实际问题(如市场调研数据分析) |
| 17 | 判别分析 | •理解判别分析的基本概念和类型 •掌握距离判别法的基本原理和步骤 •掌握 Fisher 判别法的基本原理和步骤 •掌握贝叶斯判别法的基本原理和步骤 •理解判别分析的评价方法 •能够应用判别分析方法解决实际问题 | 建议 18 小时(理论学习 9 小时,练习 9 小时) | 1.国家高等教育智慧教育平台《统计学原理》第十一章 https://higher.smartedu.cn/course/679d5620225d72705ec9d847 2.中国大学 MOOC《多元统计分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 3.《多元统计分析》(何晓群,第六版)第八章 | •不同判别分析方法的适用条件需要区分清楚 •Fisher 判别法的数学推导较为复杂,需理解其投影思想 •贝叶斯判别法需要正确估计先验概率和类条件概率密度 | 1.应用距离判别法对数据集进行分类 2.应用 Fisher 判别法对数据集进行分类 3.应用贝叶斯判别法对数据集进行分类 4.比较不同判别分析方法的分类效果 | •笔试:判别分析的基本原理和方法 •应用题:利用判别分析方法解决实际问题(如信用风险评估) |
统计学习方法在 AI 中的应用 | 18 | 贝叶斯统计基础 | •理解贝叶斯统计的基本思想和与经典统计的区别 •掌握先验分布、似然函数和后验分布的概念和计算方法 •理解共轭先验分布的概念和性质 •掌握贝叶斯估计的方法(后验期望估计、最大后验估计等) •能够应用贝叶斯理论解决简单的参数估计问题 | 建议 16 小时(理论学习 8 小时,练习 8 小时) | 1.中国大学 MOOC《贝叶斯统计》(华东师范大学) https://www.icourse163.org/course/ECNU-1206640804 2.《贝叶斯统计》(茆诗松等) 3.人工智能中的贝叶斯方法(CSDN 博客) https://blog.csdn.net/qq_34222839/article/details/147521275 | •贝叶斯统计的基本思想与经典统计有较大差异,需要转变思维方式 •后验分布的计算可能涉及复杂的积分,需要掌握数值计算方法 •共轭先验分布的选择需要结合具体问题 | 1.应用贝叶斯定理计算后验分布 2.选择合适的先验分布并计算后验分布 3.应用贝叶斯估计方法估计总体参数 4.应用贝叶斯理论解决实际问题(如疾病诊断) | •笔试:贝叶斯理论的基本概念和计算 •应用题:利用贝叶斯理论解决实际问题(如参数估计) |
| 19 | 贝叶斯网络 | •理解贝叶斯网络的基本概念和表示方法 •掌握贝叶斯网络的联合概率分布分解 •理解条件独立性在贝叶斯网络中的表示 •掌握贝叶斯网络的学习方法(结构学习和参数学习) •掌握贝叶斯网络的推断方法(精确推断和近似推断) •能够应用贝叶斯网络解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.《机器学习》(周志华)第七章 2.贝叶斯网络及其应用(CSDN 博客) https://blog.csdn.net/qq_34222839/article/details/147521275 3.贝叶斯网络在人工智能中的应用(腾讯云开发者社区) https://cloud.tencent.com/developer/article/2523367 | •贝叶斯网络的结构学习是 NP 难问题,需要理解启发式搜索方法 •精确推断的计算复杂度高,需要掌握近似推断方法 •贝叶斯网络的应用需要结合具体领域知识 | 1.构建简单的贝叶斯网络模型 2.学习贝叶斯网络的结构和参数 3.应用贝叶斯网络进行概率推断 4.应用贝叶斯网络解决实际问题(如医疗诊断) | •笔试:贝叶斯网络的基本概念和推断方法 •应用题:利用贝叶斯网络解决实际问题(如风险评估) |
| 20 | 统计学习理论基础 | •理解统计学习理论的基本概念和框架 •掌握经验风险最小化和结构风险最小化原则 •理解 VC 维的概念和意义 •掌握支持向量机的基本原理和算法 •理解核技巧在支持向量机中的应用 •能够应用统计学习理论分析和解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.《机器学习》(周志华)第七章 2.统计学习理论基础(CSDN 博客) https://blog.csdn.net/qq_34222839/article/details/147521275 3.支持向量机在人工智能中的应用(腾讯云开发者社区) https://cloud.tencent.com/developer/article/2523367 | •VC 维的数学定义较为抽象,需理解其直观意义 •支持向量机的数学推导较为复杂,需掌握其几何意义 •核函数的选择对支持向量机的性能影响较大,需结合数据特点选择 | 1.推导支持向量机的最大间隔分类超平面 2.应用核技巧解决非线性分类问题 3.应用支持向量机解决实际分类问题 4.比较不同核函数在支持向量机中的性能差异 | •笔试:统计学习理论的基本概念和支持向量机原理 •应用题:利用支持向量机解决实际问题(如手写数字识别) |
| 21 | 决策树与随机森林 | •理解决策树的基本概念和构造方法 •掌握信息增益、信息增益比和基尼指数等特征选择标准 •理解决策树的剪枝方法(预剪枝和后剪枝) •掌握随机森林的基本原理和算法 •理解集成学习的基本思想和方法 •能够应用决策树和随机森林解决实际问题 | 建议 20 小时(理论学习 10 小时,练习 10 小时) | 1.《机器学习》(周志华)第四章 2.决策树与随机森林(CSDN 博客) https://blog.csdn.net/qq_34222839/article/details/147521275 3.决策树在人工智能中的应用(腾讯云开发者社区) https://cloud.tencent.com/developer/article/2523367 | •不同特征选择标准的计算和比较需要系统掌握 •决策树的剪枝方法需要结合具体问题选择 •随机森林的集成策略需要理解其降低方差的原理 | 1.应用信息增益和基尼指数构造决策树 2.对决策树进行剪枝处理 3.应用随机森林算法解决分类问题 4.比较决策树和随机森林的性能差异 | •笔试:决策树和随机森林的基本原理和方法 •应用题:利用决策树和随机森林解决实际问题(如客户流失预测) |
高级统计方法在 AI 中的应用 | 22 | 时间序列分析基础 | •理解时间序列的基本概念和类型 •掌握时间序列的平稳性检验方法 •理解自相关函数和偏自相关函数的概念和性质 •掌握 ARIMA 模型的基本原理和建立步骤 •理解季节性时间序列模型的基本原理 •能够应用时间序列分析方法解决实际问题 | 建议 18 小时(理论学习 9 小时,练习 9 小时) | 1.中国大学 MOOC《应用时间序列分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 2.《应用时间序列分析》(王燕,第五版) 3.时间序列分析在人工智能中的应用(CSDN 博客) https://blog.csdn.net/qq_34222839/article/details/147521275 | •时间序列的平稳性检验需要掌握 ADF 检验等方法 •ARIMA 模型的定阶需要结合自相关和偏自相关函数图 •季节性时间序列模型的处理较为复杂,需理解季节分解的方法 | 1.检验时间序列的平稳性 2.计算时间序列的自相关函数和偏自相关函数 3.建立 ARIMA 模型并进行预测 4.应用季节性时间序列模型进行预测 | •笔试:时间序列分析的基本原理和方法 •应用题:利用时间序列分析方法解决实际问题(如销售额预测) |
| 23 | 生存分析基础 | •理解生存分析的基本概念和术语 •掌握生存函数和风险函数的定义和性质 •掌握 Kaplan-Meier 估计法 •理解 Cox 比例风险模型的基本原理和应用条件 •掌握 Cox 比例风险模型的参数估计方法 •能够应用生存分析方法解决实际问题 | 建议 16 小时(理论学习 8 小时,练习 8 小时) | 1.中国大学 MOOC《生存分析》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 2.《生存分析》(易丹辉) 3.生存分析在人工智能中的应用(CSDN 博客) https://blog.csdn.net/qq_34222839/article/details/147521275 | •生存分析中的删失数据处理方法需要系统掌握 •Kaplan-Meier 估计法的计算步骤较为复杂,需理解其非参数特性 •Cox 比例风险模型的比例风险假设需要检验 | 1.应用 Kaplan-Meier 估计法估计生存函数 2.检验 Cox 比例风险模型的比例风险假设 3.建立 Cox 比例风险模型并解释结果 4.应用生存分析方法解决实际问题(如产品寿命分析) | •笔试:生存分析的基本原理和方法 •应用题:利用生存分析方法解决实际问题(如患者生存时间分析) |
| 24 | 非参数统计方法 | •理解非参数统计的基本概念和特点 •掌握符号检验、Wilcoxon 符号秩检验等单样本非参数检验方法 •掌握 Mann-Whitney U 检验、Wilcoxon 秩和检验等两样本非参数检验方法 •掌握 Kruskal-Wallis 检验等多样本非参数检验方法 •理解秩相关分析方法(Spearman 秩相关、Kendall τ 相关) •能够应用非参数统计方法解决实际问题 | 建议 16 小时(理论学习 8 小时,练习 8 小时) | 1.中国大学 MOOC《非参数统计》(中国人民大学) https://www.icourse163.org/course/RUC-1206719809 2.《非参数统计》(吴喜之) 3.非参数统计在人工智能中的应用(CSDN 博客) https://blog.csdn.net/qq_34222839/article/details/147521275 | •非参数检验方法的适用条件需要与参数检验方法区分 •秩相关系数的计算和解释需要结合具体例子 •多样本非参数检验方法的多重比较问题需要处理 | 1.应用符号检验和 Wilcoxon 符号秩检验分析单样本数据 2.应用 Mann-Whitney U 检验和 Wilcoxon 秩和检验分析两样本数据 3.应用 Kruskal-Wallis 检验分析多样本数据 4.计算 Spearman 秩相关系数和 Kendall τ 相关系数 | •笔试:非参数统计方法的基本原理和应用条件 •应用题:利用非参数统计方法解决实际问题(如不同疗法效果比较) |