在线学AI

人工智能分类沙盘大全

完整的介绍了人工智能的分类

发表时间：2025-08-10 23:31作者：雨季

一、人工智能(AI)领域分类沙盘

人工智能领域

0.1 符号主义/逻辑主义
人工预定规则
专家系统

分层一：

人工智能在机器学习出现之前，技术路线多样化，小众化。从技术路径、实现方式等多个角度划分，机器学习（以数据驱动的自动学习为核心）是当前最主流的分支之一，除此之外，有出现过许多基于规则、逻辑、先验知识或交互反馈的分类，主要概括起来包括以下几类：

人工智能史前分类：（机器学习之前的常见分类）├─ 0.1 符号主义（逻辑主义）与专家系统│ ├─ 核心思想：通过显式逻辑规则和符号表示知识，模拟人类逻辑推理（依赖人工定义规则）│ ├─ 典型应用：专家系统（如MYCIN医学诊断系统、DENDRAL化学分析系统）│ └─ 特点：可解释性强；难以处理复杂/模糊/规则不明确的问题│├─ 2. 知识表示与推理│ ├─ 核心思想：用形式化语言（语义网络、本体、谓词逻辑等）表示知识，基于知识推理（演绎/归纳/溯因等）│ ├─ 示例：用“本体”定义“人是动物的子类”，通过逻辑推导“苏格拉底会死”│ └─ 特点：依赖人工定义的知识和推理规则；不涉及数据驱动学习│├─ 3. 行为主义（进化主义）│ ├─ 核心思想：智能通过与环境交互和反馈产生，无需显式知识表示或逻辑推理（接近生物“试错学习”）│ ├─ 典型代表：布鲁克斯“包容架构”机器人（通过“遇障碍物转向”等简单反馈规则实现复杂行为）│ └─ 特点：强调“简单规则+环境交互”；非数据优化复杂模型│├─ 4. 基于规则的自然语言处理（NLP）与计算机视觉（CV）│ ├─ 核心思想：机器学习主导前，依赖人工设计的规则和特征处理任务│ ├─ 具体应用：│ │ ├─ 早期NLP：用句法规则解析句子（如“名词短语=形容词+名词”）、规则翻译法│ │ └─ 早期CV：用手工特征（Sobel算子、霍夫变换）识别简单目标│ └─ 特点：依赖人工设计规则，不依赖数据学习│├─ 5. 规划系统（Planning）│ ├─ 核心思想：从初始状态通过一系列行动到达目标状态（依赖“搜索+逻辑”）│ ├─ 示例：机器人路径规划（避障最优路径）、任务规划（如“做早餐”步骤排序）│ └─ 经典方法：STRIPS系统（定义行动的前提与效果，用A*等算法找最优序列）│└─ 6. 模糊逻辑与不确定性推理├─ 核心思想：用模糊集合表示“模糊/不确定”问题（如“温度有点高”），基于模糊规则推理├─ 典型应用：家电模糊控制（如空调根据“温度偏高”“湿度中等”调节制冷强度）└─ 特点：依赖人工定义的模糊规则和隶属度函数；无需数据学习树状结构通过层级划分，清晰呈现了各分类的从属关系及核心信息，便于快速梳理机器学习之外的人工智能分支逻辑。
一、机器学习算法分类

机器学习（ML，Meachine Learning）是人工智能的核心领域，让计算机从数据中学习规律并做出预测，本文简单介绍机器学习的算法分类和开发流程。

常见的机器学习算法从学习方式上可以分为以下几类：监督学习、无监督学习、半监督学习等其它类型，其中监督学习是指使用带有标签（已标记）的数据集进行训练，模型通过学习输入特征与标签之间的映射关系进行预测或分类，监督学习又可以根据输出是否连续分为分类和回归问题，连续的称为回归，离散的称为分类；而无监督学习则是指处理无标签（未标记）的数据集，模型通过算法自行发现数据中的隐藏结构或模式（如聚类、降维）。

机器学习分类	子类	定义	常见算法	应用场景示例
监督学习	分类	使用带有标签的数据集进行训练模型输出离散数据	k-近邻算法贝叶斯分类决策树逻辑森林逻辑回归 SVM 神经网络	垃圾邮件检测图像识别
监督学习	回归	使用带有标签的数据集进行训练模型输出连续数据	线性回归岭回归随机森林	房价预测销量预测
无监督学习	聚类	聚类算法将数据点分组使得同一组内的数据点相似度高而不同组的数据点相似度低	K-means算法层次聚类	客户分群文档主题分类
无监督学习	降维	减少数据集中的特征数量以简化模型并提高计算效率	主成分分析（PCA）	分析药物主要成分
其它	半监督学习	结合少量标注数据和大量未标注数据进行学习	标签传播半监督SVM	医学图像分析
	自监督学习	通过数据自身的结构生成标签进行训练	Masked Language Model（BERT）对比学习	自然语言处理图像预训练
	强化学习	通过与环境的交互学习最优策略以最大化长期奖励	Q-Learning 深度Q网络（DQN）策略梯度	游戏AI 机器人控制自动驾驶
	深度学习	多层神经网络自动提取特征可应用于监督/无监督/强化学习	CNN RNN	图像识别文本生成

二、机器学习开发流程

以监督学习为例，但核心步骤适用于所有机器学习任务

2.1 步骤1-问题定义

核心目标：将模糊的业务需求转化为可量化的机器学习任务。

关键操作	说明	案例
确定任务类型	分类/回归/聚类？	用户流失预测 → 二分类任务
定义成功指标	选择与业务目标一致的评估指标	欺诈检测 → 高召回率（宁错杀不放过）推荐系统 → 精确率
约束条件分析	时延要求、可解释性需求、计算资源限制	医疗诊断 → 需要可解释性（选择决策树而非神经网络）
可行性评估	数据是否足够？特征是否可获取？	使用数据矩阵草图验证特征覆盖率

常见陷阱：

将回归问题错误定义为分类问题（如将销售额预测转为"高/中/低"三分类）
忽略业务成本（如信用卡欺诈中误判好客户的代价）

2.2 步骤2-数据收集

数据类型	获取方式	预处理难点
结构化数据	SQL查询、数据仓库导出	处理缺失值
文本数据	API抓取、日志解析	分词、去停用词
图像数据	爬虫、公开数据集	尺寸归一化
时序数据	IoT传感器、用户行为日志	处理时间漂移

2.3 步骤3-数据预处理

核心目标：将原始数据转化为信息密度更高的特征。

2.3.1 数据清洗

缺失值处理策略：

方法	适用场景
删除样本	缺失率<5%且随机缺失
中位数/众数填充	数值型/分类型特征
模型预测填充	高价值数据且缺失有模式
增加缺失标志位	缺失本身包含信息

2.3.2 特征工程

特征变换技巧：

数值特征：对数变换（右偏分布）、Box-Cox变换
时间特征：提取"小时/星期几/是否节假日"
文本特征：TF-IDF、Word2Vec嵌入
组合特征：用户年龄 × 商品价格（交互效应）

降维策略对比：

方法	保留信息	可解释性	线性假设	适用场景
PCA	全局结构	低	需要	图像预处理
t-SNE	局部结构	中	不需要	高维数据可视化
LDA	类别区分	高	需要	分类任务特征压缩
自编码器	非线性	低	不需要	复杂数据表示学习

2.3.3 数据分割

把处理好的数据按一定比例划分训练集、测试集、验证集。

2.4 步骤4-模型选择与训练

简单算法选型决策树：

scikit-learn的算法选择决策：

计算优化技巧：

使用GPU加速（CUDA）
分布式训练（如Spark MLlib）
增量学习（partial_fit）处理超大数据

2.5 步骤5-模型评估

评估指标全景图：

分类任务：
   ┌─宏观指标──准确率(Accuracy)
   ├─类别平衡─┤
   │          └─F1-score(F1)
   │
   ├─概率评估─AUC-ROC曲线
   │
   └─业务对齐─精确率(Precision)/召回率(Recall)权衡

回归任务：
   ├─绝对误差─MAE(平均绝对误差)
   ├─放大异常─MSE(均方误差)
   └─比例解释─R²(决定系数)

典型问题诊断:

准确率高但AUC低 → 模型无区分力
验证集表现远差于训练集 → 过拟合
某些类别召回率极低 → 样本不平衡

2.6 步骤6-模型调优

调优方法对比：

方法	搜索效率	并行性	适用空间大小	代码实现
网格搜索	低	高	小(<10维)	GridSearchCV
随机搜索	中	高	中(<100维)	RandomizedSearchCV
贝叶斯优化	高	低	大	BayesianOptimization
遗传算法	中	高	极大	TPOT

调优黄金法则：

先粗调（大范围随机搜索）
再精调（小范围贝叶斯优化）
最终确认需在测试集上只评估一次。

2.7 步骤7-模型部署与监控

简单的部署架构示例：

用户请求 → API网关 → 预测微服务 → 模型缓存 
                     ↓
             监控系统（Prometheus）
                     ↓
             日志分析 → 模型性能仪表盘

监控关键指标:

预测分布变化（PSI群体稳定性指数）
特征漂移检测（KL散度）
业务指标关联性（如推荐系统CTR变化）

可参考的迭代触发机制：

监控警报规则：
   - PSI > 0.25 → 严重漂移
   - 精度下降 > 15% → 需要重新训练
   - 新数据量 > 10倍原始数据 → 自动触发增量训练

模型版本管理参考:

使用MLflow/DVC跟踪实验
A/B测试流量分配（10%新模型 vs 90%旧模型）

动态流程调整：

分享到：