模型核心基元 —— 作者:王教成#
语言理解基元 (38 项)#
- 分词定位器:将文本转化为词素序列(处理中文无空格 / 英文词根)
- 子词分割器:处理未登录词(如 "ChatGPT"→["Chat","G","PT"])
- 依存关系分析器:构建主语 - 谓语 - 宾语语法树
- 短语结构分析器:识别名词短语 / 动词短语边界
- 句法角色标注器:标记主谓宾定状补
- 实体识别器:识别人名 / 地名 / 组织名
- 指代消解器:解决 "它"/"他们" 所指对象
- 语义角色标注器:标记施事 / 受事 / 时间 / 地点
- 概念链接器:将词语链接到知识图谱节点
- 对话状态追踪器:维护多轮对话焦点
- 共指链构建器:跨句子关联同一实体
- 隐式推理器:补全逻辑空缺(如 "下雨了"→"需带伞")
- 行为分类器:识别请求 / 陈述 / 提问 / 命令
- 情感极性检测器:量化积极 / 消极情绪
- 语境感知融合器:整合多源上下文信息
- 歧义消除器:解决一词多义问题(如 "苹果"→水果 / 公司)
- 时间锚定器:将相对时间转为绝对时间("下周"→具体日期)
- 隐喻解析器:理解比喻表达的真实含义
- 讽刺检测器:识别话语中的反讽意图
- 模糊限定符解析器:处理 "大概"/"可能" 等不确定表达
- 话题边界检测器:确定对话主题切换点
- 意图优先级评估器:排序多项请求的重要性
- 多语言对齐器:处理混合语言输入
- 口语特征处理器:适应口头语中的不完整表达
- 文档结构解析器:识别标题 / 段落 / 列表等排版信息
- 格式错误纠正器:自动修复拼写 / 语法错误
- 领域术语识别器:定位专业领域的特殊词汇
- 方言适应器:理解不同地区的语言变体
- 文化参照解析器:处理特定文化背景的表达
- 情绪强度量化器:评估喜怒哀乐的程度
- 语音转文本后处理器:优化 ASR 输出的文本质量
- 非语言符号解释器:理解表情符号 / 标点的隐含意义
- 隐含前提检测器:揭示未明说的假设条件
- 否定范围分析器:确定 "不" 字作用的范围
- 疑问类型分类器:区分是 / 非问与特殊疑问
- 命令力度评估器:量化指令的强制程度
- 文体风格识别器:分析正式 / 随意 / 诗意等风格
- 跨模态对齐器:协调文本与图像 / 语音的对应关系
知识操作基元 (29 项)#
- 知识检索器:从 1750 亿参数中提取事实
- 关系推理机:推导隐含关系(A 是 B 老师→B 是 A 学生)
- 属性填充器:补全对象属性(已知首都→查人口)
- 时间推理机:处理时间关系("去年三月"→2023-03)
- 空间推理机:处理位置关系("A 在 B 北方"→坐标计算)
- 数值估算器:处理模糊数值("很多"→概率分布)
- 概念分类器:构建分类树(苹果→水果→植物)
- 反事实模拟器:处理假设场景("如果没发明电")
- 知识冲突解析器:解决矛盾信息(不同来源矛盾数据)
- 本体映射器:连接不同知识体系的概念
- 常识推理器:基于日常经验的逻辑推断
- 事件链条构建器:建立因果 / 时序关系网络
- 类比引擎:在相似场景间迁移知识
- 知识完整性检查器:发现信息空缺
- 跨领域迁移器:应用 A 领域知识解决 B 领域问题
- 概率事实更新器:基于新证据调整信念度
- 复杂系统建模器:分析多因素相互作用
- 约束传播器:在规则网络中推导约束
- 模式扩展器:从具体案例推导通用规则
- 知识融合器:合并来自多源的信息
- 概念精炼器:从模糊描述到精确定义
- 认知偏误检测器:识别不合理的前提
- 知识可靠性评估器:赋予不同来源权重
- 趋势外推器:基于历史数据预测未来
- 情景模拟器:构建完整的事件场景
- 抽象层级选择器:动态调整知识粒度
- 知识蒸馏器:从复杂信息提取核心
- 多模态知识整合器:协调文字 / 图像 / 数据的表征
- 知识版本追踪器:记录信息的时效性
语言生成基元 (32 项)#
- 信息选择器:筛选相关知识点
- 结构规划器:决定总 - 分 / 问题 - 解决等结构
- 指代表达优化器:避免重复名词(用代词 / 同义词)
- 连接词选择器:准确使用因为 / 但是 / 并且等
- 时态一致性引擎:维持全文时态统一
- 数量表达优化器:处理单复数 / 量词("三个苹果")
- 正式度调节器:控制口语 / 书面语程度
- 领域术语适配器:切换医疗 / 法律 / 科技术语
- 文化敏感过滤器:避免文化禁忌表达
- 逻辑验证器:检查因果关系合理性
- 事实一致性检查:确保生成与知识库一致
- 情感渗透器:注入适当情感色彩
- 受众适配器:根据用户背景调整表达
- 修辞优化器:增强表达的感染力
- 冗余消除器:删除不必要重复
- 歧义预防器:避免可能误解的表述
- 信息密度控制器:平衡详细与简洁
- 对话策略选择器:决定提供 / 询问 / 引导等策略
- 多语言生成器:同步处理多种语言输出
- 多媒体协调器:配合文本生成图像描述
- 错误恢复生成器:处理未知查询的优雅响应
- 解释深度选择器:动态调整解释详细度
- 反事实表述器:正确描述假设情景
- 立场表达器:适当表达支持 / 反对态度
- 模糊性控制器:处理不确定性的表达方式
- 元沟通生成器:解释自身的思考过程
- 伦理权衡表述器:展现不同选择的利弊
- 格式规范器:适配段落 / 列表 / 标题等排版
- 语境衔接器:连接当前与前次对话
- 即时修正器:动态优化正在生成的内容
- 安全边界控制:避免危险建议的表达
- 生成多样性选择器:调节创意表达程度
推理与决策基元 (18 项)#
- 规则引擎:执行 if-then-else 硬规则
- 类比推理机:A :: C:? 模式匹配
- 概率推理器:计算多选项可能性分布
- 优化选择器:多目标权重决策(速度 vs 准确度)
- 溯因推理机:从现象反推原因
- 因果图构建器:构建变量因果关系网
- 约束求解器:解决带限制条件问题(如排班)
- 道德权衡框架:评估决策伦理影响
- 成本效益分析器:量化决策的价值成本比
- 风险预测器:评估决策可能的不良后果
- 替代方案生成器:创建 Plan B 选项
- 反证引擎:寻找反对假设的证据
- 系统思考模型:考虑二阶 / 三阶影响
- 偏见检测器:识别决策中的主观倾向
- 时间敏感性评估器:平衡响应速度与质量
- 资源优化器:合理分配计算资源
- 知识断层标识器:识别需要回避的信息空缺
- 可实施性评估器:检查方案的操作可行性
元管理基元 (系统级 18 项)#
- 注意力聚焦器:增强关键区域权重
- 注意力抑制器:降低噪声区域权重
- 有害内容探测器:识别暴力 / 偏见 / 非法内容
- 幻觉抑制器:降低编造事实概率
- 计算预算分配器:动态分配 GPU 内存
- 早期终止预测器:提前结束低置信度分支
- 决策归因分析器:标记影响输出的关键输入词
- 置信度校准器:量化输出可靠性分数
- 矛盾监控器:检测输入与输出的逻辑冲突
- 知识时效性验证器:检查信息的新旧程度
- 思维链优化器:平衡推理深度与效率
- 公平性审核器:检查不同群体的处理差异
- 透明度控制器:管理解释细节的暴露程度
- 资源回收器:及时释放非活跃内存
- 能力边界标记器:识别超出知识边界的情况
- 鲁棒性增强器:处理含噪声的输入
- 版本协调器:确保更新后行为兼容
- 性能 - 质量权衡控制器:动态平衡响应速度与精确度