模型核心基元 - 波动几何

模型核心基元 —— 作者：王教成#

语言理解基元 (38 项)#

分词定位器：将文本转化为词素序列（处理中文无空格 / 英文词根）
子词分割器：处理未登录词（如 "ChatGPT"→["Chat","G","PT"]）
依存关系分析器：构建主语 - 谓语 - 宾语语法树
短语结构分析器：识别名词短语 / 动词短语边界
句法角色标注器：标记主谓宾定状补
实体识别器：识别人名 / 地名 / 组织名
指代消解器：解决 "它"/"他们" 所指对象
语义角色标注器：标记施事 / 受事 / 时间 / 地点
概念链接器：将词语链接到知识图谱节点
对话状态追踪器：维护多轮对话焦点
共指链构建器：跨句子关联同一实体
隐式推理器：补全逻辑空缺（如 "下雨了"→"需带伞"）
行为分类器：识别请求 / 陈述 / 提问 / 命令
情感极性检测器：量化积极 / 消极情绪
语境感知融合器：整合多源上下文信息
歧义消除器：解决一词多义问题（如 "苹果"→水果 / 公司）
时间锚定器：将相对时间转为绝对时间（"下周"→具体日期）
隐喻解析器：理解比喻表达的真实含义
讽刺检测器：识别话语中的反讽意图
模糊限定符解析器：处理 "大概"/"可能" 等不确定表达
话题边界检测器：确定对话主题切换点
意图优先级评估器：排序多项请求的重要性
多语言对齐器：处理混合语言输入
口语特征处理器：适应口头语中的不完整表达
文档结构解析器：识别标题 / 段落 / 列表等排版信息
格式错误纠正器：自动修复拼写 / 语法错误
领域术语识别器：定位专业领域的特殊词汇
方言适应器：理解不同地区的语言变体
文化参照解析器：处理特定文化背景的表达
情绪强度量化器：评估喜怒哀乐的程度
语音转文本后处理器：优化 ASR 输出的文本质量
非语言符号解释器：理解表情符号 / 标点的隐含意义
隐含前提检测器：揭示未明说的假设条件
否定范围分析器：确定 "不" 字作用的范围
疑问类型分类器：区分是 / 非问与特殊疑问
命令力度评估器：量化指令的强制程度
文体风格识别器：分析正式 / 随意 / 诗意等风格
跨模态对齐器：协调文本与图像 / 语音的对应关系

知识操作基元 (29 项)#

知识检索器：从 1750 亿参数中提取事实
关系推理机：推导隐含关系（A 是 B 老师→B 是 A 学生）
属性填充器：补全对象属性（已知首都→查人口）
时间推理机：处理时间关系（"去年三月"→2023-03）
空间推理机：处理位置关系（"A 在 B 北方"→坐标计算）
数值估算器：处理模糊数值（"很多"→概率分布）
概念分类器：构建分类树（苹果→水果→植物）
反事实模拟器：处理假设场景（"如果没发明电"）
知识冲突解析器：解决矛盾信息（不同来源矛盾数据）
本体映射器：连接不同知识体系的概念
常识推理器：基于日常经验的逻辑推断
事件链条构建器：建立因果 / 时序关系网络
类比引擎：在相似场景间迁移知识
知识完整性检查器：发现信息空缺
跨领域迁移器：应用 A 领域知识解决 B 领域问题
概率事实更新器：基于新证据调整信念度
复杂系统建模器：分析多因素相互作用
约束传播器：在规则网络中推导约束
模式扩展器：从具体案例推导通用规则
知识融合器：合并来自多源的信息
概念精炼器：从模糊描述到精确定义
认知偏误检测器：识别不合理的前提
知识可靠性评估器：赋予不同来源权重
趋势外推器：基于历史数据预测未来
情景模拟器：构建完整的事件场景
抽象层级选择器：动态调整知识粒度
知识蒸馏器：从复杂信息提取核心
多模态知识整合器：协调文字 / 图像 / 数据的表征
知识版本追踪器：记录信息的时效性

语言生成基元 (32 项)#

信息选择器：筛选相关知识点
结构规划器：决定总 - 分 / 问题 - 解决等结构
指代表达优化器：避免重复名词（用代词 / 同义词）
连接词选择器：准确使用因为 / 但是 / 并且等
时态一致性引擎：维持全文时态统一
数量表达优化器：处理单复数 / 量词（"三个苹果"）
正式度调节器：控制口语 / 书面语程度
领域术语适配器：切换医疗 / 法律 / 科技术语
文化敏感过滤器：避免文化禁忌表达
逻辑验证器：检查因果关系合理性
事实一致性检查：确保生成与知识库一致
情感渗透器：注入适当情感色彩
受众适配器：根据用户背景调整表达
修辞优化器：增强表达的感染力
冗余消除器：删除不必要重复
歧义预防器：避免可能误解的表述
信息密度控制器：平衡详细与简洁
对话策略选择器：决定提供 / 询问 / 引导等策略
多语言生成器：同步处理多种语言输出
多媒体协调器：配合文本生成图像描述
错误恢复生成器：处理未知查询的优雅响应
解释深度选择器：动态调整解释详细度
反事实表述器：正确描述假设情景
立场表达器：适当表达支持 / 反对态度
模糊性控制器：处理不确定性的表达方式
元沟通生成器：解释自身的思考过程
伦理权衡表述器：展现不同选择的利弊
格式规范器：适配段落 / 列表 / 标题等排版
语境衔接器：连接当前与前次对话
即时修正器：动态优化正在生成的内容
安全边界控制：避免危险建议的表达
生成多样性选择器：调节创意表达程度

推理与决策基元 (18 项)#

规则引擎：执行 if-then-else 硬规则
类比推理机：A :: C:? 模式匹配
概率推理器：计算多选项可能性分布
优化选择器：多目标权重决策（速度 vs 准确度）
溯因推理机：从现象反推原因
因果图构建器：构建变量因果关系网
约束求解器：解决带限制条件问题（如排班）
道德权衡框架：评估决策伦理影响
成本效益分析器：量化决策的价值成本比
风险预测器：评估决策可能的不良后果
替代方案生成器：创建 Plan B 选项
反证引擎：寻找反对假设的证据
系统思考模型：考虑二阶 / 三阶影响
偏见检测器：识别决策中的主观倾向
时间敏感性评估器：平衡响应速度与质量
资源优化器：合理分配计算资源
知识断层标识器：识别需要回避的信息空缺
可实施性评估器：检查方案的操作可行性

元管理基元 (系统级 18 项)#

注意力聚焦器：增强关键区域权重
注意力抑制器：降低噪声区域权重
有害内容探测器：识别暴力 / 偏见 / 非法内容
幻觉抑制器：降低编造事实概率
计算预算分配器：动态分配 GPU 内存
早期终止预测器：提前结束低置信度分支
决策归因分析器：标记影响输出的关键输入词
置信度校准器：量化输出可靠性分数
矛盾监控器：检测输入与输出的逻辑冲突
知识时效性验证器：检查信息的新旧程度
思维链优化器：平衡推理深度与效率
公平性审核器：检查不同群体的处理差异
透明度控制器：管理解释细节的暴露程度
资源回收器：及时释放非活跃内存
能力边界标记器：识别超出知识边界的情况
鲁棒性增强器：处理含噪声的输入
版本协调器：确保更新后行为兼容
性能 - 质量权衡控制器：动态平衡响应速度与精确度