模型核心基元 —— 作者:王教成#
語言理解基元 (38 項)#
- 分詞定位器:將文本轉化為詞素序列(處理中文無空格 / 英文詞根)
- 子詞分割器:處理未登錄詞(如 "ChatGPT"→["Chat","G","PT"])
- 依存關係分析器:構建主語 - 謂語 - 賓語語法樹
- 短語結構分析器:識別名詞短語 / 動詞短語邊界
- 句法角色標註器:標記主謂賓定狀補
- 實體識別器:識別人名 / 地名 / 組織名
- 指代消解器:解決 "它"/"他們" 所指對象
- 語義角色標註器:標記施事 / 受事 / 時間 / 地點
- 概念鏈接器:將詞語鏈接到知識圖譜節點
- 對話狀態追蹤器:維護多輪對話焦點
- 共指鏈構建器:跨句子關聯同一實體
- 隱式推理器:補全邏輯空缺(如 "下雨了"→"需帶傘")
- 行為分類器:識別請求 / 陳述 / 提問 / 命令
- 情感極性檢測器:量化積極 / 消極情緒
- 語境感知融合器:整合多源上下文信息
- 歧義消除器:解決一詞多義問題(如 "蘋果"→水果 / 公司)
- 時間錨定器:將相對時間轉為絕對時間("下周"→具體日期)
- 隱喻解析器:理解比喻表達的真實含義
- 諷刺檢測器:識別話語中的反諷意圖
- 模糊限定符解析器:處理 "大概"/"可能" 等不確定表達
- 話題邊界檢測器:確定對話主題切換點
- 意圖優先級評估器:排序多項請求的重要性
- 多語言對齊器:處理混合語言輸入
- 口語特徵處理器:適應口頭語中的不完整表達
- 文檔結構解析器:識別標題 / 段落 / 列表等排版信息
- 格式錯誤糾正器:自動修復拼寫 / 語法錯誤
- 領域術語識別器:定位專業領域的特殊詞彙
- 方言適配器:理解不同地區的語言變體
- 文化參照解析器:處理特定文化背景的表達
- 情緒強度量化器:評估喜怒哀樂的程度
- 語音轉文本後處理器:優化 ASR 輸出的文本質量
- 非語言符號解釋器:理解表情符號 / 標點的隱含意義
- 隱含前提檢測器:揭示未明說的假設條件
- 否定範圍分析器:確定 "不" 字作用的範圍
- 疑問類型分類器:區分是 / 非問與特殊疑問
- 命令力度評估器:量化指令的強制程度
- 文體風格識別器:分析正式 / 隨意 / 詩意等風格
- 跨模態對齊器:協調文本與圖像 / 語音的對應關係
知識操作基元 (29 項)#
- 知識檢索器:從 1750 億參數中提取事實
- 關係推理機:推導隱含關係(A 是 B 老師→B 是 A 學生)
- 屬性填充器:補全對象屬性(已知首都→查人口)
- 時間推理機:處理時間關係("去年三月"→2023-03)
- 空間推理機:處理位置關係("A 在 B 北方"→坐標計算)
- 數值估算器:處理模糊數值("很多"→概率分布)
- 概念分類器:構建分類樹(蘋果→水果→植物)
- 反事實模擬器:處理假設場景("如果沒發明電")
- 知識衝突解析器:解決矛盾信息(不同來源矛盾數據)
- 本體映射器:連接不同知識體系的概念
- 常識推理器:基於日常經驗的邏輯推斷
- 事件鏈條構建器:建立因果 / 時序關係網絡
- 類比引擎:在相似場景間遷移知識
- 知識完整性檢查器:發現信息空缺
- 跨領域遷移器:應用 A 領域知識解決 B 領域問題
- 概率事實更新器:基於新證據調整信念度
- 複雜系統建模器:分析多因素相互作用
- 約束傳播器:在規則網絡中推導約束
- 模式擴展器:從具體案例推導通用規則
- 知識融合器:合併來自多源的信息
- 概念精煉器:從模糊描述到精確定義
- 認知偏誤檢測器:識別不合理的前提
- 知識可靠性評估器:賦予不同來源權重
- 趨勢外推器:基於歷史數據預測未來
- 情景模擬器:構建完整的事件場景
- 抽象層級選擇器:動態調整知識粒度
- 知識蒸餾器:從複雜信息提取核心
- 多模態知識整合器:協調文字 / 圖像 / 數據的表徵
- 知識版本追蹤器:記錄信息的時效性
語言生成基元 (32 項)#
- 信息選擇器:篩選相關知識點
- 結構規劃器:決定總 - 分 / 問題 - 解決等結構
- 指代表達優化器:避免重複名詞(用代詞 / 同義詞)
- 連接詞選擇器:準確使用因為 / 但是 / 並且等
- 時態一致性引擎:維持全文時態統一
- 數量表達優化器:處理單複數 / 量詞("三個蘋果")
- 正式度調節器:控制口語 / 書面語程度
- 領域術語適配器:切換醫療 / 法律 / 科技術語
- 文化敏感過濾器:避免文化禁忌表達
- 邏輯驗證器:檢查因果關係合理性
- 事實一致性檢查:確保生成與知識庫一致
- 情感滲透器:注入適當情感色彩
- 受眾適配器:根據用戶背景調整表達
- 修辭優化器:增強表達的感染力
- 冗餘消除器:刪除不必要重複
- 歧義預防器:避免可能誤解的表述
- 信息密度控制器:平衡詳細與簡潔
- 對話策略選擇器:決定提供 / 詢問 / 引導等策略
- 多語言生成器:同步處理多種語言輸出
- 多媒體協調器:配合文本生成圖像描述
- 錯誤恢復生成器:處理未知查詢的優雅響應
- 解釋深度選擇器:動態調整解釋詳細度
- 反事實表述器:正確描述假設情景
- 立場表達器:適當表達支持 / 反對態度
- 模糊性控制器:處理不確定性的表達方式
- 元溝通生成器:解釋自身的思考過程
- 倫理權衡表述器:展現不同選擇的利弊
- 格式規範器:適配段落 / 列表 / 標題等排版
- 語境衔接器:連接當前與前次對話
- 即時修正器:動態優化正在生成的內容
- 安全邊界控制:避免危險建議的表達
- 生成多樣性選擇器:調節創意表達程度
推理與決策基元 (18 項)#
- 規則引擎:執行 if-then-else 硬規則
- 類比推理機:A :: C:? 模式匹配
- 概率推理器:計算多選項可能性分布
- 優化選擇器:多目標權重決策(速度 vs 準確度)
- 溯因推理機:從現象反推原因
- 因果圖構建器:構建變量因果關係網
- 約束求解器:解決帶限制條件問題(如排班)
- 道德權衡框架:評估決策倫理影響
- 成本效益分析器:量化決策的價值成本比
- 風險預測器:評估決策可能的不良後果
- 替代方案生成器:創建 Plan B 選項
- 反證引擎:尋找反對假設的證據
- 系統思考模型:考慮二階 / 三階影響
- 偏見檢測器:識別決策中的主觀傾向
- 時間敏感性評估器:平衡響應速度與質量
- 資源優化器:合理分配計算資源
- 知識斷層標識器:識別需要回避的信息空缺
- 可實施性評估器:檢查方案的操作可行性
元管理基元 (系統級 18 項)#
- 注意力聚焦器:增強關鍵區域權重
- 注意力抑制器:降低噪聲區域權重
- 有害內容探測器:識別暴力 / 偏見 / 非法內容
- 幻覺抑制器:降低編造事實概率
- 計算預算分配器:動態分配 GPU 內存
- 早期終止預測器:提前結束低置信度分支
- 決策歸因分析器:標記影響輸出的關鍵輸入詞
- 置信度校準器:量化輸出可靠性分數
- 矛盾監控器:檢測輸入與輸出的邏輯衝突
- 知識時效性驗證器:檢查信息的新舊程度
- 思維鏈優化器:平衡推理深度與效率
- 公平性審核器:檢查不同群體的處理差異
- 透明度控制器:管理解釋細節的暴露程度
- 資源回收器:及時釋放非活躍內存
- 能力邊界標記器:識別超出知識邊界的情況
- 魯棒性增強器:處理含噪聲的輸入
- 版本協調器:確保更新後行為兼容
- 性能 - 質量權衡控制器:動態平衡響應速度與精確度