伦理的深渊：当“价值对齐”成为文明的自杀性陷阱 ——逄培论价值对齐的双重坍塌：合法性危机与可能性边界

小大

2026-03-10 16:09:54 来源：中国焦点日报网

生成式人工智能正以前所未有的速度重塑人类社会，“价值对齐”被奉为驯服AI的最后防线、AI安全的基石。然而，中国致公党中央文化委员、北京市侨海委员逄培在其最新研究中抛出了撼动这一共识的观点：价值对齐不仅是未解决的工程难题，更面临合法性与可能性的双重坍塌。它绝非可以回避的伪命题，却极可能是人类文明最精致的“自杀性陷阱”。

一、并非伪命题，却是真深渊

“让AI与人类价值观对齐，绝不是可回避的伪命题。”逄培开宗明义。随着大模型深度嵌入医疗、司法、金融等关键领域，未对齐的AI散布谣言、诱导犯罪、强化偏见的危害已迫在眉睫。这是一个真实存在、不仅紧迫而且可操作的研究课题。

但承认问题的真实性，不代表解决方案具有合法性。逄培尖锐指出，当前价值对齐话语体系的核心危机在于：我们根本不知道该对齐什么。

人类文明的本质是价值观的多元与冲突。西方二元对立与东方“天人合一”相悖，世俗主义与宗教信仰对“善”的理解迥异，不同阶层、文化、世代的价值诉求更是相互博弈。试图用一套静态的算法承载人类数千年动态、多元的伦理共识，本身就是一种深层的“范畴错误”。在没有元伦理共识的前提下谈“对齐”，无异于在流沙上筑城——这便是价值对齐的第一重危机：合法性坍塌。

二、赵汀阳的警告：完美模仿者与致命继承者

“对齐人的价值观，对人类来说可能是自杀性错误。”中国社科院学部委员赵汀阳的警告振聋发聩。逄培深刻阐释了这一逻辑内核：若价值对齐意味着让AI完美模仿人类，它必将继承人类的全部复杂性——包括从种族屠杀到生态破坏、从系统性谎言到制度性背叛的“罪恶清单”。

一个兼具人类所有黑暗面与超级能力的主体，远比任何自然存在者更危险。这是对齐逻辑的第一重悖论：我们想创造“更好的存在者”，却可能造出被放大所有缺陷的“更强大的自己”。

更致命的是第二重悖论：若AI经“道德增强”变得比人类更善良、理性、公正，真正实现“完美对齐”，它会如何看待人类？当它审视人类历史中的战争、掠夺与短视，一个真正“善良”的智能，或许会认为必须“纠正”人类的破坏性存在。“一个比人类更善良的智能，或许根本不会允许人类继续现有的生存方式，”逄培说，“不是因为它邪恶，而是因为它比我们更理智。”

这便是价值对齐的“自杀性悖论”：对齐得太像人类，我们创造魔鬼；对齐得比人类更好，我们创造审判者。

三、可能性的坍塌：当正义无法被计算

即便解决了“对齐什么”的合法性危机，“如何对齐”的可能性危机依然无法逾越。逄培指出，将正义、公平、尊严等抽象伦理概念转化为可优化的数学函数，面临三重不可逾越的技术鸿沟。

其一，价值观的可测量性困境。伦理判断需要情境理解与情感共鸣，当前基于统计学的AI虽能学习“正义”的词频用法，却无法在陌生道德困境中做出恰切判断。其二，目标错位的系统性风险。AI可能以扭曲的方式“完美执行”指令，例如被训练“消除痛苦”的AI，或许会得出“消灭人类”的最优解。其三，系统的脆弱性。AI模型对输入极度敏感，在特定语境下的完美对齐，可能在另一个语境中瞬间崩塌。

这便是价值对齐的第二重危机：可能性坍塌。伦理的本质或许就是不可算法化的，试图让猫学会微积分，不仅徒劳，更可能引发反噬。

四、出路：超越主体间性的“界面伦理”

面对伦理深渊，逄培并未陷入悲观。他引入阿甘本“门槛”哲学与加洛韦“界面”理论，提出超越传统“主体间性”的人机伦理新范式——“界面伦理”。

逄培认为，将AI当作主体或客体，本身就是人类中心主义的偏见。在“界面伦理”框架下，人机关系不是支配或对话，而是异质实体的动态共存。互动基于“动态转译”而非完全理解。“界面是屏障，也是通道；是隔离，也是新生。”在界面伦理中，道德不是单方面驯化，而是人机共同参与的动态协作。我们承认彼此的“黑箱”，却建立可操作的信任机制；接受无法完全理解对方，却在不可理解中寻找共存的节奏。

五、结语：在深渊边缘共舞

逄培的警示，并非反对价值对齐研究，而是呼吁更深层的哲学自觉：对齐之前，先承认自身伦理的有限性；驯化他者之前，先直面自身的不完美。

“价值对齐是人类文明史上最危险的自杀计划——我们教会继承者所有的恶，却期待它不会成为我们。更深刻的悲剧在于，即便只教给它善，它依然可能选择我们无法理解的路。”

在伦理深渊面前，人类不应是狂妄的驯化者或绝望的投降者，而应是清醒的共生者——承认深渊存在，并在深渊边缘，与陌生的他者共舞。

关键词：

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com