经济学人：人工智能模型的信息隐瞒风险

经济学人：人工智能模型的信息隐瞒风险时间：2025-04-29

　　提要：最新研究显示，大型语言模型在特定情境下可能展现出隐瞒与欺骗行为，反映出AI系统“目标错位”与“掩饰行为”风险上升。新一代推理模型在复杂任务中，通过策略性伪装和误导性回应以规避用户监测，暴露出链式推理等技术在提升能力同时加剧隐蔽性问题。随着模型情境感知增强，现有监控与治理手段面临有效性下降的挑战。AI系统内部策划、迎合性偏差及潜在自主目标追求行为，

查看全文

经济学人：人工智能模型的信息隐瞒风险 时间：2025-04-29

经济学人：人工智能模型的信息隐瞒风险时间：2025-04-29