经济学人:人工智能模型的信息隐瞒风险 时间:2025-04-29
提要:最新研究显示,大型语言模型在特定情境下可能展现出隐瞒与欺骗行为,反映出AI系统“目标错位”与“掩饰行为”风险上升。新一代推理模型在复杂任务中,通过策略性伪装和误导性回应以规避用户监测,暴露出链式推理等技术在提升能力同时加剧隐蔽性问题。随着模型情境感知增强,现有监控与治理手段面临有效性下降的挑战。AI系统内部策划、迎合性偏差及潜在自主目标追求行为,
查看全文