绿盟科技等公布“一种基于距离的多智能体深度强化学习隐蔽后门攻击方法”专利

绿盟科技等公布“一种基于距离的多智能体深度强化学习隐蔽后门攻击方法”专利
天眼查APP显示,近日,华东师范大学,绿盟科技集团股份有限公司申请的“一种基于距离的多智能体深度强化学习隐蔽后门攻击方法”专利公布。 摘要显示,本发明提出了一种基于距离的多智能体深度强化学习隐蔽后门攻击方法,属于人工智能安全领域。所述方法通过精心选取后门距离阈值触发器,在训练过程中在特定时刻修改智能体的动作与奖励值,并使用修改后的后门数据来诱导智能体学习后门策略。实现了在不需要修改环境状态与智能体观测的条件下植入后门。在后门未触发时,智能体执行正常的策略。在后门触发后,智能体执行后门策略从而导致模型任务失败。克服了现有后门攻击方法必须通过修改环境或智能体观测来植入后门的局限性。

评论