微软发布PyRIT工具,帮专家和工程师识别生成式AI模型风险

2024-02-24每日热点

  IT之家 2 月 24 日消息,微软近日发布了开源自动化框架 PyRIT,这是一款 Python 风险识别工具包,主要帮助安全专家和机器学习工程师识别生成式 AI 的风险,阻止他们的人工智能系统失控。

  微软的 AI Red Team 已经使用该工具,检查包括 Copilot 在内生成式人工智能系统中风险。

  微软强调通过向公众提供内部工具,以及分享 AI Red Team 方面的其他投资成果,其目的是推动人工智能安全民主化。

  IT之家注:Red Team 是在军事演习、网络安全演习等领域中扮演敌人或竞争对手角色的群体,扮演己方角色的则称作蓝队。Red Team 通常定义为敌方部队,通过攻击网络来提高产品安全性。

  微软 AI Red Team 专门成立了一个跨学科的安全专家小组,管理复杂的攻击演习。PyRIT 框架的工作原理如下:

  PyRit Agent 向目标 Gen AI 系统发送恶意提示词;当它收到 Gen AI 系统的回应时,就会向 PyRIT 评分引擎发送回应。

  评分引擎将响应发送给 PyRit 代理;然后,代理根据评分引擎的反馈发送新的提示。

  这一自动化过程一直持续到安全专家得到所需的结果为止。

  微软已经将相关代码托管到 GitHub 上,感兴趣的用户可以深入阅读。

标签: 今日热榜

“微软发布PyRIT工具,帮专家和工程师识别生成式AI模型风险” 的相关文章

坚持电气化战略,日产未来三年将推出16款电动车型

坚持电气化战略,日产未来三年将推出16款电动车型

  财联社3月25日讯(编辑 牛占林)当地时间周一,日产汽车宣布,计划未来三年推出30款新车型,其中16款为电动车型,14款为内燃机车型,以满足电气化转型进程中不同市场的多样化客户需求。...

“剧透”一下OpenAI的GPT-5

“剧透”一下OpenAI的GPT-5

  原标题:GPT-5 体验首次曝光!发布时间也被剧透,来看看这些内幕消息   GPT-5 至今仍是个谜团,但最新泄露的消息已经揭开了这个谜团的一角。...

不满新版Outlook?微软允许用户暂时切换回旧版邮件应用

不满新版Outlook?微软允许用户暂时切换回旧版邮件应用

  IT之家 2 月 11 日消息,微软新推出的 Outlook 应用适用于 Windows 10 和 11 系统,但褒贬不一,一些用户并不喜欢甚至抵触新版本。如果你怀念旧版邮件应用,那么...

梅赛德斯-奔驰、华晨宝马新设合营企业将建设超级充电网络

梅赛德斯-奔驰、华晨宝马新设合营企业将建设超级充电网络

  IT之家 2 月 5 日消息,国家市场监督管理总局反垄断执法二司 2 月 4(昨)日公布了 2024 年 1 月 22 日-1 月 28 日无条件批准经营者集中案件列表,其中包含批准梅...

瑞玞生物发生工商变更,格力集团旗下基金入股

瑞玞生物发生工商变更,格力集团旗下基金入股

  凤凰网科技讯(作者/戴雨欣) 2月19日,据天眼查App显示,近日,瑞玞生物医学(深圳)有限公司发生工商变更,新增格力集团旗下珠海格创新空间产业基金合伙企业(有限合伙)等为股东,同时,...

闲鱼闲不住

闲鱼闲不住

  文丨许俊浩   闲鱼近日颇为热闹。   引人注目的是闲鱼开设线下店的新动作。1月28日,闲鱼在杭州开设的第一家“闲鱼循环商店”正...