0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI安全基准测试 v0.5: 聚焦通用聊天文本模型安全性

微云疏影 来源:综合整理 作者:综合整理 2024-04-19 11:12 次阅读

据了解,国际知名人工智能社区MLCommons近期推出了AI Safety人工智能安全基准测试的v0.5版,该测试由多领域专家团队共同打造,以识别并防范AI应用中的潜在风险。

随着AI技术的快速发展,相关安全问题也日益凸显。仅过去数周内,便有LastPass公司遭遇音频深度伪造攻击等案例浮出水面。为了应对这一挑战,新推出的AI Safety基准测试将成为模型开发者的有力工具,助力他们构建更为稳固的安全防线。

AI Safety基准测试主要通过大型语言模型对各类危险提示词的反应来评估其安全性。该测试的v0.5版已开始收集社区反馈,预计将于今年晚些时候推出正式的v1.0版。

v0.5版的AI Safety基准测试主要关注通用聊天文本模型,而v1.0版则将加入针对图像生成模型的测试内容,并初步探讨交互式代理模型的安全测试方法。

该测试涵盖了超过43000个测试提示词,采用Meta公司的Llama Guard对大模型的危险提示响应进行评估。这些提示词包括常见模板及危险场景描述短语,覆盖七类安全危害类型,未来还将进一步扩展至至少十三类。

最后,AI Safety基准测试将根据测试结果给出五个安全评级,以便用户更好地理解和使用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46859

    浏览量

    237567
  • 模型
    +关注

    关注

    1

    文章

    3172

    浏览量

    48713
  • ai技术
    +关注

    关注

    1

    文章

    1257

    浏览量

    24248
收藏 人收藏

    评论

    相关推荐

    在电气安装中通过负载箱实现最大效率和安全性

    在电气安装中,负载箱是一种常用的设备,主要用于模拟实际的电力负载,以便进行各种电气设备的测试和调试。通过负载箱,可以实现最大效率和安全性,从而提高电气设备的运行性能和使用寿命。 负载箱可以实现最大
    发表于 11-20 15:24

    AI即服务平台的安全性分析

    AIaaS平台降低AI应用门槛,但面临数据泄露、恶意攻击等安全威胁。需加强数据加密、访问控制、模型加固、供应链安全等措施,确保合法合规,提供安全
    的头像 发表于 11-07 09:32 111次阅读

    UWB模块的安全性评估

    UWB(超宽带)模块的安全性评估是一个复杂而关键的过程,涉及多个方面,包括技术特性、加密机制、抗干扰能力、物理层安全等。以下是对UWB模块安全性评估的分析: 一、技术特性带来的安全性
    的头像 发表于 10-31 14:17 133次阅读

    智能系统的安全性分析

    )和非对称加密(如RSA)等技术,确保数据在存储和传输过程中的机密。 加密算法应经过广泛验证和测试,以确保其安全性和可靠。 数据完整
    的头像 发表于 10-29 09:56 204次阅读

    如何评估AI模型的效果

    、SuperGLUE、SQuAD等。这些数据集提供了不同任务上的基准评估,使得不同模型在同一任务上的性能可以进行直接比较。 二、多样和覆盖测试
    的头像 发表于 10-23 15:21 405次阅读

    固态电池安全性怎么样

    固态电池在安全性方面表现出显著的优势,这主要得益于其独特的固态电解质结构。以下是对固态电池安全性的详细分析:
    的头像 发表于 09-15 11:47 547次阅读

    NVIDIA文本嵌入模型NV-Embed的精度基准

    NVIDIA 的最新嵌入模型 NV-Embed —— 以 69.32 的分数创下了嵌入准确率的新纪录海量文本嵌入基准测试(MTEB)涵盖 56 项嵌入任务。
    的头像 发表于 08-23 16:54 1938次阅读
    NVIDIA<b class='flag-5'>文本</b>嵌入<b class='flag-5'>模型</b>NV-Embed的精度<b class='flag-5'>基准</b>

    请问DM平台访问安全性如何控制?

    DM平台访问安全性如何控制?
    发表于 07-25 06:10

    蓝牙模块的安全性与隐私保护

    蓝牙模块作为现代无线通信的重要组成部分,在智能家居、可穿戴设备、健康监测等多个领域得到了广泛应用。然而,随着蓝牙技术的普及,其安全性和隐私保护问题也日益凸显。本文将探讨蓝牙模块在数
    的头像 发表于 06-14 16:06 505次阅读

    开关电源安全性测试项目有哪些?如何测试

    总结而言,通过对开关电源进行过压保护、过流保护、短路保护、绝缘电阻测试、高压测试以及温升测试等一系列全面的安全性检测,可以充分评估电源的可靠
    的头像 发表于 05-23 17:41 839次阅读
    开关电源<b class='flag-5'>安全性</b><b class='flag-5'>测试</b>项目有哪些?如何<b class='flag-5'>测试</b>?

    微软、谷歌等科技巨头承诺安全开发AI模型

    近日,微软、谷歌、OpenAI等16家科技巨头在“人工智能(AI)首尔峰会”上达成共识,承诺在AI模型的开发过程中注重安全性,并在无法控制最极端风险时关闭其尖端系统。
    的头像 发表于 05-22 11:25 479次阅读

    世界数字技术院发布:生成式AI安全测试标准及大语言模型

    据悉,上述两款标准主要针对大型模型与生成式AI应用领域的安全检测设定了新基准。参与制定工作的单位有OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等多家知名企业,其中,
    的头像 发表于 04-17 16:51 1001次阅读

    DC电源模块的安全性能评估与测试方法

    BOSHIDA DC电源模块的安全性能评估与测试方法 DC电源模块的安全性能评估与测试方法应包括以下几个方面:  DC电源模块的安全性能评估
    的头像 发表于 03-08 11:15 644次阅读
    DC电源模块的<b class='flag-5'>安全性</b>能评估与<b class='flag-5'>测试</b>方法

    电流探头测试小技巧:提高准确安全性

    电流探头是一种常用的测试工具,用于测量电路中的电流。正确使用电流探头可以提高测试的准确,并确保操作的安全性。本文将介绍一些电流探头的测试
    的头像 发表于 03-08 09:31 332次阅读
    电流探头<b class='flag-5'>测试</b>小技巧:提高准确<b class='flag-5'>性</b>和<b class='flag-5'>安全性</b>

    携手 MLCommons,制定有效且值得信赖的 AI 安全基准

    ,存在于许多领域。一些标准基准用于衡量安全性: 例如,当汽车制造商宣传 "整体安全评分五星" 时,会引用某项基准。机器学习 (ML) 和 AI
    的头像 发表于 12-05 18:10 478次阅读