蚂蚁集团发布AI安全检测平台“蚁鉴2.0”
2023-07-08 08:29:13 来源:数智前线
【资料图】
7月7日,在世界人工智能大会(WAIC)“聚焦·大模型时代AIGC新浪潮—可信AI”论坛举行,蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。
蚁鉴2.0可实现用生成式AI能力检测生成式AI模型,可识别数据安全、内容安全、科技伦理三大类的数百种风险,覆盖表格、文本、图像等多种数据和任务类型。据了解,该产品还入选了本届大会的“镇馆之宝”。
AIGC安全成为当前人工智能研究发展的重要议题。中国科学院院士何积丰在论坛主题演讲中提及,“不能再将人工智能视为简单的技术工作,而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。”
蚂蚁集团同时宣布“蚁鉴2.0”全面开放,面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。
据了解,“蚁鉴2.0”的两项能力,一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类,可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测,并会生成检测报告,帮助大模型更加有针对性地持续优化。
蚂蚁集团大安全事业群技术部总裁李俊奎表示,“生成式大模型是一种‘深黑盒’技术,‘蚁鉴2.0’通过智能博弈对抗技术,模拟黑产以及自动化生成海量测试集,可实现「生成式机器人」对「AIGC生成式模型」的诱导式检测计算,很像一个24小时不眠不休的‘安全黑客’在找茬大模型,从而找到大模型存在的弱点和安全问题所在。这种AI对AI的评测,也是教学相长。好比生成式考官考核生成式运动员,在对抗中双方能力互相提升,进一步提高整个行业的AI安全水位。”
另一项能力是,“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识,通过可视化、逻辑推理、因果推断等技术,从完整性、准确性、稳定性等7个维度及20余项评估指标,对AI系统的解释质量量化分析,帮助用户更清晰验证与优化可解释方案。
此次论坛上,中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起的《AIGC可信倡议》。论坛现场还发布了由中国信通院、清华大学、蚂蚁集团联合编纂的《可信AI技术和应用进展白皮书(2023)》。
关键词:
[责任编辑:xwzkw]
相关阅读
- (2023-07-08)蚂蚁集团发布AI安全检测平台“蚁鉴2.0”
- (2023-07-08)腾讯旗下财付通被罚没近30亿元!
- (2023-07-08)今年“回头率最高”的3条裙子!羊腿袖裙稳占第一,另外2条更显瘦
- (2023-07-08)浙江嘉兴市坚持科技赋能乡村振兴 打造科技特派员“嘉兴模式”
- (2023-07-08)关于200010的一些信息
- (2023-07-08)找准网络文艺创作与传播“门道”
- (2023-07-08)退票难、售后差,演出市场大爆发,为何大麦被骂惨?
- (2023-07-08)浑南区气象台发布雷雨大风蓝色预警信号
- (2023-07-08)山东改革中医药价格和医保政策 加快建设综合改革示范区
- (2023-07-08)查出隐患5000余项 山西完成重大危险源市级交叉检查和省级抽查检查
- (2023-07-08)浙江县域观察:校地合作如何促进农业“U”更多可能?
- (2023-07-08)笔记本电脑能外接显示器吗(笔记本电脑能外接cpu不)
- (2023-07-08)主力复盘:9亿抢筹农业 17亿净流出拓维信息
- (2023-07-08)百润股份上半年利润大增,投资烈酒成果仍未显现
- (2023-07-08)马斯克呼吁停止研发大模型 小冰CEO:可能是在给自己争取时间
- (2023-07-08)这里的鸭子住进了“空调房”
- (2023-07-08)特斯拉上海 1 期电池线停产,或调整电池包自制策略
- (2023-07-08)玻璃概念股龙头一览_玻璃板块股票(7/7)
- (2023-07-08)宿迁市户外运动协会_关于宿迁市户外运动协会介绍
- (2023-07-08)绿豆芽的吃法有哪些? 吃对韭菜炒豆芽,每一口都是极致享受
- (2023-07-08)山西省科学技术厅:落实支持科技创新若干政策
- (2023-07-08)20多万美系豪华SUV开回家 实拍凯迪拉克全新XT4
- (2023-07-08)腾讯云公布AI for Science成果 首次通过AI助力Fast发现2颗快速射电暴
- (2023-07-08)邦彦技术:对于当前股价不是很理想的现状 公司管理层保持持续稳健经营、尽快使业绩提高
- (2023-07-08)《失孤》原型之子被拐案,最新消息!
- (2023-07-08)辽宁省葫芦岛市发布冰雹橙色预警
- (2023-07-08)广州市应急管理局在全国制定首个“五进”地方标准《安全宣传“五进”工作规范》
- (2023-07-08)向“淫秽网盘账号”亮出法治之剑
- (2023-07-08)遂昌召开“三个年”“五大比拼”推进会丨胡刚李锋讲话
- (2023-07-08)莴笋可以炒蛋吗?