如何构建可信赖的AI系统
近期,国内外一些人工智能(AI)产品问答内容价值导向错误的新闻频上热搜。随着AI技术的发展,AI的价值导向问题逐渐引发广泛关注,“构建可信赖的AI系统”的呼声越来越高。日前在2024年世界科技与发展论坛期间发布的《2024年人工智能十大前沿技术趋势展望》,就列入了“人机对齐:构建可信赖的AI系统”。2024年世界互联网大会乌镇峰会也聚焦AI,释放清晰信号——拥抱以人为本、智能向善的数字未来。
什么是可信赖的AI系统?构建可信赖的AI系统有哪些路径?记者就以上问题采访了相关专家。
可靠稳定是关键
随着AI在社会生活和各个行业中渗透程度的加深,其决策和行为的影响范围也日益扩大。例如,在医疗、交通、金融等高风险领域,AI系统的决策影响着人们的生命、财产与福祉,一些错误决策可能直接威胁到人类生命或财产安全。康奈尔大学约翰逊商学院讲席教授丛林介绍,AI在金融领域的应用主要包括资产管理、资产回报预测、资产定价等。“我们希望金融领域的AI要准确。我们并不需要它有发散思维或特别有创造力,而是希望它能给我们准确的答案,或是具有一定的稳健性。”他说。
“确保AI系统可信赖,已经成为AI发展不可忽视的要求。这不仅是技术层面的改进,更是社会伦理与责任的体现。”中国科学技术大学人工智能与数据科学学院教授王翔认为,可信赖AI系统不仅能让技术更好地满足人类需求,还能有效防范AI误判和偏见可能引发的负面效应。可信赖的AI系统不但要有优秀的预测、生成、决策等业务能力,而且在透明度、公平性、可解释性、安全性等方面也要符合用户预期。
其中,可解释性是指用户应能够理解AI的行为和决策流程,以便增强用户对AI的信任,并更好地加以利用。公平性要求AI的决策不应受到偏见影响,避免形成对不同群体的歧视。安全性则是指AI系统在运行过程中不会带来安全隐患,并能在一定范围内控制自身行为,特别是在极端或意外情况下要能保护人类安全。“AI系统还需要具备可靠性和稳定性,这要求它的表现在复杂和变化的开发环境中也要始终如一,不轻易受到外部因素干扰。”王翔说。
人机对齐是前提
那么,如何确保AI系统可信赖?王翔认为,人机对齐与构建可信赖的AI系统之间关系密切。“只有具备人机对齐特质的AI系统,才能进一步实现可信赖的特性。”他说。
从概念上看,人机对齐是指确保AI系统在执行任务、进行决策时,其行为、目标和价值观能够与人类保持一致。“这就是说,AI系统在自我优化和执行任务过程中,不仅要高效完成任务,还要符合人类的伦理和价值体系,不能偏离人类设定的目标或带来不良的社会影响。”王翔进一步解释,“尤其是在涉及社会伦理和安全的场景中,确保AI输出内容与人类的价值观和道德准则相符,是人机对齐的核心意义。”
如果AI系统没有经过人机对齐的过程,即使具备强大的功能和智能,也可能因不符合人类的期望和价值观而导致信任危机或负面影响。“因此,确保AI系统在目标和行为上与人类保持一致是构建可信赖AI系统的重要前提。两者的结合不仅能提升AI的表现,还可为未来AI在各领域的广泛应用奠定基础。”王翔说。
确保AI以人为本、智能向善,完善伦理和法律框架是重要发力方向。王翔认为,技术的进步往往伴随着新问题的发生,因此需要设立法律边界和伦理准则,为AI的发展提供指导与约束。这不仅可以减少AI应用中潜在的伦理风险,还能使AI应用更加规范和安全。此外,建设可信赖的AI系统需要跨学科合作,哲学、伦理学、社会学等学科的参与能为AI的设计与发展提供更全面的视角。
技术优化是手段
构建可信赖的AI系统,还需要在技术层面和应用实践中不断探索和完善。王翔介绍了三种主要的技术路径。
一是数据驱动路径。王翔认为,数据质量和多样性是实现可信赖AI的基础。训练数据的多样性可以有效减少模型中的偏见问题,确保系统决策更加公平、全面。“只有在庞大的优质数据基础上构建的AI模型才能适应广泛的应用场景,降低在特殊或极端条件下出现偏见的可能性。”王翔说,数据的安全性也至关重要,尤其是在涉及个人隐私的领域,保障数据安全可以提高用户信任度。
二是算法驱动路径。王翔说,算法的优化与控制是实现可信赖AI的关键手段。在模型的设计阶段,开发者可以通过设置伦理规则、嵌入人类价值观等约束条件,确保系统在实际运行中符合社会准则。同时,设计透明的算法结构有助于提升模型的可解释性,便于用户理解其运行机制,并为未来的模型更新和优化打下基础。
三是奖惩引导路径。王翔说,通过合理设计奖惩机制,可以让AI在不断试错和学习过程中,逐渐形成符合人类价值观的行为方式。例如,可以在奖惩系统中设置反馈机制,当AI的行为偏离预期时施加相应惩罚,引导其在自我训练过程中符合人类期望。同时,奖惩机制需具备时代适应性,确保AI系统能在运行中持续更新并优化自身。
这三种技术路径的侧重点各有不同。王翔解释,数据驱动路径主要聚焦于通过高质量、多样化的数据源减少AI系统的偏见,提升系统的适用性;算法驱动路径更注重模型的设计和透明性,使系统在行为逻辑上更符合人类预期;奖惩引导路径则侧重于在AI自我学习和优化过程中提供有效指引和反馈,让系统逐渐趋向人类认可的方向。“不同路径相结合,可以为实现可信赖的AI提供更加丰富的技术支持。”王翔说。
要构建可信赖的AI系统,还需在实际应用中不断进行迭代和优化。“通过多次评估和测试,可以在不同环境和条件下验证AI系统的性能,确保其在现实应用中的表现符合人类预期。”王翔说。
标签:
抢先读
- 第41次南极考察|记者手记:破浪,向着极南之地——“雪龙2”号穿越“咆哮”西风带二三事
- 如何构建可信赖的AI系统
- 如何构建可信赖的AI系统
- 数智经济催生消费新场景
- 第41次南极考察|记者手记:破浪,向着极南之地——“雪龙2”号穿越“咆哮”西风带二三事
- 我国成功发射四维高景二号03、04星
- 第41次南极考察|记者手记:破浪,向着极南之地——“雪龙2”号穿越“咆哮”西风带二三事
- 科学有意思!10项“严肃又有趣”的科研成果获菠萝科学奖
- 辽宁年底前完成27个大中型灌区新建改造
- 科学有意思!10项“严肃又有趣”的科研成果获菠萝科学奖
- 11月25日央行开展2493亿元7天期逆回购操作
- 广西铝产业开启新“铝”途布局东南亚
- 科技自立自强之院士说|打破学科界限,以科学眼光探索生命系统——访中国科学院院士汤超
- 科技自立自强之院士说|打破学科界限,以科学眼光探索生命系统——访中国科学院院士汤超
- 深圳又一楼盘两小时卖光,二手房已有涨价交易案例
- 11月25日央行开展2493亿元7天期逆回购操作
- 11月25日人民币对美元中间价报7.1918元 上调24个基点
- 关税谈判仍在继续!欧洲议会高官放风:中欧就中国电动汽车进口关税问题接近达成协议
- 11月25日人民币对美元中间价报7.1918元 上调24个基点
- 广西铝产业开启新“铝”途布局东南亚
- 广西铝产业开启新“铝”途布局东南亚
- 北京市足球文化节举行 聚焦“我心中的最佳十一人”
- 国家税务总局:12月1日起全国推广应用“数电发票”
- 全国首单“三北”工程绿色保险在内蒙古签发
- 11月25日央行开展2493亿元7天期逆回购操作
- 国家税务总局:12月1日起全国推广应用“数电发票”
- 广东台山“菜花”上市 市民尝鲜正当时
- 深圳又一楼盘两小时卖光,二手房已有涨价交易案例
- 全球唯一!宁波舟山港诞生“双千万箱级单体集装箱码头”
- 全球唯一!宁波舟山港诞生“双千万箱级单体集装箱码头”
- 干支联动拥江达海 安徽向海而兴助开放
- “网”见峰会 | 透过乌镇峰会 看“互联网之光”
- “网”见峰会 | 透过乌镇峰会 看“互联网之光”
- 广西与泰国开展橡胶木原材料储备基地合作 产业前景广
- 填充物假!合格证假!假羽绒服你的孩子可能也在穿
- (乡村行·看振兴)山西山阴:农业盛会激发乡村振兴新动力
- 免签“朋友圈”再扩大!中国目的地搜索热度暴涨
- 专家:全球牛肉“牛市”行情未来可期
- 重庆国际人才交流大会签约引进紧缺优秀人才3925名
- 专家:全球牛肉“牛市”行情未来可期
- 新疆将首次开行贯通南疆东疆“复兴号”动车
- 第24届两岸财经论坛在福建平潭举办
- (乡村行·看振兴)山西山阴:农业盛会激发乡村振兴新动力
- “羽绒骗局”曝光:儿童羽绒服也造假,检测报告成本一两元钱
- “羽绒骗局”曝光:儿童羽绒服也造假,检测报告成本一两元钱
- 专家:全球牛肉“牛市”行情未来可期
- 国家外汇管理局发布十月银行结售汇数据
- 起底甲醛治理市场诚信缺失:商家制造焦虑,假检测假清除
- 起底甲醛治理市场诚信缺失:商家制造焦虑,假检测假清除
- 驻马店市驿城区蚁蜂镇:文明创建增和谐 家校同心助成长
- 聚信任 慧沟通 助成长——西平县柏苑王店小学召开家长会
- 离职后公积金封存了怎么全额提取?离职6年了公积金还能取吗?
- 国家外汇管理局发布十月银行结售汇数据
- 电子社保卡带来哪些新服务(深阅读)
- 青春风吹进中国养老院:晚年生活变得有意思起来
- 外卖骑手“开挂”抢单 激烈竞争催生灰产
- 外卖骑手“开挂”抢单 激烈竞争催生灰产
- 亚洲杯预选赛中国男篮迎两连胜,下场再战日本队
- 零封张本智和,王楚钦WTT总决赛三连冠
- 我国手机闲置量将达60亿部 旧手机流通如何更放心
- 免签“朋友圈”再扩大!中国目的地搜索热度暴涨
- 免签“朋友圈”再扩大!中国目的地搜索热度暴涨
- 我国手机闲置量将达60亿部 旧手机流通如何更放心
- 我国手机闲置量将达60亿部 旧手机流通如何更放心
- 波兰肖邦音乐大学合唱团开启2024中国巡演
- 以烟火生活对抗虚无 茅奖作家乔叶推出散文集《要爱具体的人》
- 以烟火生活对抗虚无 茅奖作家乔叶推出散文集《要爱具体的人》
- 少儿奇幻冒险小说“怪物大师”系列12年卖出2000多万册
- 少儿奇幻冒险小说“怪物大师”系列12年卖出2000多万册
- 波兰肖邦音乐大学合唱团开启2024中国巡演
- 波兰肖邦音乐大学合唱团开启2024中国巡演
- “艺苑撷英”2024年全国优秀青年杂技人才展演在京举办
- “艺苑撷英”2024年全国优秀青年杂技人才展演在京举办
- “艺苑撷英”2024年全国优秀青年杂技人才展演在京举办
- 程派第三代传人张梓溪将携《锁麟囊》登北展剧场
- 程派第三代传人张梓溪将携《锁麟囊》登北展剧场
- 波兰肖邦音乐大学合唱团开启2024中国巡演
- “艺苑撷英”2024年全国优秀青年杂技人才展演在京举办
- 少儿奇幻冒险小说“怪物大师”系列12年卖出2000多万册
- 当孙悟空说起法语时
- 古典文学研究学者叶嘉莹逝世 享年100岁
- 少儿奇幻冒险小说“怪物大师”系列12年卖出2000多万册
- 古典文学研究学者叶嘉莹逝世 享年100岁
- 香港教大以“育才弘教 立德树人”为主题庆祝校庆30周年
- 香港教大以“育才弘教 立德树人”为主题庆祝校庆30周年
- 登广告吁救台湾教育 区桂芝指现行课纲绑架所有师生
- 中新教育丨教育部印发《中小学校园食品安全和膳食经费管理工作指引》
- 创新驱动发展新引擎,爱尔眼科荣膺“2024年度国民信赖十大健康品牌”奖
- 教育部印发《中小学校园食品安全和膳食经费管理工作指引》
- 登广告吁救台湾教育 区桂芝指现行课纲绑架所有师生
- 孩子过敏性鼻炎,如何缓解?丨时令节气与健康
- 2024 世界职业技术教育发展大会:技能之光照亮国际合作与创新之路
- 国家医保局已印发17批医疗服务价格项目立项指南 涉及收费编码609个
- 国家医保局已印发17批医疗服务价格项目立项指南 涉及收费编码609个
- 第十二届全国少数民族传统体育运动会:龙舟盛景中的文化传承与激情竞渡
- 孩子过敏性鼻炎,如何缓解?丨时令节气与健康
- 第十二届全国少数民族传统体育运动会:龙舟盛景中的文化传承与激情竞渡
- 2024横店马拉松鸣枪开跑 在电影的历史长卷里“狂飙”
- 2024横店马拉松鸣枪开跑 在电影的历史长卷里“狂飙”
- 热舞嘉年华、企业运动联赛 上海闹市商圈商旅文体融合拉动经济