人工智能已经渗透到我们的日常生活中,从视频平台的推荐算法到药物研发,无处不在,且对我们的生活产生着深远的影响。然而,人工智能真的能够做到公平吗?答案是否定的,绝对不是。
界定“公平的人工智能”并不容易。一个较为合理的定义是:在社会歧视影响下的特定任务中,如果某个人工智能模型能够输出不依赖于敏感性参数的结果,那么可以认为这个模型具有一定的公平性。
本文将探讨人工智能偏见的问题,结合一些真实案例,分析其成因及应对策略。
问题的根源
人工智能偏见主要源于训练数据中固有的不公,这种偏见会引发社会歧视,削弱平等的机会。例如,假设我们开发一个根据地理位置评估信用的模型,由于某些种族群体集中在特定地区,模型可能会对这些群体产生偏见,从而影响他们申请信用卡或贷款的成功率。这样的偏见不仅不公,还会加剧社会不平等。
真实案例分析
一个典型例子是美国法院采用的COMPAS系统,用于评估被告人再次犯罪的风险。由于训练数据偏差严重,该系统对黑人罪犯的假阳性率是白人罪犯的两倍。2014年,亚马逊开发了一套招聘人工智能系统,意在简化面试流程,但研究发现它歧视女性,原因在于训练数据反映了过去十年的偏见——那个时期科技行业中男性占据主导地位。最终,亚马逊在2018年放弃了该系统。
在医疗领域,人工智能模型被用来评估不同人群的疾病风险,但数据显示,模型对黑人患者的诊断风险低于实际情况,这是因为模型优化了成本,忽视了黑人群体的实际健康状况。此外,2019年,Facebook允许广告商根据种族、性别和宗教定向广告,这导致某些职业广告(如护士、秘书)主要面向女性,而警察、司机等职业广告则偏向男性,特别是有色人种男性。同期,房地产广告也表现出偏向白人的趋势,点击率较高的广告多为白人用户。
再比如,2020年9月,Twitter用户发现其图像裁剪算法偏爱白人面孔。当发布的图片宽高比例不同,算法会自动裁剪图像。尤其是在多个人脸的照片中,算法更倾向于显示白人面孔,而忽略黑人面孔的部分内容。[[[IMG_1]]] [[[IMG_2]]] [[[IMG_3]]]
这些例子只是冰山一角。无论开发者是否意识到,很多人工智能系统中都存在着明显的不公平现象。
如何应对偏见问题?
迈向公平人工智能的第一步是承认问题的存在。人工智能不是完美的,训练数据、算法和技术都有其局限性。忽视这些问题,只会使偏见持续存在,难以解决。
其次,要反思某些任务是否真的需要依赖人工智能。有些问题,例如判断被告人再犯可能性,更多依赖于情感和判断,而非纯粹的数据分析。
第三,践行负责任的人工智能原则。具体包括:
- 采用以人为中心的设计方法:在模型设计阶段,融入信息披露和用户反馈,确保透明度和可理解性。
- 设定多指标评价体系:结合不同标准(如假阳性率、假阴性率、用户反馈)来全面评估模型表现,认识到优化某一指标可能影响其他指标。
- 审查原始数据:确保训练数据的代表性和公平性,避免偏差传导到模型中。
- 理解模型局限:认识到模型所反映的仅是相关性,不能轻易推断因果关系。例如,购买篮球鞋的人通常较高,但这并不意味着购买者会变得更高。
- 进行严格测试:通过单元测试和场景模拟,发现潜在问题。
- 持续监控与更新:模型部署后,关注用户反馈,定期优化维护。
- 设计公平包容的模型:咨询伦理、社会科学专家,确保模型兼顾多样性和公平性。
- 使用代表性数据:采集多样化样本,评估数据中的偏见或歧视性关联。
- 识别偏差:通过不同背景测评,检测模型在不同人群中的表现差异。
- 性能分析:在不同指标间权衡,避免优化一项指标而牺牲另一项的表现。
工具与实践支持
目前,已有多种工具帮助开发者实现公平性目标。例如,IBM的AIFairness 360是一个开源工具包,旨在检测和减少模型中的偏见。谷歌提供的ML Fairness Gym,则用于探索人工智能偏见的长期影响。微软的FATE平台结合了公平性、责任和透明度的评估工具,帮助权衡模型的系统性能与公平性。
近年来,越来越多的企业和政府机构开始关注人工智能中的偏见问题,开发了多种评估工具,并积极寻求解决方案。虽然人工智能具有巨大潜力,但我们必须时刻警惕其可能带来的歧视风险,推动公平、包容的智能系统发展。
