算法推荐的歧视与偏见(2)

2023-05-01 来源:飞速影视
算法歧视溯源:数据解读现实世界的失败
算法一方面以其超强的洞见能力和探索能力不断强化自身权威,同时又以其复杂晦涩的计算进程和“客观中立”的技术外衣拒绝普通个体的质疑,以此塑造个体对于数据算法的信任,重构人类社会的运作规则。然而大量研究指出,算法程序的设计、数据挖掘、数据处理等过程都有可能被悄然嵌入偏见的基因。
首先,我们所生活的世界并非可以完全被量化计算的文化空间。算法的基础是大数据的挖掘和处理,这种实证主义范式以量化的手段理解人类行为和社会现象,通过数学模型的构建推断出不同事物的因果关系和相关关系,个体主观的解读被更加客观的数据处理所取代。然而,将我们所生活的空间完全变成“编码空间”是不现实的,人类社会存在数据无法言说的领域,数字逻辑也无法完全解答个体的行为逻辑。在社会化媒体平台上,算法通过挖掘用户点赞、转发、收藏等数据,来判断用户的信息偏好。但是用户的信息行为及动机是丰富且复杂的,用户转发和收藏某个话题内容不全是出于热爱,可能是出于好奇,也有可能是为了批判而找论据。
其次,样本数据的有限性和可伪造性也进一步影响算法的准确性和公正性。尽管当前已经进入了大数据时代,但是由于各种商业平台的利益竞争、用户隐私的保护规定和技术手段的有限性等因素,加之每时每刻都在产生量级规模的数据,全样本数据的获得并不具备可行性。例如,推特、微博等社交平台基于用户数据保护规定和平台利益,开发人员难以通过官方许可渠道获得最全面的用户数据。与此同时,CNNIC发布的第44次《中国互联网络发展状况统计报告》显示,截至2019年6月,我国网民规模达到8.54亿,互联网普及率达61.2%,仍然有相当一部分人群生活在互联网世界之外,智能算法对于这部分人群的数据“选择性失明”。信息热度数据的可伪造性也为算法准确性带来遮蔽,可人为操纵的点赞量、转发量等虚假流量对于算法规则的欺骗,其带来的推荐结果必然包含误差和偏见。
2019年,央视起底数据流量造假产业,指出在微博上“买热搜”“买流量”的现象,是对影视文娱行业的侵蚀。而这些被买了流量的信息内容在微博的算法推荐机制之下,随即出现在许多网民的主页上,与部分用户的信息偏好相离甚远。
再次,算法在描绘和解释现实世界的同时,也对人类社会的结构型偏见进行了继承。作为人类思维外化的智能算法,在数据选取标准、数据模型的权重设定、语用分析和结果解读等各环节都贯穿着人为因素,因此算法不可避免地会反映设计者对于世界的认识。而当设计者将自身固有的社会成见嵌入规则之中时,智能算法在反映这种偏见的同时,也可能放大歧视倾向。2018年路透社揭露亚马逊公司开发的人工智能招聘系统存在性别歧视,算法在进行简历筛选时,对包含“女性”等词的简历进行降权处理。英国《金融时报》也有文章认为,当前科技行业男性占主导的地位,是导致这种算法偏见的产生的原因。
相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号