夏然|我国算法歧视的类型、根源及协同治理路径探究(4)
2023-05-21 来源:飞速影视
2.算法的范畴化分析趋向
依据上文分析,若数据本身即存在偏见,则算法决策结果一定具有歧视性。除此之外,算法对获取数据进行分析的范畴化趋向也是导致算法歧视的根源。“范畴化倾向是人们为了在一个复杂多变、充满不确定性的世界中能更好生存而发展出来的一种思维模式。我们依据‘最少努力’原则对事件进行归类,因为新刺激或新体验总是要被纳入旧范畴,我们才知道应该如何应对。”算法对数据的分析过程,也类似于人类的此种思维模式。算法所获取的数据的数量或种类一定是远远少于现实数据的。在获取数据以后,算法会对其进行分类归纳。在面对新数据时,算法更倾向于对那些特征明显、要素占比多的数据进行分析归纳,而将一些占比较少且边界模糊的数据直接认定为错误数据,或将其归入已经分好类的类似数据群中。长此以往,虽然决策的效率大大提升,但那些特殊的数据被算法范畴化定义或忽略,难以获得进一步精确分析,使得支撑算法分析的数据多样性减少,最终直接影响了算法决策的个性化实现。
而对个性化的忽视意味着算法分析的决策结果将与一些少数现实数据的真实情况存在偏差,这也就可以解释为什么人们在日常生活中收到的一些广告推送与和他们年龄相仿、浏览内容相似的群体推送的内容相同,但有些广告并不是群体中的所有人都感兴趣的。其次,数据的真实与可靠性影响着算法决策结果正当性的实现。若所分析的数据之中存在造假、失效等瑕疵,数据也会导致决策依据的偏差,不仅影响数据被范畴化的定义,也造成算法对数据产生误解,最终可能出现歧视性结果。
3.算法内部黑箱的自主化运行
前文论述了算法的自主型运行模式,而其背后的成因在于“相比于传统的机器学习通过特征提取、判定进行推理得出结果的程式,算法深度学习是通过剖析事物原始特性进行归纳总结之后得出的结果,是一种更为高级的认知方式。”这种深度学习方式,使得算法内部对数据的分析产生了开发者无法掌握与理解的认知,开发者既无法控制其运行过程,也无法向外界对此进行解释。目前,这种认知机制的隐蔽性仍无法通过科技手段进行化解。这种“机器学习算法可以基于大数据的自我训练、自我学习过程完成参数调整与模型构建,也即完成算法的自我生产过程。”而由于算法获取的数据具有动态性,再加之内部的既存歧视使得算法在自主化运行过程中产生了某种开发者或决策者已难以预测或控制的决策结果。“正如在智能投顾领域,没有人能够清楚了解机器人是否‘作恶’,更无法控制机器人以防止‘作恶’行为的产生”,导致算法的某种决策结果可能就隐藏着算法既存歧视的外在表达,继而算法的隐形歧视出现。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号