描述
二、生成式 AI 的伴生风险
2.数据偏向导致数据“驯服”,会生成偏见信息出现双标立场。人工智能的生成内容是基于对大量互联网语料的汲取学习,不可避免的会出现人类社会的固有偏见、刻板印象等问题。这些问题既源于人类数据和知识所蕴含的偏见和歧视,也源于语言模型开发者故意或无意的行为,如算法逻辑的偏见和数据的有偏选择等。[1]ChatGPT 的算法逻辑存在明显的数据“驯服”问题,如果大部分用户都有某种倾向性、一致性观点,它就会倾向于用某种观点来回答以迎合用户。由此,受到数据分布、算法逻辑偏差的影响,生成式 AI 不可能“理性、中立、客观”,而是“天然”带有优势数据信息和算法逻辑的立场观点,出现政治偏见、性别偏见、种族偏见、职业偏见、历史偏见、文化和地域偏见、经济和商业偏见等偏见歧视。