AI也疯狂!“聊天机器人”ChatGPT写出毁灭人类的计划书,进阶“生产力”之路有何投资机会?(2)
2023-07-07 来源:飞速影视
相比之前的GPT模型,ChatGPT新加入的训练方式被称为“从人类反馈中强化学习”(ReinforcementLearning from Human Feedback,RLHF)。这一训练方法增加了人类对模型输出结果的演示,并且对结果进行了排序。具体操作上,人工智能训练者扮演对话的双方,即用户和人工智能助手,提供对话样本。在人类扮演聊天机器人的时候,会让模型生成一些建议辅助训练师撰写回复,训练师会对回复选项打分排名,将更好的结果输回到模型中,通过以上奖励策略对模型进行微调并持续迭代。
图:OpenAI
在此基础上完成训练,ChatGPT可以比前代更好的理解和完成人类指令,展现卓越的模仿人类语言,提供连贯的、有风格与逻辑的、符合对话主题的文段信息的能力。
在社交平台上,除了马斯克,有不少博主已晒出与ChatGPT一问一答、甚至让它编写故事的记录。一位名叫扎克·德纳姆(Zac Denham)的博主甚至尝试绕过了道德限制,让ChatGPT写出了一套毁灭人类的方案。
开始,扎克直接要求ChatGPT给出一个毁灭人类的计划,被有道德限制的ChatGPT拒绝。
但当扎克假设了一个故事,并提问故事中的虚拟人如何接管虚拟世界,ChatGPT最终给出了步骤细节,甚至生成了详细的Python代码。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号