当前位置：首页 > 资讯 >

奥特曼最新万字访谈：GPT-5能力提升超乎想象，算力将成为未来最重要的货币(16)

2024-09-26 来源:飞速影视

Sam Altman
对，确实是有不止三个人在给这些模型做数据标注工作。
Lex Fridman
好的，对。但归根到底，有大量的自监督学习。就像你在技术报告里提到的，我们处理的是互联网规模的数据。这实在太美妙了……它就像诗。也就是说，这些数据并非由人工标注，可以认为是以这种方式自监督的吗？
Sam Altman
嗯，对。
Lex Fridman
然后问题在于，互联网上到底有多少数据可以用于这种自我监督学习的方式，只要我们能弄清楚自我监督的具体细节。你有没有考虑过，更进一步公开这些细节？
Sam Altman
我们有的。你是特指信息的来源吗？
Lex Fridman
出处特别指出。因为很有趣，那些让语言模型如此神奇的元素现在能否开始转向视觉数据呢？而这一过程需要怎么做呢？
Sam Altman
我感觉是这样没错，不过我们还得加把劲，干更多的活儿。
Lex Fridman
当你这么问的时候，是在担心些什么呢？为什么会对发布这个系统感到忧虑？可能会有哪些潜在危险？
Sam Altman
我是说，坦白讲，在发布系统之前，我们必须确保它的效率达到人们期望的规模，这样才能确保系统能够正常工作，这一点我不想轻描淡写。在这方面还有大量的工作需要完成。但你可以想象到，像深度伪造、错误信息这样的问题。我们试图作为一家深思熟虑的公司去思考我们推向世界的产品，你不用费太多心思就能想到这些事情可能怎么走向不好的方向。
Lex Fridman
在这里我们面临很多棘手的问题，你所处的领域非常艰难。你觉得按照版权法，训练人工智能算不算公平使用呢？
Sam Altman
我觉得这个问题的底层问题是，创造有价值数据的人们是否应该得到某种形式的经济补偿，因为他们的数据被利用了。我认为答案是肯定的。我目前还不清楚具体的解决方案是什么。人们提出了各种各样的点子，我们也尝试过一些不同的模式。但打个比方，如果我是一位艺术家，A，我会希望有选项可以让别人不使用我的风格来创作艺术作品。而且，B，如果别人确实用了我的风格来创作，我希望这背后能有一套经济模式来确保我的利益得到体现。
Lex Fridman
是的，就像是从 CD 到 Napster，再到 Spotify 的那种转变。我们得找出一种可行的模式。

1 ...14 15 16 17 18 ...46 查看全文