行业动态 | GPT总设计师:大型语言模型的未来+ 查看更多
行业动态 | GPT总设计师:大型语言模型的未来
+ 查看更多
发布日期:2023-06-16 10:20
回头来看,ChatGPT的横空出世验证了Ilya Sutskever此前预想的AI发展方向。
他预计,深度学习和大型语言模型会继续发展:这个领域的未来可能会有一小部分重大突破,加之许多细微改进,所有这些都将融入到一个庞大而复杂的工程体系。他还给出了一些有趣、可执行的思想实验。

01
大型语言模型与人类智能
我们想要神经网络拥有“理解”能力,但能做的是优化预测,而这也正是我们目前在做的事。通过优化预测得到了目前的大型语言模型,它们都是用强大的反向传播算法训练的神经网络,由此可以想象,人工神经元和生物神经元并没有太大区别,如果留心观察,我们会发现人脑很擅长猜测下一个单词。
04
专业化训练 vs 通用训练
05
规模化之所以能取得如此迅猛的进展,是因为此前有许多闲置的数据中心资源,可以通过重新分配这些资源实现快速进展。但今后的情况将会有所不同,一方面,建设数据中心需要时间,另一方面,模型训练所需的计算规模和资源变得非常庞大,通过规模化来取得成果不会像以前那么快。