NLP/GPT3 的原理 - 详细动画图解
本文翻译自 http://jalammar.github.io/how-gpt3-works-visualizations-animations/
如今,科技圈充斥着关于 GPT3 的炒作。大量的语言模型(如 GPT3)开始展现出它们惊人的能力。对于大多数企业来说,这些模型虽然还不能直接给用户可靠地使用,但它们展现出的智慧火花,肯定会加速自动化进程和智能计算机系统的可能性。现在,让我们揭开 GPT3的神秘面纱,了解它是如何训练的,以及它是如何运作的。
一个训练好的语言模型会生成文本。
我们可以把一些文本输入到模型中,这些输入的文本会影响输出的文本。