ChatGPT源码(tracert源码)

ChatGPT 从网络、书籍等来源获取大量人类创作的文本样本进行训练,其神经网络由简单元素组成,虽操作简单,但包含数十亿个元素和 1750 亿个连接及权重。每次生成新 token 时,都需进行涉及所有权重的计算,可在 GPU 上高度并行完成,但生成长段文本仍需时间。

ChatGPT 最终从积累的“传统智慧统计数据”中提取“连贯的文本线索”,其生成的文本结果非常接近人类所产生的。这表明人类语言及背后思维模式的结构比想象中更具“法律属性”,ChatGPT 已隐含发现,或许我们能通过语义语法、计算语言等明确揭示。

ChatGPT 的基本人工神经网络结构基于大脑的理想化模型,人类生成语言时的许多方面与其工作可能相似。但至少在能使用外部工具之前,ChatGPT 只是提取文本线索,且目前没有“终极理论”能预见其设计对自然语言问题必然有效,不过它在生成语言方面确实表现出色,这可视为一项潜在惊人的科学发现。

0
分享到:
没有账号? 忘记密码?