Grok-1是什么
Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最大的开源大语言模型。Grok-1 的开发和训练过程遵循了开源的原则,其权重和网络架构已经公开,基于Apache 2.0许可,允许用户自由地使用、修改和分发,用于个人和商业用途。
Grok-1的官网入口
官方文章介绍:https://x.ai/blog/grok-os GitHub地址:https://github.com/xai-org/grok-1 Hugging Face地址:https://huggingface.co/xai-org/grok-1 模型权重下载:magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents.com%2Fannounce.php&tr=udp%3A%2F%2Ftracker.coppersurfer.tk%3A6969&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2FannounceGrok-1的模型信息
根据xAI官方的模型介绍(https://x.ai/model-card/),Grok-1的信息如下:
项目 详细信息模型细节 Grok-1是一个基于Transformer的自回归模型,预训练用于下一个token预测。该模型通过来自人类和早期Grok-0模型的广泛反馈进行了微调。初始版本的Grok-1具有8192个token的上下文长度,并在2023年11月发布。 预期用途 Grok-1旨在用作Grok聊天机器人背后的引擎,用于包括问答、信息检索、创意写作和编码辅助在内的自然语言处理任务。 局限性 虽然Grok-1在信息处理方面表现出色,但是需要人类审查Grok-1的工作以确保准确性。Grok-1语言模型没有能力独立搜索网络。在Grok中部署时,搜索工具和数据库增强了模型的能力和事实性。即使在访问外部信息源的情况下,模型仍然可能产生幻觉。 训练数据 Grok-1发布版本使用的训练数据来自截至2023年第三季度的互联网和xAI的AI训练人员提供的数据。 评估 Grok-1在一系列推理基准任务和精选的外国数学考试问题上进行了评估。xAI已与早期alpha测试者接触,评估了包括对抗性测试在内的Grok-1版本。xAI正在通过Grok早期访问扩大我们的早期采用者范围,以便进行封闭beta测试。