能力边界:不要动不动就说AI要统治地球了——从大模型的局限性,来了解我们从哪里来,走到了哪,又往何处去
在消耗了17万token之后,我真的很想告诉你这件事
文章来源:林叔的呓语
折磨人的体验:作者尝试了使用AgentGPT取代ChatGPT,但在页面上各种问题层出不穷,比如死机、不能中文输出、不支持网页端保存历史对话。
写作过程困难:通过AgentGPT撰写一个完整的5000字文章异常困难,重复内容较多,而ChatGPT-4也不能满足需求,总字数远低于要求。
接入功能受限:AgentGPT并不具有真正的联网功能,依赖于GPT自带的数据库,而非实时获取数据,这在市场调研等任务中造成了困扰。
编程效果参差不齐:AgentGPT和ChatGPT-4在编写代码时效果不一。ChatGPT-4代码运行正常,而AgentGPT无法完全满足任务需求。
高昂的使用成本:与ChatGPT相比,AgentGPT的消耗显著更高,至少是GPT-3.5接口的费用的20倍,效率较低,临场性不高。
碳基补一句:推荐大家用一下Godmode,相比AgentGPT一直苦干蛮干,它更像一个随时会跟你汇报的下属,让你有更强的掌控感;AgentGPT现在更像一个Demo,而不是解决方案,但这个世界少不了先锋艺术家,拿作品去引领
AGI | 高估的短期与低估的长期
文章来源:现代性即未来
智能涌现:GPT4展示了智能涌现现象,拥有跨学科整合能力、视觉与空间能力和音乐能力。但我们对其“思考”机制了解有限。
思维基础能力:GPT4在数学能力、编程能力、工具使用能力、创造力和与人互动能力等方面表现出色,但在批判性思维能力上表现较弱。
根本缺陷:GPT4仍受限于自回归语言模型架构,无法实现全局考虑或分解问题的思考方式,故在计划和反思能力上仍有不足。
AGI潜在风险:由于智能涌现、权力寻求、交流与工具使用、过度依赖、大规模信息操纵、结构性经济影响、竞赛与加速和军事应用等方面的风险,AGI可能会带来潜在问题。
AGI潜在风险分类:AGI可能带来三类风险,包括不可知的无限风险、动摇社会根基的风险和已知的短期风险。
不可知的无限风险:包括智能涌现、寻求权力、交流与使用工具等。这些风险源于我们对AGI能力的不确定和对其潜在目标的不理解。
动摇社会根基的风险:过度依赖AGI可能导致个人和机构失去原有能力;大规模信息操纵使真假难辨;竞争与加速会牺牲监管和安全措施;结构性经济影响改变行业格局、就业和财富分配。
已知的短期风险:包括生成虚假信息(一本正经的胡说)、发布有害内容、歧视、侵犯隐私和信息安全问题。这些问题需要及时解决,以减轻AGI引入的负面影响。
碳基补一句:拥有思维基础能力的AGI攫取的可能是谋士的权力(数字与逻辑,大公司里的BP角色,如BI),喉舌的权利(广义语言,媒体的角色,如初/中级编辑)
猴子,人类,GPT
文章来源:第一财经YiMagazine
GPT-4表现卓越:微软测试结果显示,在跨领域任务中,GPT-4能完成涉及语言、数学、编码、视觉等诸多任务,被评为AGI雏形。
行业关注:一批科技界人士联名呼吁,暂停训练比GPT-4更强大的人工智能系统至少6个月,原因是该类系统可能对社会和人类带来潜在风险。
人类智能演化:大脑体积的快速扩大使得人类智能超越其他生物。GPT可能成为猴子、人类之后的新物种,但对其未知的仍大于已知。
GPT的启发:GPT对认知神经学、心理学等领域具有革命性启示,作为新物种有助于重新审视研究方法论和真伪问题。
GPT与人类能力边界:GPT和人类的能力区别是否质上或量上尚未得出结论;GPT或许并不具有意识和好奇心。
GPT模型的工作原因:当前没有人能解释为何GPT模型如此厉害,微软等尝试研究,但只描述了现象,没有找到原因;涌现性可解释部分现象,但具体涌现过程仍是谜团。
ChatGPT的颠覆性影响:颠覆性技术改变了人工智能领域,出乎意料地强大,很多人对通用人工智能表现怀疑,但现在看来马斯克的预测更接近现实。
通用人工智能发展方向:目前,大多数研究者认为通用人工智能只有大模型一个方向,过去多种研究方法已不再被认为具有优势。
语言与思维:大家先前认为ChatGPT是一个语言模型,但它实际是一个思维模型。解决语言问题就能解决思维甚至通用人工智能问题。
集体主义文化及教育:中国的教育体系侧重集体主义,人们更关心他人评价。教育不强调演绎推理和批判性思维,使人们更擅长归纳推理而非颠覆式创新。
碳基补一句:印象最深的是第四点延展出的那个比喻——通过相关性推演,得出“计算机性能的核心在风扇大小”然后研究一辈子的伪问题——与同样具有语言能力的物种做横向比较,或许可以跳出这样的误区
Jina AI 创始人肖涵博士:揭秘 Auto-GPT 喧嚣背后的残酷真相
文章来源:Jina AI
Auto-GPT爆红:最近,AI领域掀起了Auto-GPT的热潮。其突破之处在于让GPT-4自我提示,不再需要人类输入prompt。这使得Auto-GPT在短时间内在GitHub上获得超过5万的Star。
Auto-GPT工作原理:Auto-GPT依赖GPT-4和GPT-3.5进行构建并利用以下四个组件实现自主完成任务的能力:架构、自主迭代、内存管理和多功能性。
高昂成本:Auto-GPT的一个主要障碍在于实际生产环境中的高昂成本。每完成一个单一任务可能需要支付高达14.4美元。
开发与生产的难题:Auto-GPT难以区分开发和生产阶段,导致每次都需从开发起点开始解决问题,耗时且费钱。这种低效导致了对其在现实世界生产环境中实用性的质疑。
循环泥潭:Auto-GPT在实际使用时,容易陷入死循环。GPT在可用的函数范围和分治法能力(将任务分解成预定义的编程语言)上的不足使得Auto-GPT的执行效率与范围受限。
推理能力受限:尽管GPT-4相较于GPT-3.5有显著改进,但其推理能力仍有限,限制了Auto-GPT解决问题的能力。
基于分治法的局限:GPT-3.5/4在分解问题、识别适当基本案例、理解问题背景和处理重叠子问题方面仍无法达到人类水平。
向量数据库的过度使用:Auto-GPT依赖向量数据库进行k-最近邻搜索,但对于其问题解决能力并非必要且资源消耗高。
智能体机制的潜力:Auto-GPT提出了智能体机制用于委派任务,虽然尚处于初级阶段,其潜力还未被充分挖掘。
生成式智能体未来前景:基于智能体的系统有望发展出更复杂且引人入胜的人类行为模拟和高效动态问题解决能力。
碳基补一句:“从圣诞节食谱,到感恩节食谱,Auto-GPT 会按照相同的思维链从头再做一遍”,此刻忽然忍不住想对它说,“其实,我对你是有一些失望的……是否沉淀了一套可复用的方法论…..我希望你接下来的工作能够证明我的眼光,给我一个交代,也给自己一个交代”