标签:自我
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
机器之心报道 编辑:Panda让 LLM 在自我进化时也能保持对齐。我们这个世界是不断变化的开放世界。人工智能要在这个世界长久立足,就需要突破许多限制,包括可...
LLM 比之前预想的更像人类,竟也能「三省吾身」
机器之心报道 编辑:Panda子曾经曰过:「见贤思齐焉,见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界,对 AI 来说也同样如此吗? 近日,一个...
整合长期记忆,AI实现自我进化,探索大模型这一可能性
机器之心报道 编辑:Panda、小舟地球上最早的生命证据至少可以追溯到 35 亿年前,而直到大约 25 万到 40 万年前,智人才出现地球上。在这漫长的岁月中,生物...
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%
新智元报道编辑:LRS 【新智元导读】Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方...
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
强化学习让大模型自动纠错,数学、编程性能暴涨,DeepMind新作
机器之心报道 机器之心编辑部无需依赖外部反馈或额外模型,纯纯的自我纠正。自我纠正(Self-correction)是大语言模型 (LLM) 非常重要的能力,但人们发现这种...
强化学习成为OpenAI o1灵魂,速来学习下Self-play增强大模型
在机器学习尤其是强化学习领域,自我博弈(Self-play)是一种非常重要的学习策略。即使 AI 或者智能体没有明确的对手或者没有外部环境提供额外信息,也能通过...
终于有人把大模型的内部一致性和自反馈讲明白了
夕小瑶科技说 原创作者 | 谷雨龙泽 在LLM的研究中,改进LLMs的推理能力和减少幻觉内容一直是诸多研究者为之献祭GPU和头发的重大问题。近日,中国的一群青年才...
ICML2024: 华中科大发现大模型具有自我认知
夕小瑶科技说 原创作者 | 谢年年不知道大家是否记得之前传到沸沸扬扬的Bing的 Sydney事件。 起因是一位网友晒出了其与Bing的聊天记录,其中Bing自述自己名叫S...
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST 【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成...
麻省理工开发一款AI「时光机器」,穿越未来和60岁自己对话,可显著减轻焦虑
夕小瑶科技说 原创作者 | 付奶茶你有没有想象过这样一个场景,穿越到未来,与未来的自己进行一场对话。 现在借助AI,幻想可以照进现实了。 麻省理工学院(MITI...
人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
大语言模型自进化技术综述:概念框架,进化方向,经验获取,经验更新,评估方法,开放问题
我们翻译整理最新论文:大语言模型自我进化技术综述,文末有论文连接。 大型语言模型(LLMs)在各个领域和智能体应用中取得了显著进展。然而,当前从人类或外...
「用 AI 训 AI」这事靠谱吗?
来源:节选自2024 年 Week04业内通讯在大语言模型领域,微调是改进模型的重要步骤。伴随开源模型数量日益增多,针对LLM的微调方法同样在推陈出新。 2024年初...
MATRIX:社会模拟推动大模型价值自对齐,比GPT4更「体贴」
机器之心专栏 机器之心编辑部随着大语言模型(LLMs)在近年来取得显著进展,它们的能力日益增强,进而引发了一个关键的问题:如何确保他们与人类价值观对齐,...