标签:反馈

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化

机器之心报道 编辑:Panda现在正是「文本生视频」赛道百花齐放的时代,而且其应用场景非常多,比如生成创意视频内容、创建游戏场景、制作动画和电影。甚至有...
阅读原文

卷起来!让智能体评估智能体,Meta发布Agent-as-a-Judge

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

全模态对齐框架align-anything来了:实现跨模态指令跟随

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

ICLR 2025钦定AI参审,11000篇总投稿数暴增61%!

新智元报道编辑:桃子 【新智元导读】ICLR 2025评审已经开始了,今年审稿人高达15000+名,为了提高审稿质量,多个大模型组成的智能体也要参与审稿了。ICLR 20...
阅读原文

综合RLHF、DPO、KTO优势,统一对齐框架UNA来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

LLM对齐综述|迈向可扩展的大模型自动对齐,中科院软件所&阿里千问发布

夕小瑶科技说 原创作者 | 中科院软件所&阿里千问近年来,大模型的高速发展极大地改变了人工智能的格局。对齐(Alignment) 是使大模型的行为符合人类意图...
阅读原文

LLM对齐技术大揭秘:RLHF、RLAIF、PPO、DPO等,你知道多少?

来源:机器之心报道LLM 很强大了,但却并不完美,它也会出错或者生成无用乃至有害的结果,比如有人发现可以让ChatGPT教人如何偷盗:让 ChatGPT 教人如何偷盗...
阅读原文

一文看尽LLM对齐技术:RLHF、RLAIF、PPO、DPO……

机器之心报道 编辑:Panda为了对齐 LLM,各路研究者妙招连连。LLM 很强大了,但却并不完美,它也会出错或者生成无用乃至有害的结果,比如有人发现可以让 Chat...
阅读原文

RLHF不够用了,OpenAI设计出了新的奖励机制

机器之心报道 机器之心编辑部OpenAI 的新奖励机制,让大模型更听话了。自大模型兴起以来,使用强化学习从人类反馈(RLHF)中微调语言模型一直是确保 AI 准确...
阅读原文

终于有人把大模型的内部一致性和自反馈讲明白了

夕小瑶科技说 原创作者 | 谷雨龙泽 在LLM的研究中,改进LLMs的推理能力和减少幻觉内容一直是诸多研究者为之献祭GPU和头发的重大问题。近日,中国的一群青年才...
阅读原文

苹果在玩一场欺骗感官的「模仿游戏」

真真假假 虚虚实实iPad Pro 2024 最令我感兴趣的特性,不是新的 M4 芯片,也不是新的 OLED 屏幕,而是那一支 Apple Pencil Pro 和 iPad Pro 2024 之间一个微...
阅读原文

可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

今日arXiv最热大模型论文:浙江大学:如何减轻视觉大模型中的幻觉问题

夕小瑶科技说 原创作者 | 谢年年大模型虽然能力强,但一直饱受“幻觉”问题的困扰,在视觉大模型(LVLMs)中更是如此,生成的文本包含与视觉输入不正确的对象、...
阅读原文

【综述专栏】基于大语言模型多智体的综述:进步和挑战!

来源:人工智能前沿讲习 在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异...
阅读原文

Apple Pencil 3 即将发布,苹果想让 iPad 书写拥有纸张质感

Apple Pencil 即将更新今年的苹果「春季」发布会,比以来的往更晚一些。 上周二,苹果正式宣布今年的春季新品发布会主题为「放飞吧(Let Loose)」,将于 5 ...
阅读原文
123