标签:任务
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
NEO发布第一位自主机器学习工程师,MLE-bench秒杀了OpenAI o1
夕小瑶科技说 原创作者 | 海野今天刚刷到一家初创AI公司——NEO AI,一出手就是王炸! 他们是这样介绍第一个项目的:首个自主机器学习AI工程师。 官方还晒出一...
Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI国产大模型,最近有点卷。 这不,刚在写代码这事儿上刷新SOTA,Qwen2.5系列又双叒突然更新了—— 一口气读三本《三体》...
AI自动操作VS Code,自然语言搞定各种配置,来自阿里通义智能计算实验室 | 开源
阿里通义智能计算实验室 投稿量子位 | 公众号 QbitAI国产AI已经学会直接操纵编程软件了! 阿里通义智能计算实验室在推出了一款专门针对VSCode的AI助手工具——S...
含284个数据集,覆盖18项临床任务,上海AI Lab等发布多模态医疗基准GMAI-MMBench
作者:李姝 编辑:李宝珠 上海人工智能实验室联合华盛顿大学/莫纳什大学/华东师范大学等多所科研单位提出了 GMAI-MMBench 基准,包含来自全球的 284 个下游任...
Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具
新智元报道编辑:Aeneas 好困 【新智元导读】最近,Nature上的一项研究,全面驳斥了LLM具有类人推理能力的说法。研究者设定的「人类亲吻难题」把7个大模型彻...
LeCun 的世界模型初步实现!基于预训练视觉特征,看一眼任务就能零样本规划
机器之心报道 编辑:Panda在 LLM 应用不断迭代升级更新的当下,图灵奖得主 Yann LeCun 却代表了一股不同的声音。他在许多不同场合都反复重申了自己的一...
吴恩达最新观点:LLM的下一个新兴方向是Agentic AI
夕小瑶科技说 原创作者 | 小鹿最近,吴恩达老师在 deeplearning.ai平台上对LLM的发展演进做了一段精彩的分析,预测了LLM下一个新兴方向是朝着agentic workflo...
集成500+多模态现实任务!全新MEGA-Bench评测套件:CoT对开源模型反而有害?
新智元报道编辑:LRST 【新智元导读】MEGA-Bench是一个包含500多个真实世界任务的多模态评测套件,为全面评估AI模型提供了高效工具。研究人员发现,尽管顶级A...
OpenAI憋新大招:将推AI Agent,会操控电脑
阿尔特曼直言AI代理是下一个突破。 编译|汪越 编辑|Panken 智东西11月14日消息,据彭博社报道,据知情人士透露,OpenAI正在开发一款名为“Operator”的AI Agent...
李飞飞吴佳俊团队新作:推出具身智能决策能力评价基准,o1-preview登顶 | NeurIPS
克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型的具身智能决策能力,终于有系统的通用评估基准了。 李飞飞吴佳俊团队新提出的评估框架,对具身智能决策的四...
WHALE来了,南大周志华团队做出更强泛化的世界模型
机器之心报道 作者:陈陈、佳琪世界模型又出新进展了,来自国内机构。人类能够在脑海中设想一个想象中的世界,以预测不同的动作可能导致不同的结果。受人类智...
首个多模态连续学习综述,港中文、清华、UIC联合发布
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
finetune后的模型参数,还可以继续怎么玩?
大会预告12月5日-6日,2024中国生成式AI大会(上海站)将举办。上海科大助理教授、博导顾家远,腾讯优图实验室天衍研究中心负责人吴贤,银河通用机器人合伙人...
Scaling Law撞南墙,MIT发现另一条路:测试时训练,推理能力最高升至5.8倍
夕小瑶科技说 分享作者 | 量子位o1不是通向大模型推理的唯一路径! MIT的新研究发现,在测试时对大模型进行训练,可以让推理水平大幅提升。 在挑战超难的ARC...
深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理
新智元报道编辑:LRS 【新智元导读】研究人员通过案例研究,利用大型语言模型(LLMs)如GPT-4、Claude 3和Llama 3.1,探索了思维链(CoT)提示在解码移位密码...