标签:模型

浙大开源“最懂Excel的GPT”!首次将结构化数据作为独立模态训练,刷榜提升40百分点

明敏 发自 凹非寺量子位 | 公众号 QbitAI大模型理解复杂表格,能力再次飞升了! 不仅能在不规则表格中精准找到相关信息,还能直接进行计算。 比如提问: 如果...
阅读原文

o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%

一水 发自 凹非寺量子位 | 公众号 QbitAI让大模型集体吃瘪,数学题正确率通通不到2%! 获大神卡帕西力荐,大模型新数学基准来势汹汹—— 一出手,曾在国际数学...
阅读原文

陶哲轩和Karpathy推荐的数学测试,让全体LLM的数学几乎得0分:解决率2%

夕小瑶科技说 原创作者 | 小鹿最近,出现了一个数学基准集,让大模型们的数学集体翻车,正确率还不到2%。 就是这家非营利研究机构Epoch AI,它集合了世界最顶...
阅读原文

2024,终会成为直播电商拐点|甲子光年

数字人让直播利润分配回归健康。作者|王艺‍‍‍‍‍‍‍ 编辑|栗子 电商行业发展到今天,拓展了货架电商、社交电商、内容电商、即时零售等不同的路径,而今又以直...
阅读原文

清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手

新智元报道编辑:编辑部 HYZ 【新智元导读】半年两次大融资后,这家具身智能黑马再次获得融资!作为柏睿资本首次投资的具身智能企业,千寻智能不仅拥有出身自...
阅读原文

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

新智元报道编辑:Hjh 【新智元导读】Epoch AI推出数学基准FrontierMath,目前前沿模型测试成功率均低于2%!OpenAI研究科学家Noam Brown说道:「我喜欢看到新...
阅读原文

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

新智元报道编辑:LRST 【新智元导读】上海大学本科生研发的新框架能有效应对知识图谱补全中的灾难性遗忘和少样本学习难题,提升模型在动态环境和数据稀缺场景...
阅读原文

专家模型不要专家并行!微软开源MoE新路径

新智元报道编辑:alan 【新智元导读】近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软...
阅读原文

天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈

整理 | 华卫、核子可乐 近日,有外媒报道称,OpenAI 正在制定新策略,以应对人工智能大模型改进速度放缓的问题。消息一出,知名认知科学家、AI 研究员 Gary M...
阅读原文

过去一年我开发 AI 视频编辑器的收获

作者 | Kirk Kaiser 译者 | Sambodhi 策划 | 褚杏娟 去年,我在一个新岗位上仅工作 6 个月就被解雇了。 我离开了一家很棒的公司和老板,去冒险加入一家初创...
阅读原文

一句话改图!字节豆包通用图像编辑模型 SeedEdit 上线测试

作者 | 褚杏娟 11 月 11 日,字节在豆包大模型团队官网上公布最新通用图像编辑模型 SeedEdit。据悉,SeedEdit 支持一句话轻松改图,包括修图、换装、美化、...
阅读原文

真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验

机器之心原创 作者:泽南、杨文一句话实时P图,网友又能整活了。字节豆包大模型又又又上新了! 11 月 11 日,字节跳动豆包大模型团队推出了最新图像编辑模型 ...
阅读原文

LoRA、完全微调到底有何不同?MIT 21页论文讲明白了

机器之心报道 编辑:陈陈、小舟本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下...
阅读原文

当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

腾讯无问芯穹银河通用的大咖都来了!中国生成式AI大会上海站定档12月,首批嘉宾公布

2024中国生成式AI大会(上海站)12月5-6日举行~ 2024年已行进尾声。对于生成式AI而言,这又是波澜壮阔的一年。 年初Sora的出现,在全球范围内迅速掀起视频生...
阅读原文
189101112483