标签：任务

GPT-4搞不定的图推理，港科大7B模型搞定｜KDD2024

香港科技大学陈诺投稿量子位 | 公众号 QbitAI大模型执行图推理任务，我们是希望大模型仅仅给出结果，还是在给出准确答案的同时，输出详细的推理过程？先来...

阅读原文

AIGC动态

2年前 (2024)

拿下SOTA！最强中文Embedding模型对标OpenAI，技术路线公开

新智元报道编辑：编辑部【新智元导读】国产大模型「日日新 5.0」已经在权威主流评测中鲨疯了。变强的背后原因竟是，来自商汤自研中文Embedding模型——Piccolo...

阅读原文

AIGC动态

2年前 (2024)

大模型在持续学习中的最新进展：综述

来源：专知近年来，基础语言模型（LMs）在自然语言处理（NLP）和计算机视觉（CV）领域取得了显著成就。与传统神经网络模型不同，基础语言模型通过在大量无监...

阅读原文

AIGC动态

2年前 (2024)

偏微分方程有了基础模型：样本需求数量级减少，14项任务表现最佳

机器之心报道编辑：陈萍本文提出的 Poseidon 在样本效率和准确率方面都表现出色。偏微分方程（PDEs）被称为物理学的语言，因为它们可以在广泛的时间 - 空间...

阅读原文

AIGC动态

2年前 (2024)

GPT-4人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强值越高

新智元报道编辑：桃子乔杨【新智元导读】最近，德国研究科学家发表的PANS论文揭示了一个令人担忧的现象：LLM已经涌现出「欺骗能力」，它们可以理解并诱导欺...

阅读原文

AIGC动态

2年前 (2024)

Llama3-8B秒杀700亿巨兽？北大博士生等全新「BoT」框架推理暴涨70倍，24点图形推理一步成神

新智元报道编辑：Aeneas 好困【新智元导读】24点游戏、几何图形、一步将死问题，这些推理密集型任务，难倒了一片大模型，怎么破？北大、UC伯克利、斯坦福研...

阅读原文

AIGC动态

2年前 (2024)

清华系细胞大模型登Nature子刊！能对人类2万基因同时建模，代码已开源

白交发自凹非寺量子位 | 公众号 QbitAI生命科学领域的基础大模型来了！来自清华、百图生科的团队提出的单细胞基础大模型scFoundation，登上Nature Methods...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热大模型论文：大模型都能怎么用？中南大学最新综述：大模型时代的自然语言处理

夕小瑶科技说原创作者 | Axe_越还记得2022年末ChatGPT的横空出世，带来了整个NLP乃至AI领域的震动，随后如LLaMA、ChatGLM、Qwen等类ChatGPT大模型（LLM）开...

阅读原文

AIGC动态

2年前 (2024)

3B模型新SOTA！开源AI让日常调用不同大模型更简单

NEXA AI 投稿量子位 | 公众号 QbitAI大模型，大，能力强，好用！但单一大模型在算力、数据和能耗方面面临巨大的限制，且消耗大量资源。而且目前最强大的模...

阅读原文

AIGC动态

2年前 (2024)

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

Simon Zhai 投稿量子位 | 公众号 QbitAI只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！这种方法得到的模型，已经学会了看图玩扑克、算“...

阅读原文

AIGC动态

2年前 (2024)

LeCun新作：分层世界模型，数据驱动的人型机器人控制

新智元报道编辑：alan 【新智元导读】在复杂的物理世界中，人型机器人的全身控制一直是个难题，现有的强化学习做出的效果有时会比较抽象。近日，LeCun参与的...

阅读原文

AIGC动态

2年前 (2024)

SpaceX 与日本亿万富豪「分手」，dearMoon 环月之旅宣布暂停

dearMoon 环月之旅取消日本亿万富豪前泽友作曾高调宣布自己将乘坐 SpaceX 的星舰，进行一场「环月之旅」。如果顺利飞行，这将是 1972 年美国阿波罗登月计划...

阅读原文

AIGC动态

2年前 (2024)

浅谈大模型 SFT 的实践落地：10 问 10 答

来源｜知乎—周星星地址｜https://zhuanlan.zhihu.com/p/685582706 前言SFT 是“低端”的工作，但它与业务紧密相连。相较于难以实施且多数公司没资源训练的预训...

阅读原文

AIGC动态

2年前 (2024)

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

西风发自凹非寺量子位 | 公众号 QbitAI无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现，包括GPT-4在内的10个大模型，生成达到128k甚至1M上下文长...

阅读原文

AIGC动态

2年前 (2024)

next-token被淘汰！Meta实测「多token」训练方法，推理提速3倍，性能大涨10%+

新智元报道编辑：LRS 【新智元导读】研究人员提出了一种新的大型语言模型训练方法，通过一次性预测多个未来tokens来提高样本效率和模型性能，在代码和自然语...

阅读原文

AIGC动态

2年前 (2024)

1…16 171819 20…48