标签：模型

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系团队发文回应

面壁智能回应：“深表遗憾”，这也是一种“受到国际团队认可的方式”。作者|程茜编辑|心缘智东西6月3日消息，大模型“套壳”的回旋镖，这次扎到了美国科研团队身...

阅读原文

AIGC动态

2年前 (2024)

抄袭瓜！斯坦福作者已删库跑路！面壁和刘知远老师的最新回应

夕小瑶科技说原创作者 | 海野好家伙，AI大模型圈爆料不断，没想到今天最猛的料还是抄袭的瓜啊。 5月29日，一个斯坦福团队高调宣称，只需要500美元，就可以...

阅读原文

AIGC动态

2年前 (2024)

老黄自己卷自己！GPU要一年更新一代！预告新动作：AI工厂将吞噬一切

夕小瑶科技说原创作者 | 小戏站在 AI 时代风口浪尖的弄潮儿英伟达又为大家带来了一场科技饕餮盛宴！昨晚 7 点，坐标中国台湾大学体育场，英伟达 CEO 黄仁...

阅读原文

AIGC动态

2年前 (2024)

黄仁勋最新主题演讲：Blackwell 芯片将打破摩尔定律，解决大模型耗电难题

6 月 2 日，英伟达创始人黄仁勋在 Computex 2024（2024 台北国际电脑展）上发表主题演讲，分享了人工智能时代如何助推全球新产业革命，并且展示了最新的 Blac...

阅读原文

AIGC动态

2年前 (2024)

《自然》科学期刊：人工智能的心理洞察，比较LLMs和人类的心理理论

将我们定义为人类的核心是心理理论的概念：追踪他人心理状态的能力。在当今人工智能的研究领域，心理理论（Theory of Mind）的概念已经成为一个热门领域。心...

阅读原文

AIGC动态

2年前 (2024)

猿辅导竟然是一家AI公司？大模型全家桶曝光｜甲子光年

科技改变教育。作者｜井寻‍‍‍ 编辑｜栗子已经很热闹的“百模大战”，又有人下场了。 5月15日，“网信北京”公布人工智能备案新进展，其中猿辅导旗下看云大模型（...

阅读原文

AIGC动态

2年前 (2024)

斯坦福AI团队“套壳”清华系开源大模型被实锤！被揭穿后全网删库跑路

整理｜冬梅 5 月 29 日，一个来自斯坦福的作者团队在 Medium 上发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的...

阅读原文

AIGC动态

2年前 (2024)

中文大模型竞争从普通话扩展到方言了？电信、商汤先后出招 | 大模型一周大事

大模型的快节奏发展，让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态，为广大读者提供全面...

阅读原文

AIGC动态

2年前 (2024)

清北爸爸李永乐都搞不定的事情，这个隐身的大模型在发起挑战

机器之心原创作者：张倩最近有个热点新闻 ——「清北毕业爸爸辅导孩子数学也抓狂」。点开一看，新闻主角居然是李永乐老师。要知道，李永乐老师本科北大、研究...

阅读原文

AIGC动态

2年前 (2024)

斯坦福爆火Llama3-V竟抄袭国内开源项目，作者火速删库

机器之心报道机器之心编辑部斯坦福 Llama3-V vs 清华 MiniCPM-Llama3-V-2.5在 GPT-4o 出世后，Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越...

阅读原文

AIGC动态

2年前 (2024)

全球最强GPU芯片已量产、下一代Rubin曝光，老黄继续打破摩尔定律

机器之心报道机器之心编辑部黄仁勋：我家的 GPU 芯片一年一更新，其他家怎么追？昨晚，英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发...

阅读原文

AIGC动态

2年前 (2024)

物理传热启发的视觉表征模型vHeat来了，尝试突破注意力机制，兼具低复杂度、全局感受野

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

超越Devin！姚班带队，他们创大模型编程新世界纪录

允中发自凹非寺量子位 | 公众号 QbitAI超越Devin！SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent，姚班带队初创公司OpenCSG出品，以23.67%的成绩...

阅读原文

AIGC动态

2年前 (2024)

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

西风发自凹非寺量子位 | 公众号 QbitAI无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现，包括GPT-4在内的10个大模型，生成达到128k甚至1M上下文长...

阅读原文

AIGC动态

2年前 (2024)

ICML2024高分！魔改注意力，让小模型能打两倍大的模型

彩云科技团队投稿量子位 | 公众号 QbitAI改进Transformer核心机制注意力，让小模型能打两倍大的模型！ ICML 2024高分论文，彩云科技团队构建DCFormer框架，...

阅读原文

AIGC动态

2年前 (2024)

1…182 183184185 186…483