标签:模型
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
面壁智能回应:“深表遗憾”,这也是一种“受到国际团队认可的方式”。 作者|程茜 编辑|心缘 智东西6月3日消息,大模型“套壳”的回旋镖,这次扎到了美国科研团队身...
抄袭瓜!斯坦福作者已删库跑路!面壁和刘知远老师的最新回应
夕小瑶科技说 原创作者 | 海野 好家伙,AI大模型圈爆料不断,没想到今天最猛的料还是抄袭的瓜啊。 5月29日,一个斯坦福团队高调宣称,只需要500美元,就可以...
老黄自己卷自己!GPU要一年更新一代!预告新动作:AI工厂将吞噬一切
夕小瑶科技说 原创作者 | 小戏 站在 AI 时代风口浪尖的弄潮儿英伟达又为大家带来了一场科技饕餮盛宴! 昨晚 7 点,坐标中国台湾大学体育场,英伟达 CEO 黄仁...
黄仁勋最新主题演讲:Blackwell 芯片将打破摩尔定律,解决大模型耗电难题
6 月 2 日,英伟达创始人黄仁勋在 Computex 2024(2024 台北国际电脑展)上发表主题演讲,分享了人工智能时代如何助推全球新产业革命,并且展示了最新的 Blac...
《自然》科学期刊:人工智能的心理洞察,比较LLMs和人类的心理理论
将我们定义为人类的核心是心理理论的概念:追踪他人心理状态的能力。 在当今人工智能的研究领域,心理理论(Theory of Mind)的概念已经成为一个热门领域。心...
猿辅导竟然是一家AI公司?大模型全家桶曝光|甲子光年
科技改变教育。作者|井寻 编辑|栗子 已经很热闹的“百模大战”,又有人下场了。 5月15日,“网信北京”公布人工智能备案新进展,其中猿辅导旗下看云大模型(...
斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路
整理|冬梅 5 月 29 日,一个来自斯坦福的作者团队在 Medium 上发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的...
中文大模型竞争从普通话扩展到方言了?电信、商汤先后出招 | 大模型一周大事
大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面...
全球最强GPU芯片已量产、下一代Rubin曝光,老黄继续打破摩尔定律
机器之心报道 机器之心编辑部黄仁勋:我家的 GPU 芯片一年一更新,其他家怎么追?昨晚,英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发...
物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
清北爸爸李永乐都搞不定的事情,这个隐身的大模型在发起挑战
机器之心原创 作者:张倩最近有个热点新闻 ——「清北毕业爸爸辅导孩子数学也抓狂」。点开一看,新闻主角居然是李永乐老师。要知道,李永乐老师本科北大、研究...
斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
机器之心报道 机器之心编辑部斯坦福 Llama3-V vs 清华 MiniCPM-Llama3-V-2.5在 GPT-4o 出世后,Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越...
超越Devin!姚班带队,他们创大模型编程新世界纪录
允中 发自 凹非寺量子位 | 公众号 QbitAI超越Devin!SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩...
英伟达新研究:上下文长度虚标严重,32K性能合格的都不多
西风 发自 凹非寺量子位 | 公众号 QbitAI无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长...
ICML2024高分!魔改注意力,让小模型能打两倍大的模型
彩云科技团队 投稿量子位 | 公众号 QbitAI改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,...