标签:模型
今日arXiv最热大模型论文:港大&微软发布AgentGen提高大模型规划能力,8B模型接近GPT-4水平
夕小瑶科技说 原创作者 | Richard在大语言模型(LLM)问世之后,基于 LLM 的 Agent 引起了广泛的关注并且变得越来越流行。规划能力无论对人类还是 Agent 都是...
模型小,还高效!港大最新推荐系统EasyRec:零样本文本推荐能力超越OpenAI、Bert
新智元报道编辑:LRST 【新智元导读】EasyRec利用语言模型的语义理解能力和协同过滤技术,提升了在零样本学习场景下的推荐性能。通过整合用户和物品的文本描...
GPT-5降临,代号猎户座?OpenAI疑用草莓训练,数学推理暴涨超越所有模型
新智元报道编辑:Aeneas 好困 【新智元导读】OpenAI又憋大招了!据悉,下一代旗舰模型GPT-5或名为「猎户座」,由「草莓」合成的数据训练。而草莓具有极强的复...
GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也趴!
新智元报道编辑:桃子 好困 【新智元导读】LLM若以每秒1000+token高速推理,当前最先进的GPU根本无法实现!Cerebras Inference一出世,推理速度赶超英伟达GPU...
KDD 2024大奖出炉!孟瑜获杰出博士论文奖,时间检验奖颁给微软亚研院
新智元报道编辑:编辑部 【新智元导读】今天,KDD 2024大奖结果新鲜出炉!华人学者收获颇丰,浙大校友Jundong Li获新星奖,博士论文奖的冠亚军均有华人学者上...
Llama-3不算真开源:今年10月,权威定义就要来了
机器之心报道 编辑:泽南、佳琪你给翻译翻译,什么是开源?开源大模型的标杆 Llama 3,居然都「被闭源」了。今天,开源再次成为了人们讨论的话题。 如今,开...
「草莓」即将上线,OpenAI新旗舰大模型曝光,代号「猎户座」
机器之心报道 编辑:小舟、陈陈ChatGPT 要进化了?本月初,OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片,勾起了大家强烈的好奇心。「四个红草莓...
上海交大洪亮教授:AI 真要突破工程领域,一定要做到现有人类专家做不到的工程成果
作者:洪亮 编辑:李姝,李宝珠 在 AI for Bioengineering 暑期学校活动中,上海交通大学洪亮教授以「AI 走进生活和科学」为题,围绕 AI 在当下的生活、科学...
a16z投资,两个月400万用户,华人AI产品席卷Discord
Viggle AI 这家以其同名视频生成服务而闻名的初创公司,近日宣布完成 1900 万美元的早期投资,其中Andreessen Horowitz 领投。 Viggle 公司的创始人兼 CEO Ch...
大厂围堵AI创业:Google出来创业的,挨个被大厂买走了
前谷歌员工出走创立的 AI 公司,正在一个个被大科技公司收购。 据这两天的消息,法国 AI 初创公司 H(原名 Holistic),刚获得了 2.2 亿美元的种子轮融资,就...
大模型量化技术原理:FP8
生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI...
放弃Scaling Law!中科院、清北提出内生复杂性类脑网络:让AI像人脑一样“小而强”
想象一下,如果人工智能(AI)模型能像人脑一样,规模小,耗能少,但具备同样复杂功能,那现阶段 AI 模型训练的耗能大、难理解的瓶颈是不是就能解决了? 中国...
图灵奖得主Yann LeCun不看好强化学习:「我确实更喜欢 MPC」
来源:机器之心 编辑:张倩、小舟五十多年前的理论还值得再研究一下?「相比于强化学习(RL),我确实更喜欢模型预测控制(MPC)。至少从 2016 年起,我就一...
又一家国产厂商的大模型API官宣免费!还能免费微调,囤卡的哭了
夕小瑶科技说 原创作者 | 夕小瑶编辑部 “你们为啥囤卡啊?你们又不训大模型底座...”“因为我们要微调啊”去年我跟一个创业的朋友聊起来,他们还没有产品,就已...
真香!智谱大模型,有了首个免费的API
机器之心报道 机器之心编辑部大模型API,正式进入Flash时代。最近一段时间,国内外的大模型行业卷的是「快速版」。 5 月谷歌 I/O 大会上,新发布的 Gemini 1....