标签:阶段

B站轻量级大语言模型index-1.9B深入解析

直播预告 |「智猩猩AIGC视频生成公开课 魔珐科技专场」正式开讲啦~8月13日晚7点开讲,魔珐科技市场负责人李韵将直播讲解《AIGC时代,企业级视频生成的挑战与...
阅读原文

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

机器之心报道 机器之心编辑部偷懒才能更好地工作。Llama 3.1 刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的 8B 版本可...
阅读原文

LLama 405B 技术报告解读

9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
阅读原文

减轻幻觉新SOTA,7B模型自迭代训练效果超越GPT-4,上海AI lab发布

夕小瑶科技说 原创作者 | 谢年年 LLMs在回答各种复杂问题时,有时会“胡言乱语”,产生所谓的幻觉。解决这一问题的初始步骤就是创建高质量幻觉数据集训练模型以...
阅读原文

无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

聊聊大模型推理中的分离式推理

原文:https://zhuanlan.zhihu.com/p/706469785 一开始本文叫做“聊聊大模型推理中的存储优化”的,但是发布之后感觉还是要叫分离式推理更好,虽然我本来是想写...
阅读原文

月之暗面kimi底层推理系统方案揭秘

7月2日晚七点,「NVIDIA 机器人技术公开课」正式开讲,NVIDIA解决方案架构总监舒家明将以《NVIDIA Isaac 加速机器人3D视觉感知与机械臂轨迹规划》为主题进行...
阅读原文

整理了AI创业必刷的700篇论文、400个产品和400条融资新闻,打包下载!

之前我们向大家介绍了奇绩创坛创业营,不少小伙伴有疑问现在是否还能申请。 这两天小编也和奇绩的朋友沟通了一下:创业营申请通道常年开放,他们也会尽可能早...
阅读原文

今日arXiv最热大模型论文:上海AI lab发布MathBench,GPT-4o的数学能力有多强?

夕小瑶科技说 原创作者 | 谢年年大模型数学能力哪家强? 最近,上海AI lab构建了一个全面的多语言数学基准——MathBench。与现有的基准不同的是,MathBench涵盖...
阅读原文

Nature子刊 | 加州理工学院利用脑机接口实时解码内心言语

语音脑机接口(BMIs)将大脑神经信号转换为单词或音频输出,能够让因疾病或受伤而失去语言能力的人能够进行交流。虽然在语音、尝试和模拟语音解码方面取得了...
阅读原文

集体出走的Stability AI 发布全新代码大模型,3B以下性能最优,超越Code Llama和DeepSeek-Coder

夕小瑶科技说 原创作者 | 蛋糕Stability AI又有新动作!程序员又有危机了?3月26日,Stability AI推出了先进的代码语言模型Stable Code Instruct 3B,该模型...
阅读原文

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

机器之心专栏 机器之心编辑部基于案例的推理助力大模型智能体挑战自动化数据科学任务,吉大、上交和汪军团队发布专注于数据科学的智能体构建框架 DS-Agent。...
阅读原文

高盛:英伟达引领了AI行业的第一阶段,接下来的三个阶段是..

点击上方蓝字关注我们“随着人工智能技术的飞速发展,高盛最新报告为投资者描绘了一幅详尽的投资路线图。报告指出,尽管英伟达(Nvidia)股价波动,但其年初至...
阅读原文

图解Mixtral 8 * 7b推理优化原理与源码实现

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,潞晨科技创始人尤洋,生数科技CEO唐家渝,优必选...
阅读原文

复旦发布ToolSword框架,揭露大模型工具学习中的安全风险

夕小瑶科技说 原创作者 | 芒果、Python引言:工具学习在实际部署大型语言模型中的重要性在当今的人工智能领域,大语言模型(LLMs)的实际部署已成为一个热门...
阅读原文
1234