标签：基准

开源大模型王座易主！谷歌Gemma杀入场，笔记本可跑，可商用

机器之心报道机器之心编辑部刚刚，谷歌杀入开源大模型。开源领域大模型，迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini，Gemma ...

阅读原文

AIGC动态

2年前 (2024)

三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

机器之心报道编辑：陈萍该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。如果你经常读 AI 大模型方向的论文，Yi Tay 想必是一个熟悉的名...

阅读原文

AIGC动态

2年前 (2024)

通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

机器之心报道编辑：泽南超越 Claude、GPT-3.5，提升了多语言支持能力。赶在春节前，通义千问大模型（Qwen）的 1.5 版上线了。今天上午，新版本的消息引发了 ...

阅读原文

AIGC动态

2年前 (2024)

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

机器之心报道编辑：陈萍、小舟模型参数量只有 137M，5 天就能训练好。一周前，OpenAI 给广大用户发放福利，在下场修复 GPT-4 变懒的问题后，还顺道上新了 5 ...

阅读原文

AIGC动态

2年前 (2024)

无注意力大模型Eagle7B：基于RWKV，推理成本降低10-100 倍

机器之心报道编辑：陈萍Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中，与动辄上千亿参数的模型相比，最近，小模型开始受到大家的青睐。比如法国 AI ...

阅读原文

AIGC动态

2年前 (2024)

OpenAI官方下场修复GPT-4变懒，上新多个模型、还大降价

机器之心报道编辑：杜伟、陈萍今天，OpenAI 一口气宣布了 5 个新模型，包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。 ...

阅读原文

AIGC动态

2年前 (2024)

大模型推理成本排行榜来了：贾扬清公司效率领跑

机器之心报道编辑：小舟、泽南风投烧完之后，哪些大模型创业公司会开始盈利？「大模型的 API 是个亏本买卖吗？」随着大语言模型技术的逐渐实用化，越来越多...

阅读原文

AIGC动态

2年前 (2024)

无需训练实现价值观实时动态对齐：上交开源价值观对齐方法OPO，闭源与开源大模型均适用

机器之心专栏机器之心编辑部随着人工智能技术的发展，以 GPT-4 为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。与此同时，大模型本身的安全...

阅读原文

AIGC动态

2年前 (2024)

最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

新智元报道编辑：桃子【新智元导读】Mixtral 8x7B模型开源后，AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-He...

阅读原文

AIGC动态

2年前 (2024)

开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

机器之心报道编辑：张倩又有新的开源模型可以用了。从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准...

阅读原文

AIGC动态

2年前 (2024)

杀疯了的开源专家模型 Mixtral 8x7B 论文公开啦！

夕小瑶科技说原创作者 | 付奶茶、王二狗上个月法国初创公司 Mistral AI 开源的一个8x7B MoE模型Mixtral 8x7B引爆了AI社区。一是因为它的性能击败了LLama2和...

阅读原文

AIGC动态

2年前 (2024)

Mixtral 8x7B论文终于来了：架构细节、参数量首次曝光

机器之心报道作者：陈萍、大盘鸡Mixtral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5。前段时间，那个爆火整个开源社区的 Mixtral 8x7B MoE 模型...

阅读原文

AIGC动态

2年前 (2024)

今日最热门AI论文Top5：高效微调、图生3D、AI Agent、大模型ChatGPT、图学习

夕小瑶科技说原创作者 | 赛博马良本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马...

阅读原文

AIGC动态

2年前 (2024)

8x7B MoE与Flash Attention 2结合，不到10行代码实现快速推理

机器之心报道编辑：陈萍感兴趣的小伙伴，可以跟着操作过程试一试。前段时间，Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区，其架构与 GPT-4 非常相...

阅读原文

AIGC动态

2年前 (2023)

微软发布 Orca 2 LLM，表现优于 10 倍参数模型

作者 | Anthony Alford 译者 | 明知山策划 | 丁晓昀微软发布 Orca 2 LLM，这是 Llama 2 的一个调优版本，性能与包含 10 倍参数的模型相当，甚至更好。Orca...

阅读原文

AIGC动态

3年前 (2023)

1…7 8910 11 12