标签:基准
今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu
夕小瑶科技说 原创作者 | Tscom随着人工智能领域的快速发展,大语言模型(LLMs)在自然语言处理(NLP)的多个领域取得了显著的成功。这些模型通过自然语言生...
AI软件工程师Devin横空出世,程序猿的饭碗还保得住吗?
点击上方蓝字关注我们“Cognition实验室打造的全球首个由认知构建的人工智能软件工程师Devin,以其独立完成整个软件项目的承诺引起轰动。其在SWE-Bench基准测...
前端不存在了?盲测64%的人更喜欢GPT-4V的设计,杨笛一等团队新作
机器之心报道 编辑:Panda前端工程师是不是开始慌了?3 月 9 日央视的一档节目上,百度创始人、董事长兼 CEO 李彦宏指出,以后不会存在「程序员」这种职业了...
刚刚,OpenAI劲敌重磅发布Inflection-2.5!性能媲美GPT-4但计算量仅为40%,高情商应用Pi日活已破百万
新智元报道编辑:好困 桃子 【新智元导读】到了2024年,大模型领域还是这么卷。继世界最强模型Claude 3诞生之后,OpenAI劲敌新升级了Inflection-2.5,仅用40%...
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4
机器之心报道 编辑:小舟、泽南又一个媲美 GPT-4 的大模型出现了? 本周四,美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。 据...
微软英伟达力挺,OpenAI强敌出手:训练计算量仅40%、性能直逼GPT-4!
最有同理心的AI聊天助手上新了!全球第四大生成式AI独角兽出品。 作者|ZeR0 编辑|漠影 智东西3月8日消息,又一家生成式AI独角兽推出了性能匹敌GPT-4的大模型...
Anthropic 发布 Claude 3 系列模型,世界最强模型易主!GPT-4被全面超越
夕小瑶科技说 分享来源 | 量子位 Anthropic刚刚官宣:Claude 3来了! 作为OpenAI最强竞争选手,此次它发布的新模型家族,以最强版Claude 3 Opus为代表,“已经...
GPT-4时代已过?全球网友实测Claude 3,只有震撼
机器之心报道 机器之心编辑部性能比 GPT-4 强很多。大模型的纯文本方向,已经卷到头了? 昨晚,OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列...
逼近GPT-4的新模型发布!「欧洲版OpenAI 」联手微软,却被质疑违背初心
王炸 新模型昨晚,号称「欧洲 OpenAI」的 Mistral AI, 发布了其最新的顶级文本生成模型 Mistral Large。 这一模型具备顶级的推理能力,可用于处理复杂的多语...
Mistral获微软投资,发布旗舰模型Mistral Large,但没有开源|甲子光年
Mistral AI 走上了 OpenAI 开源再闭源的老路了吗?作者|刘杨楠 编辑|赵健 昨夜,被称为“法国版 OpenAI”的 Mistral AI 再放大招,正式发布 Mistral Large ...
欧洲最火AI独角兽发布旗舰大模型!性能直逼GPT-4,微软宣布合作投资
在MMLU基准测评中,Mistral Large成为仅次于GPT-4且可通过API普遍使用的模型。 编译|程茜 编辑|心缘 智东西2月27日消息,昨天,欧洲生成式AI独角兽Mistral AI...
Mistral AI新模型对标GPT-4,不开源且与微软合作,网友:忘了初心
机器之心报道 机器之心编辑部「欧洲版 OpenAI」的「最强开源大模型」,被微软收编了。生成式 AI 领域,又有重量级产品出现。 周一晚间,Mistral AI 正式发布...
谷歌再放核弹!开源最强大模型Gemini技术,碾压Llama 2,一月三大招硬刚OpenAI
突发!谷歌开源Gemini兄弟版,全面狙击Llama 2。 作者|香草 李水青 编辑|李水青 就在刚刚,谷歌向最强开源大模型的宝座发起进攻! 智东西2月22日凌晨报道,昨...
全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战
新智元报道编辑:编辑部 【新智元导读】谷歌发布全球最强开源大模型Gemma,7B性能超越Llama 2 13B!谷歌和OpenAI,已经卷出了新高度。这轮番放深夜炸弹的频率...
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
机器之心报道 机器之心编辑部刚刚,谷歌杀入开源大模型。 开源领域大模型,迎来了重磅新玩家。 谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma ...