标签:模型
MiniMax 发布首个 MoE 大语言模型,开放平台日均处理数百亿token
今天,MiniMax 全量发布了首个 MoE 架构的大模型 abab6,参数比上一版本大一个量级,可以更好地从训练语料中学到更精细的规律,完成更复杂的任务。 「基于 Mo...
国产大模型,逼近GPT-4|甲子光年
国产“GPT Store”发布了。作者|赵健 国产大模型与OpenAI还有多少差距? 在去年11月30日的「甲子引力」年终盛典上,智谱AI CEO张鹏给到的答案是,在单点或少量...
花了三周,我又更新了一版开源软件 ffio
Hello,我是 JioNLP。最近又有一阵没写文章了。这篇文章主要宣传我正在更新开发的开源软件工具 ffio。 开源地址:https://github.com/dongrixinyu/ffio 欢迎 ...
国产「GPTs」登场!清华系重磅发布GLM-4全家桶,性能可达90% GPT-4
新智元报道编辑:编辑部 【新智元导读】狂飙三个月,智谱AI的大模型全家桶震撼发布了!GLM-4性能超进化,堪称「国产GPT-4」;GLMs和GLM Store,直接对标OpenA...
扩散模型图像理解力刷新SOTA!字节复旦团队提出全新「元提示」策略
新智元报道编辑:好困 桃子 【新智元导读】过去一年扩散模型风头正劲,彻底改变了文生图领域!那么,扩散模型能否处理视觉感知任务?字节跳动和复旦大学技术...
AI并没有学习!Nature子刊最新研究解码人工智能黑盒
新智元报道编辑:alan 【新智元导读】人工智能模型一直以「黑匣子」的形态让人们感到不安,AI到底从数据中学到了什么?又是如何作出推理?最新研究为你揭秘AI...
今日Arxiv最热NLP大模型论文:清华大学让大语言模型自动并行自回归解码,速度提升高达4倍!
夕小瑶科技说 原创作者 | 赛博马良 本文内容由 赛博马良「AI论文解读达人」 智能体生成,人工整理排版。 「AI论文解读达人」 可提供最热AI论文推荐、论文解读...
对标OpenAI GPT-4,MiniMax 国内首个 MoE 大语言模型全量上线
作者|冬梅 1 月 16 日,InfoQ 获悉,经过了半个月的部分客户的内测和反馈,MiniMax 全量发布大语言模型 abab6,该模型为国内首个 MoE(Mixture-of-Experts)...
国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
衡宇 发自 凹非寺量子位 | 公众号 QbitAI国产大模型玩家智谱AI,交出最新成绩单—— 发布全自研第四代基座大模型GLM-4,且所有更新迭代的能力全量上线。 作为国...
微软Copilot Pro来了:个人用户也能在Word里用GPT-4,20美元/月
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI面向个人用户的微软Copilot会员版来了。 一个月多交20刀(约合人民币142元),Microsoft 365个人版/家庭版用户就能在...
AI反诈!Deepfake音视频检测技术亮相CES,准确率超90%
西风 发自 凹非寺量子位 | 公众号 QbitAI离大谱,一个标有美国消费者新闻与商业频道CNBC logo的视频称: “每个欧洲人靠ChatGPT,每周能赚3到4千欧元。” “投资...
为什么普通人「出圈」,都在小红书?
机器之心报道 作者:WX解码小红书推荐系统:为什么在这里普通人更容易被看见?出差期间,我在酒店百无聊赖地打开了小红书。一篇看似平淡无奇的笔记吸引了我的...
微软Copilot大会员来了:每月20刀,人人都能用
机器之心报道 编辑:泽南、娄佳琪覆盖 Office 全家桶,免费的移动版 App 也同期上线。 去年 9 月,微软宣布了大模型 Copilot 能力加入 Office 和 Windows 11 ...
开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了
机器之心报道 编辑:张倩又有新的开源模型可以用了。 从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准...
AAAI 2024 | TEx-Face,5秒内按需生成照片级3D人脸
大数据文摘授权转载自将门创投 作者:Xiaolong Shen 本文介绍一篇来自浙江大学ReLER实验室的工作,'Controllable 3D Face Generation with Conditional Style...