标签:模型
GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
DevBench团队 投稿量子位 | 公众号 QbitAI首个AI软件工程师Devin正式亮相,立即引爆了整个技术界。 Devin不仅能够轻松解决编码任务,更可以自主完成软件开发...
性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!
夕小瑶科技说 原创作者 | 蛋糕大数据人工智能公司 Databricks放大招了!3月27日,该公司开源了通用大模型 DBRX,并声称该模型是迄今为止全球最强大的开源大型...
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统
新智元报道编辑:alan 【新智元导读】大模型的幻觉问题怎么解?谷歌DeepMind:用AI来做同行评审!事实核验正确率超过人类,而且便宜20倍。AI的同行评审来了!...
15秒完成声音克隆:OpenAI推出VoiceEngine
点击上方蓝字关注我们“OpenAI正在对外界展示其文本转语音模型VoiceEngine的早期测试成果,该模型能够以高度逼真的人类声音朗读文字。尽管技术进步显著,但同...
Stability AI 创始人如何让他的价值数十亿美元的初创公司陷入困境
点击上方蓝字关注我们“Stability AI 创始人 Emad Mostaque 因公司财务困境和内部管理问题被迫辞去 CEO 职务。Stability AI 曾是 AI 领域的热门初创公司,但因...
“深目”AI模盒发布!云天励飞将大模型塞进小盒子,千元成本实现训推一体
覆盖场景超90%,填补长尾算法市场空白。 作者|香草 编辑|漠影 大模型训练推理,最低能压缩到多少成本? 智东西3月29日报道,昨日,AI科创板上市企业云天励飞...
大模型生成的下一个范式:从“能说会道”到贯通行业
从单一文字到“X”的跃迁,开启大模型落地新纪元。 作者|程茜 编辑|漠影 行业需要怎样的大模型能力? 目前,大语言模型的生成、理解能力目前大多以文字为载体,...
马斯克发布Grok-1.5;阿里首次开源MoE大模型;AI21 Labs首推基于Mamba的量产级模型丨AIGC大事日报
03/29 全球AIGC产业要闻 1、马斯克发布Grok-1.5 上下文128k硬刚GPT-4 2、阿里首次开源MoE架构大模型 3、Meta下月为智能眼镜添加AI功能 4、谷歌推出内容真实度...
Andrej Karpathy 美国红杉资本最新对谈,达到 AGI 或需全新架构
智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,「清华系Sora」生数科技CEO唐家渝,云天励飞“云...
千元成本落地专属大模型的时代来了!|甲子光年
AI 1.0公司如何迎接AI 2.0?作者|赵健 从ChatGPT到Sora,从文生文、文生图像到文生视频,大模型发展日新月异,持续给行业带来惊喜,不仅国内掀起“百模大战”...
Transformer并非万能:Jamba在效率和吞吐量上大幅超越
点击上方蓝字关注我们“AI21 Labs推出Jamba,一种结合SSM与transformers的新AI模型,旨在提高处理长上下文的效率。Jamba在特定推理任务上超越传统模型,尽管在...
人工审核即将被淘汰? 谷歌“超人”AI不仅准确还便宜20倍!
点击上方蓝字关注我们“Google DeepMind的最新研究提出了SAFE,一种创新的长篇幅事实性评估方法,通过利用LLMs自动分解和验证事实,显著提高了评估的准确性和...
马斯克发布Grok 1.5,追了一年,仍落后于GPT-4和Claude3
点击上方蓝字关注我们“xAI公司近日推出了Grok-1.5 AI模型,具备强大的推理能力和处理高达10万字文本的能力。在多项基准测试中表现优异,尽管与市场领先产品GP...
Sora 的算力困局:如果正式推出,可能需要 72 万张 H100
在上个月推出视频生成模型 Sora 后,就在昨天,OpenAI 又发布了一系列创意工作者借助 Sora 进行的创作,效果极为惊艳。毫无疑问,就生成质量,Sora 是迄今为...
基础模型、长文本、数据库、应用落地:读懂大模型行业的关键问题
3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。 这场大会是中国大模型公...