标签:模型

简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

弥补中文短板,社区Llama3汉化微调版效果如何?

Llama3自上个月发布以来,被称为社区最强开源模型。由于中文能力欠缺,为了弥补这一短板,开源社区已经出现了多个基于Llama3进行中文优化的微调模型。 这些微...
阅读原文

中国最具价值 AGI 创新机构 TOP 50 调研启动征集!

我们正见证一场前所未有的生产力革命——人工通用智能(AGI)的技术力量,正以前所未有的速度重塑着产业格局,带来一场 10 倍生产力的革命。这可能彻底改变我们...
阅读原文

中国「+大模型」先锋案例 TOP 10 调研启动!

大模型在产业落地的想象远超预期。 从 2022 年底 ChatGPT 横空出世,到 2024 年百万 Token 成本降至 1 元以下,生成式 AI 技术正带来一场 10 倍生产力革命。 ...
阅读原文

国产黑马大模型盲测竞技场挺进全球前十!中文榜和GPT-4o并列第一

夕小瑶科技说 分享美国时间2024年5月20日刚刷新的 LMSYS Chatboat Arena 盲测结果,来自至今积累超过 1170万的全球用户真实投票数,有一个国产大模型玩家Yi-L...
阅读原文

Mac不香啦?微软发布第一款GPT-4o加持的Windows

夕小瑶科技说 原创作者 | Zicy就在今天凌晨,微软在新园区举行的特别活动中,向世界介绍了专为AI设计的新型 Windows PC,即 Copilot+PC。 在30年前的1994年,...
阅读原文

突破性AGI综述:UIUC 120页长文揭示离AGI仅一步之遥?

来源:PaperWeekly 作者:朱昆仑 学校:UIUC硕士生 研究方向:大模型智能体系统 近日,一篇关于 AGI 的综述观点性论文火了。文章深入探讨 AGI 发展历史和现状...
阅读原文

OpenAI安全系统负责人:从头构建视频生成扩散模型

作者 |Lilian Weng OneFlow编译 翻译|杨婷、宛子琳、张雪聃 题图由SiliconFlow MaaS平台生成 过去几年,扩散模型(Diffusion models)在图像合成领域取得了...
阅读原文

新质生产力,到底“新”在哪儿?|甲子视频

大模型的落地应用本身就是一种新质生产力,而为了更好落地应用,百度智能云在5月21日宣布两大主力模型全面免费,给企业一个更高的起点,让企业和开发者可以在...
阅读原文

大模型时代的AI基础设施展望:AI创造万物,谁来供养AI?|甲子引力X

基础设施的重要性不言而喻。2024年5月15日,由中国科技产业智库「甲子光年」主办、中关村东升科学城协办的「AI创生时代——2024甲子引力X科技产业新风向」大会...
阅读原文

13分钟颠覆传统电脑!微软Copilot+ PC 抢装GPT-4o、叫板苹果,网友不买账:用大炮打蚊子

整理 | 华卫 “我们正处于一个转折点,PC 将加速人工智能创新。只有当云和设备协同工作时,才能实现最丰富的 AI 体验。”现在,微软似乎正迫切希望将生成式 AI ...
阅读原文

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens!

整理 | 褚杏娟 5 月 21 日,阿里云抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens,...
阅读原文

面壁智能发布最强端侧多模态模型:超越Gemini Pro 、GPT-4V,图像编码快150倍!

整理 | 褚杏娟 5 月 20 日,面壁智能小钢炮 MiniCPM 系列推出端侧多模态模型 MiniCPM-Llama3-V 2.5 并开源。据悉,该模型且支持 30+ 多种语言,并且具有以下...
阅读原文

击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI通义千问GPT-4级大模型,直接击穿全网底价! 就在刚刚,阿里突然放出大招,官宣9款通义大模型降价。 其中,性能对标G...
阅读原文

豆包大模型价格出炉!超高并发,“后付费”支持每分钟万次请求

允中 发自 凹非寺量子位 | 公众号 QbitAI近期,火山引擎官网更新了豆包大模型的定价详情,全面展示豆包通用模型不同版本、不同规格的价格信息。 在模型推理定...
阅读原文