标签:代码

马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B

新智元报道编辑:编辑部 【新智元导读】马斯克最近哭穷表示,xAI需要部署10万个H100才能训出Grok 3,影响全球的大模型算力荒怎么解?昨天开源的这款MoE大模型...
阅读原文

模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

喂饭级教程,看我如何用ChatGPT-4o做一款俄罗斯方块游戏!

昨天发的一篇文章,讲的是用 Midjourney 加 Kimi 做一款像素游戏。发完后,朋友看到说:“这他妈是游戏嘛,这跟你儿子学的 Scratch 做的游戏有什么区别?”我当...
阅读原文

HyperAI超神经 x 开源中国 | 5 月 26 日源创会·深圳站来袭,轰趴馆等你

5 月 26 日,OSC 源创会 · 深圳站 来自 Gitee AI、昇思、讯飞、IDEA研究院的业界专家 探讨大模型技术在终端的应用 分享编程语言对端侧代码生成实现的优化 以...
阅读原文

微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!定制Copilot十亿打工人狂欢

新智元报道编辑:编辑部 【新智元导读】微软昨夜刚上演了一波AI PC革命,今天又全是Copilot。而最让人意外的,竟是奥特曼本人登台预告了下一代模型将会带来新...
阅读原文

70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队

克雷西 发自 凹非寺量子位 | 公众号 QbitAI70B模型,秒出1000token,换算成字符接近4000! 研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度...
阅读原文

​白嫖GPT4,Dalle3和GPT4V – 字节开发的Coze初体验!附教程及提示词Prompt

直播预告|今晚七点,「企业级大模型工程实践在线研讨会」将举行。阿里巴巴 AI 基础架构工程师刘彬、NVIDIA 软件解决方案架构师吴金钟两位技术专家将分别主讲...
阅读原文

无需OpenAI数据,跻身代码大模型榜单!UIUC发布StarCoder-15B-Instruct

新智元报道编辑:LRT 【新智元导读】通过StarCoder2-15B生成数千个指令-响应对,直接对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数据,也无需...
阅读原文

中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!

直播预告 | 5月14日晚7点,「智猩猩、AI新青年讲座」第235讲正式开讲,慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报...
阅读原文

OpenAI神秘gpt2正在A/B测试,奥特曼抢先剧透,网友已玩嗨

明敏 发自 凹非寺量子位 | 公众号 QbitAIOpenAI正在秘密A/B测试下一代模型,实力超强被怀疑是GPT-4.5或GPT-5。 就在奥特曼当谜语人暗示之后,两款新模型悄悄...
阅读原文

国产开源MoE指标炸裂:GPT-4级别能力,API价格仅百分之一

明敏 发自 凹非寺量子位 | 公众号 QbitAI最新国产开源MoE大模型,刚刚亮相就火了。 DeepSeek-V2性能达GPT-4级别,但开源、可免费商用、API价格仅为GPT-4-Turb...
阅读原文

今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路

夕小瑶科技说 原创作者 | 谢年年高级编程语言Python有两个受众:一是编译和执行程序的机器,二是阅读、理解和编写程序的人类。机器关注程序的语义操作,而人...
阅读原文

12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场

机器之心报道 机器之心编辑部没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科...
阅读原文

市值首次突破2万亿美元,谷歌却反手把美国Python 团队一锅端了!

大数据文摘受权转载自头部科技 文丨Congerry 尽管市值刚刚达到新的里程碑,但是谷歌为了省钱竟然直接将整个 Python 团队给开了! 4月27日,一则新闻在科技界...
阅读原文

GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE

克雷西 发自 凹非寺量子位 | 公众号 QbitAI微软的“GitHub版Devin”——Copilot WorkSpace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让...
阅读原文
191011121325