标签:模型

Llama架构比不上GPT2?神奇token提升10倍记忆?

机器之心专栏 机器之心编辑部一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 ...
阅读原文

Mistral开源8X22B大模型,OpenAI更新GPT-4 Turbo视觉,都在谷歌

机器之心报道 编辑:杜伟真有围剿 Google 的态势啊! 在谷歌昨晚 Cloud Next 大会进行一系列重大发布时,你们都来抢热度:前有 OpenAI 更新 GPT-4 Turbo,后...
阅读原文

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

机器之心原创 作者:杜伟对代码大模型而言,比能做编程题更重要的,是看是能不能适用于企业级项目开发,是看在实际软件开发场景中用得顺不顺手、成本高不高、...
阅读原文

血常规、尿检等指标就能识别卵巢癌!中山大学刘继红团队牵头,四大医学院联合构建 AI 融合模型

作者:乔乔 编辑:李宝珠,三羊 中山大学肿瘤防治中心妇科刘继红教授团队,联合南方医科大学、华中科技大学同济医学院附属同济医院、浙江大学医学院附属妇产...
阅读原文

清华类Sora大模型黑马!融资数亿,成果被OpenAI苹果采用,深度对话CEO

AI视频生成竞赛,序幕才刚刚拉开。 作者|ZeR0 编辑|漠影 50多天前轰动科技圈的Sora,给全世界上了堂打开视频创作想象力的大课。 国内类Sora创企们也活跃起来...
阅读原文

腾讯大模型落地实操:模型推理引擎 TACO-LLM 的实践、腾讯乐享的 AI 功能探索

大模型在今年的落地,除了对用 AI 对已有业务进行改造和提效外,算力和推理的优化,可能是另外一项重要的实践了。这在腾讯的两个完全不同的业务上有着明显的...
阅读原文

和无问芯穹夏立雪聊聊:中国大模型的 Scaling Law 难题

Scaling Law 已成为大模型进化的「不二法门」。 大模型参数量越大、数据集规模越大、算力消耗越大,性能就越好。性能越好,越受欢迎,业务拓展与运营的成本就...
阅读原文

重整化群遇见机器学习:多尺度视角探索复杂系统内在的统一性

来源:集智俱乐部 作者:陶如意 编辑:梁金 正因为“太小的结构我们看不清,太大的结构我们看不全”,所以我们需要使用重整化群的方法,不断把系统的重要特征突...
阅读原文

北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计

丰色 衡宇 发自 凹非寺量子位 | 公众号 QbitAI从科技圈最新动态来看,最近AI代码生成概念实火。 可是,小伙伴们有没有感觉,AI刷程序题比较亮眼,到了企业真...
阅读原文

香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品

允中 发自 凹非寺量子位 | 公众号 QbitAI香港也有大模型公司了。 Weitu AI,一家全力打造多模态Native产品的公司,其创始人王历伟博士在介绍时,特别强调了“...
阅读原文

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

明敏 发自 凹非寺量子位 | 公众号 QbitiAI大神卡帕西(Andrej Karpathy)刚“复工”,立马带来神作: 纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框...
阅读原文

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

阿踏 投稿量子位 | 公众号 QbitAI把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%! 具体来说,来自人大与浙大学者团队的研究者们把涉及数...
阅读原文

刚刚,又有20亿巨款砸向AI,产业场景里的AGI

白交 发自 凹非寺量子位 | 公众号 QbitAI刚刚,20亿规模的新融资被官宣,砸向了AI。 AI+IoT方向的独角兽特斯联,再次被推至台前。 作为AI1.0时代就跻身独角兽...
阅读原文

没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路

作者|CadeMetz,CeciliaKang, SheeraFrenkel,StuartA.ThompsonandNicoGrant 译者|核子可乐 策划|褚杏娟 2021 年底,OpenAI 开始面临数据供应荒。 这家人工智能...
阅读原文

高薪必看:如何编写对大模型友好的代码? | 极客时间

在最近的红杉 AI 峰会上,吴恩达教授深入剖析了 Agent Workflow 及其与大语言模型(LLM)结合的潜力。他提出,通过智能代理自动化任务,不仅能优化工作流程,...
阅读原文