标签：模型

Llama架构比不上GPT2？神奇token提升10倍记忆？

机器之心专栏机器之心编辑部一个 7B 规模的语言模型 LLM 能存储多少人类知识？如何量化这一数值？训练时间、模型架构的不同将如何影响这一数值？浮点数压缩 ...

阅读原文

AIGC动态

2年前 (2024)

Mistral开源8X22B大模型，OpenAI更新GPT-4 Turbo视觉，都在谷歌

机器之心报道编辑：杜伟真有围剿 Google 的态势啊！在谷歌昨晚 Cloud Next 大会进行一系列重大发布时，你们都来抢热度：前有 OpenAI 更新 GPT-4 Turbo，后...

阅读原文

AIGC动态

2年前 (2024)

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

机器之心原创作者：杜伟对代码大模型而言，比能做编程题更重要的，是看是能不能适用于企业级项目开发，是看在实际软件开发场景中用得顺不顺手、成本高不高、...

阅读原文

AIGC动态

2年前 (2024)

血常规、尿检等指标就能识别卵巢癌！中山大学刘继红团队牵头，四大医学院联合构建 AI 融合模型

作者：乔乔编辑：李宝珠，三羊中山大学肿瘤防治中心妇科刘继红教授团队，联合南方医科大学、华中科技大学同济医学院附属同济医院、浙江大学医学院附属妇产...

阅读原文

AIGC动态

2年前 (2024)

清华类Sora大模型黑马！融资数亿，成果被OpenAI苹果采用，深度对话CEO

AI视频生成竞赛，序幕才刚刚拉开。作者|ZeR0 编辑|漠影 50多天前轰动科技圈的Sora，给全世界上了堂打开视频创作想象力的大课。国内类Sora创企们也活跃起来...

阅读原文

AIGC动态

2年前 (2024)

腾讯大模型落地实操：模型推理引擎 TACO-LLM 的实践、腾讯乐享的 AI 功能探索

大模型在今年的落地，除了对用 AI 对已有业务进行改造和提效外，算力和推理的优化，可能是另外一项重要的实践了。这在腾讯的两个完全不同的业务上有着明显的...

阅读原文

AIGC动态

2年前 (2024)

和无问芯穹夏立雪聊聊：中国大模型的 Scaling Law 难题

Scaling Law 已成为大模型进化的「不二法门」。大模型参数量越大、数据集规模越大、算力消耗越大，性能就越好。性能越好，越受欢迎，业务拓展与运营的成本就...

阅读原文

AIGC动态

2年前 (2024)

重整化群遇见机器学习：多尺度视角探索复杂系统内在的统一性

来源：集智俱乐部作者：陶如意编辑：梁金正因为“太小的结构我们看不清，太大的结构我们看不全”，所以我们需要使用重整化群的方法，不断把系统的重要特征突...

阅读原文

AIGC动态

2年前 (2024)

北大开源最强aiXcoder-7B代码大模型！聚焦真实开发场景，专为企业私有部署设计

丰色衡宇发自凹非寺量子位 | 公众号 QbitAI从科技圈最新动态来看，最近AI代码生成概念实火。可是，小伙伴们有没有感觉，AI刷程序题比较亮眼，到了企业真...

阅读原文

AIGC动态

2年前 (2024)

香港大模型公司Weitu AI首秀，打造多模态Native的技术和产品

允中发自凹非寺量子位 | 公众号 QbitAI香港也有大模型公司了。 Weitu AI，一家全力打造多模态Native产品的公司，其创始人王历伟博士在介绍时，特别强调了“...

阅读原文

AIGC动态

2年前 (2024)

OpenAI创始大神手搓千行C代码训练GPT，附PyTorch迁移教程

明敏发自凹非寺量子位 | 公众号 QbitiAI大神卡帕西（Andrej Karpathy）刚“复工”，立马带来神作：纯C语言训练GPT，1000行代码搞定！，不用现成的深度学习框...

阅读原文

AIGC动态

2年前 (2024)

GPT-4一眼看穿论文会不会撤稿：7000篇实测准确率高达95%｜人大浙大

阿踏投稿量子位 | 公众号 QbitAI把论文丢给GPT-4进行撤稿预测，和人类审稿人给出的结果相似性近95%！具体来说，来自人大与浙大学者团队的研究者们把涉及数...

阅读原文

AIGC动态

2年前 (2024)

刚刚，又有20亿巨款砸向AI，产业场景里的AGI

白交发自凹非寺量子位 | 公众号 QbitAI刚刚，20亿规模的新融资被官宣，砸向了AI。 AI+IoT方向的独角兽特斯联，再次被推至台前。作为AI1.0时代就跻身独角兽...

阅读原文

AIGC动态

2年前 (2024)

没有数据训练大模型？OpenAI 总裁带队转录YouTube视频，谷歌、Meta 也想尽数据收割套路

作者|CadeMetz,CeciliaKang, SheeraFrenkel,StuartA.ThompsonandNicoGrant 译者|核子可乐策划|褚杏娟 2021 年底，OpenAI 开始面临数据供应荒。这家人工智能...

阅读原文

AIGC动态

2年前 (2024)

高薪必看：如何编写对大模型友好的代码？ | 极客时间

在最近的红杉 AI 峰会上，吴恩达教授深入剖析了 Agent Workflow 及其与大语言模型（LLM）结合的潜力。他提出，通过智能代理自动化任务，不仅能优化工作流程，...

阅读原文

AIGC动态

2年前 (2024)

1…251 252253254 255…483