标签:模型

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

选自sebastianraschka 机器之心编译 机器之心编辑部学起来吧!近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,...
阅读原文

长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

大模型之争深水期,企业如何真正实现产业级落地?

作者 | 王世昕 大模型之争,已经进入了深层阶段。 随着'百模大战'逐渐平息,整个模型市场步入了一个更为冷静的时期。但表面的宁静下,实则暗流涌动,竞争已经...
阅读原文

最高配 128 核!英特尔至强 6 性能核处理器发布:运行 Llama2-7B 快了 3.08 倍

作者 | 褚杏娟 “英特尔至强 6 性能核,将是英特尔有史以来性能最强大的至强处理器。”英特尔数据中心与人工智能集团副总裁、中国区总经理陈葆立在 9 月 6 日...
阅读原文

o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回

克小西 发自 凹非寺量子位 | 公众号 QbitAIo1-preview终于赢过了mini一次! 亚利桑那州立大学的最新研究表明,o1-preview在规划任务上,表现显著优于o1-mini...
阅读原文

利用公开知识定向提升大模型,腾讯优图&上交大提出新方法,性能达SOTA

优图实验室 投稿量子位 | 公众号 QbitAI告别传统指令微调,大模型特定任务性能提升有新方法了。 一种新型开源增强知识框架,可以从公开数据中自动提取相关知...
阅读原文

NeurIPS 2024评审结果公布!AI大佬晒出成绩单,又是被吐槽最严重的一届​

新智元报道编辑:桃子 【新智元导读】一年一度的NeurIPS 2024评审结果公布了。一大波网友纷纷晒出自己的成绩单。不过,这届顶会又成为吐槽灾区了。NeurIPS 20...
阅读原文

颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

人工智能(AI)模型的参数规模越大,生成的答案就越准确?就更加可信? 还真不一定! 日前,一项发表在权威科学期刊 Nature 上的研究表明:相比于小参数模型...
阅读原文

百度谢广军:百模大战和价格战之后,大模型下一个战场在工具平台

衡宇 发自 凹非寺量子位 | 公众号 QbitAIAI大模型对生产生活的渗透,已经在方方面面。 甚至可以说,它带来的影响比过去十年里,AI对各行各业的影响更加深远。...
阅读原文

666条数据教会AI写万字长文!模型数据集都开源

魔搭ModelScope团队 投稿量子位 | 公众号 QbitAI仅需600多条数据,就能训练自己的长输出模型了?! 事情是酱婶儿的—— 虽然大模型的上下文(Context)支持越来越...
阅读原文

首个检索增强3D生成模型!实现各种模态生成大一统:文&图&3D都可以

王振伟 投稿自 凹非寺量子位 | 公众号 QbitAI3D生成也能支持检索增强(RAG)了。 有了检索到的参考模型之后,3D生成效果更好,还具有极强的泛化性和可控性。 ...
阅读原文

10个AI驱动的小产品,展现100种创新力量|甲子光年

在S创上海2024大会,智能、高效、具有人文关怀的AI产品,正在不断涌现。作者|八度‍‍ 编辑|王博 2024年9月20日至21日,上海西岸艺术中心A馆迎来了S创上海202...
阅读原文

训练两个小时需要半个小时保存数据,如何破局?|甲子光年

AI时代存储需要更优解。作者|王博 “中国的数字化应用进程发展是很快的,但在数字基础设施这一块的创新是欠缺的,存、算、网要协同发展。” 在华为全联接大会2...
阅读原文

Meta放大招,发布真AR眼镜!但让人“高”攀不起

大数据文摘受权转载自头部科技 文丨寄语Meta一直致力于利用头显、眼镜和AI系统将“未来带给每个人。” 北京时间9月26日1:00,一年一度的Meta 2024年度开发者大...
阅读原文

LLM 我们距离应用还差什么?

夕小瑶科技说 原创作者 | Severus 本篇成于2024年8月底,O1发布半个月之前,我与同事讨论,再次坚定,无论是技术路线上,还是需求上,启发式搜索都应当是重要...
阅读原文
14849505152483