标签:模型
通用端到端OCR模型开源,拒绝多模态大模型降维打击
Vary团队投稿 凹非寺量子位 | 公众号 QbitAI在AI-2.0时代,OCR模型的研究难道到头了吗!?(OCR:一种将图像中的文字转换为可编辑和可搜索文本的技术) Vary...
抱歉,年前我劝各位真的别轻易离职……
作为技术人的你是否经常感到,技术领域的竞争十分激烈,明明很努力却感觉“卷”得不行?市场变化快速,产品驱动一切,为何你的技术似乎越来越不值钱?真相揭秘...
斯坦福最新理论研究:RLHF中奖励过度优化现象也存在Scaling Laws
大数据文摘授权转载自将门创投 作者:seven_ 可以说,人类反馈强化学习 (RLHF) 是一把解锁大型语言模型(LLMs)涌现能力的金钥匙。它使拥有庞大参数规模的语言...
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
新智元报道编辑:alan 【新智元导读】近日,Nous Research宣布了一项重大突破,通过使用与架构和网络无关的分布式优化器,研究人员成功将训练LLM时GPU间的通...
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
新智元报道编辑:乔杨 Frey 【新智元导读】虽然OpenAI的「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级...
还在人工炼丹?自动提示工程指南来了,还带从头实现
机器之心报道 编辑:Panda人工设计提示词太麻烦了!想过让 LLM 帮你设计用于 LLM 的提示词吗?近日,自称生成式 AI 黑带选手的谷歌研究者 Heiko Hotz 发布了...
还在死磕AI咒语?北大-百川搞了个自动提示工程系统PAS
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
离开OpenAI,独自创业之后,Karpathy对AI更乐观了
「我觉得车在自动驾驶中基本上就是个机器人。」 「很多人认为特斯拉只是一家汽车公司,这种看法有点误导。特斯拉其实是一家大规模的机器人公司。」 在最近一...
AI投资前沿:全球七大科技巨头的 4000 亿美元战略布局
英国投资数据平台Dealroom 和 咨询公司Flow Partners 联合发布的一份新报告详细分析了“七巨头”(简称 M7)在各个垂直领域对人工智能的大规模投资。 谷歌/Alph...
外滩大会上,AI应用落地的N种观点|甲子光年
“AI应用最大的共识是,没有共识。”作者|赵健 每年在上海举办的外滩大会,是具有全球影响力的金融科技和前沿科技大会之一,今年已是第三届。 本届外滩大会...
腾讯公布最新AI原生云产品:更快的云底座,更强的大模型|甲子光年
已覆盖超400家互联网企业,服务超过12万家互联网客户。作者|王艺 大模型的光荣与梦想已经日渐远去,但市场对AI原生应用的呼唤还没有停止。 作为技术的基础架...
倒计4天 | 2024 wisemodel社区开发者大会,欢迎报名参与
始智AI wisemodel社区上线1周年!欢迎广大开发者朋友及大模型应用领域朋友等参与wisemodel社区开发者大会,共同庆祝wisemodel社区上线1周年! 2024 wisemodel...
RL 是 LLM 的新范式
AGI 正在迎来新范式,RL 是 LLM 的秘密武器。最近几个月,我们能明显感受到头部 AI labs 在形成一些新共识:post training 的重要程度在提高,需要的计算资源...
70B大模型训练秘方① :数据集创建与评估
今年6月,大模型公司Imbue预训练了一个70B参数的模型,并在多选推理基准上进行了微调。在这些基准上,Imbue微调的模型超越了GPT-4o zero-shot表现(该模型未...
36 亿融资“造假”被揭穿!挣钱太难了,前苹果 AI 工程师 3 年打造的“欧洲 OpenAI”宣告退出模型竞赛
整理 | 华卫、核子可乐 德国 AI 初创公司 Aleph Alpha 曾被认为是 OpenAI 的潜在欧洲竞争对手,去年还筹集了超过 5 亿美元。然而,近日 Aleph Alpha 开始将...