标签:数据
谷歌DeepMind力证:GPT-4终局是人类智慧总和!Transformer模型无法超越训练数据进行泛化
新智元报道编辑:润 alan【新智元导读】Transformer模型是否能够泛化出新的认知和能力?最近,谷歌的研究人员进行了有关实验,对于这一问题给出了自己的答案...
11人狂训2个月,马斯克精准OpenAI!xAI首个大模型Grok炸场,330亿参数每月16刀
新智元报道编辑:编辑部【新智元导读】OpenAI开发者大会前夕,马斯克来截胡了!xAI首个产品Grok炸裂发布,两个月训出330亿参数大模型,以《银河系漫游指南》...
Stable Diffusion被爆包含性别、种族歧视!比AI更可怕的是人类的偏见……
夕小瑶科技说 原创作者 | 付奶茶、王二狗最近,华盛顿邮报的一篇报道引起了“奶茶”我的关注!报道中提到AI图像生成器已经开始暴露出它们学到的偏见。比如将非...
国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练
丰色 发自 凹非寺量子位 | 公众号 QbitAI国内规模最大的开源大模型来了:参数650亿、基于2.6-3.2万亿token训练。排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,...
Meta和A16z等面临数10亿美元AI训练数据费用威胁
点击上方蓝字关注我们图|匡萃彪文|匡萃彪“ 美国版权局正在考虑更新其法律以直接处理生成人工智能。Meta、微软、OpenAI 和其他在人工智能领域有利害关系的公...
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
机器之心报道编辑:张倩模型小了,幻觉还减轻了。前段时间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视频。这些视...
大模型落地最后一公里:111页全面综述大模型评测
机器之心专栏机器之心编辑部当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断...
开源语言大模型演进史:高质量基础模型竞赛
本文是开源 LLM 发展史系列文章的第二部分。第一部分《》回顾了创建开源 LLM 的最初尝试。本文将研究目前可用的最受欢迎的开源基础模型(即已进行预训练但尚...
当机器学习遇见拓扑:拓扑数据分析与拓扑深度学习
导语作为数学的一个分支,拓扑学以独特的方式描述空间的性质和结构。近年来,几何和拓扑在机器学习中得到了广泛应用,尤其是拓扑模型,在数据表示和特征提取...
靠Kafka挣不了钱了?Confluent 财报一发,股价暴跌超 44%!
整理 | 核子可乐 褚杏娟 截至美国东部时间周四中午 12:30,Confluent(纳斯达克股票交易代码:CFLT)的股价下跌了 44.3%。在这次大幅下跌之前,Confluent 股...
对标 FAISS,百度开源自研高性能检索引擎 Puck
作者 | Tina近日,百度宣布在 Apache 2.0 协议下开源自研检索引擎 Puck,这也是国内首个适用于超大规模数据集的开源向量检索引擎。向量检索算法在个性化推荐...
GPT-4 做「世界模型」,让LLM从「错题」中学习,推理能力显著提升
机器之心报道编辑:蛋酱、杜伟从错误中学习,不只是人类可以做到。近日有研究发现,大模型其实也可以借鉴这种思路。这段时间,大语言模型在各种 NLP 任务中取...
清华大学利用可解释机器学习,优化光阳极催化剂,助力光解水制氢
点击上方蓝字,关注我们!By 超神经水的太阳能光电化学 (PEC) 分解是将太阳能高效转换为氢能的方法,是一种很有前景的可再生能源生产方式。然而,受电极性质...
何恺明做科研也emo!最新QA完整版在此
西风 发自 凹非寺量子位 | 公众号 QbitAIAI大牛何恺明的一句话火了,他说:科研中95%的时间是令人沮丧的。什么???就连何恺明都觉得科研很煎熬?没错,此话...
性能全面超越LLaMA2,0门槛商用,这个国产大模型要改变开源竞争格局了
机器之心报道机器之心编辑部开源大模型领域的进化节奏,越来越快。今年 7 月,Meta 开源了 LLaMA2,以强大的性能和免费商用的特质,受到了开发者和众多企业的...