标签:样本

没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰

新智元报道编辑:alan 【新智元导读】近日,又一惊人结论登上Hacker News热榜:没有指数级数据,就没有Zero-shot!多模态模型被扒实际上没有什么泛化能力,生...
阅读原文

数据更多更好还是质量更高更好?这项研究能帮你做出选择

机器之心报道 编辑:Panda W当计算预算低时,重复使用高质量数据更好;当不差钱时,使用大量数据更有利。对基础模型进行 scaling 是指使用更多数据、计算和参...
阅读原文

吴恩达:四个步骤,让大模型变得更好

机器之心报道 编辑:小舟本周,生成式 AI 的竞争达到了新的高潮。 前有 OpenAI 抢先发布 GPT-4o,后有谷歌在 I/O 开发者大会上发布一系列生成式人工智能模型...
阅读原文

今日arXiv最热大模型论文:减少语法错误,竟成了突破口!识别AI生成文本,AUROC达98.7%

夕小瑶科技说 原创作者 | 谢年年语法错误更少竟成为检测大模型生成文本的突破口? 澳门大学和哈工大的团队最近发现人类在写作时比语言模型更容易犯语法错误。...
阅读原文

综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!

新智元报道编辑:LRT 【新智元导读】本文全面综述了自监督学习(SSL)在推荐系统中的应用,深入分析了逾170篇论文。文中提出了一个涵盖九大推荐场景的自监督...
阅读原文

仅用250美元,Hugging Face技术主管手把手教你微调Llama 3

机器之心报道 编辑:赵阳大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客,详细讲解了如何利用...
阅读原文

ICLR 2024 | 跨领域准确进行零样本异常检测,浙大等提出AnomalyCLIP

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

我的11万去哪里了?

——《AI罗慢罗懒》第11期—— “平均数陷阱”平均数并不平均 它很多时候是一个陷阱 2024年央行发布的数据 称我国人均存款11万 你觉得这可能吗? 如果你一家四口 那...
阅读原文

中科大等意外发现:大模型不看图也能正确回答视觉问题!

陈林 投稿 凹非寺量子位 | 公众号 QbitAI大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象...
阅读原文

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水—— Claude背后厂商Anthropic发现,随着窗...
阅读原文

优于五大先进模型,浙江大学杜震洪团队提出 GNNWLR 模型:提升成矿预测准确性

作者:田小幺 编辑:李宝珠,三羊 GNNWLR 集成了地理空间和神经网络,结合 Shapley 加性解释理论,不但能够大幅提升预测的准确性,并且能够在复杂的空间场景...
阅读原文

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

机器之心专栏 机器之心编辑部随着生成模型(如 ChatGPT、扩散模型)飞速发展,一方面,生成数据质量越来越高,到了以假乱真的程度;另一方面,随着模型越来越...
阅读原文

OpenAI首次官宣语音项目,配音演员警报拉响

机器之心报道 编辑:陈萍文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本...
阅读原文

OpenAI藏了1年多的技术正式公开!15秒素材克隆声音,HeyGen也在用

克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。 有了它,只需15秒的语音样本,就能克隆出一个人...
阅读原文

ICLR2024:南洋理工发布!改几个参数就为大模型注入后门

夕小瑶科技说 原创作者 | 芒果 引言:LLMs的安全性问题及其对日常生活的影响随着大语言模型(LLMs)在处理自然语言处理(NLP)相关任务中的广泛应用,它们在...
阅读原文