标签:作者
Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了
新智元报道编辑:编辑部 【新智元导读】多模态Llama 3还未发布,已经用在科幻中存在的AR眼镜上了!不仅能为你搭配衣服,还能打视频、实时翻译,只要你能想到...
研究了两年后,我发现领域的开山之作是瞎编的
夕小瑶科技说 分享作者 | 猫猫坏心眼可多啦来源 | 知乎 那是在2018年6月的人民大学,研一即将结束,我接了同学的班,去做一个叫做”语音向量“(Semantic Speec...
专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法
新智元报道编辑:LRS 【新智元导读】针对大模型偶发脑回路故障难题,最新研究GlitchHunter收集了大量故障词元,并针对不同情况进行分类,极大改善了大模型的...
让玩家全程掌控游戏:自然语言指令驱动的游戏引擎到来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式
丰色 发自 凹非寺量子位 | 公众号 QbitAI纵观生成式AI领域中的两个主导者:自回归和扩散模型。 一个专攻文本等离散数据,一个长于图像等连续数据。 如果,我...
斯坦福发文:AI写论文比例激增,CS专业是重灾区,现状堪忧!
夕小瑶科技说 原创作者 | 谢年年自从2022年底ChatGPT发布以来,用大模型辅助写学术论文已经不是什么稀罕事,各种“超详细ChatGPT论文写作、润色指南”一搜一大把...
曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源
机器之心专栏 机器之心编辑部InstantID 原班团队推出了风格迁移的新方法InstantStyle。风格化图像生成,也常称为风格迁移,其目标是生成与参考图像风格一致的...
NeurIPS开辟高中赛道引爆争议!网友:代理人战争要开始了
梦晨 发自 凹非寺量子位 | 公众号 QbitAI从今年起,高中生也要卷AI顶会了,真是计算机从娃娃抓起? NeurIPS正式面向高中生征集论文,消息一出,网友们立刻炸...
Google 发布 CodeGemma:7B 力压 CodeLLaMa-13B
夕小瑶科技说 原创作者 | 任同学刚刚发布!Google 带来了新的 Gemma 家族成员,CodeGemma,这是基于预训练的 Gemma-2B 和 Gemma-7B 的代码生成模型。 其上下...
Llama架构比不上GPT2?神奇token提升10倍记忆?
机器之心专栏 机器之心编辑部一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 ...
大模型对齐阶段的Scaling Laws
大数据文摘受权转载自李rumor 随着过去一年大模型技术的发展,数据、模型尺寸scale up后的能力已经不容置疑,scaling law也被越来越多研究者重视起来。在预训...
扩散模型进军专业图层,斯坦福提出LayerDiffuse实现分层扩散,效果直逼商业网站
大数据文摘受权转载自将门创投 目前,视觉扩散生成模型(如Stable Diffusion等)在常规图像生成任务上获得了非常好的效果,但是在内容制作的专业领域,例如对...
讨论下一个token预测时,我们可能正在走进陷阱
机器之心报道 编辑:赵阳自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 ...
Transformer七子重聚GTC,老黄亲自赠送签名版DGX-1!7年奠基之作背后佚事揭秘
新智元报道编辑:编辑部 【新智元导读】Transformer奠基之作拯救了现在的AI。就在GTC大会上,老黄聚齐了其中的七位作者,开启了一场深度访谈。GTC大会上,老...
全球学术圈险被ChatGPT论文攻陷!知名出版商紧急撤稿,AI插图笑翻网友
新智元报道编辑:编辑部 【新智元导读】近日,爱思唯尔上的几篇论文被发现开篇就暴露了「ChatGPT风格」,插图也是用Midjourney画的。学术圈被AI渗透已经不是...