标签:样本
LeCun新作:神经网络在实践中的灵活性到底有多大?
新智元报道编辑:alan 【新智元导读】神经网络拟合数据的能力受哪些因素影响?CNN一定比Transformer差吗?ReLU和SGD还有哪些神奇的作用?近日,LeCun参与的一...
神经网络可能不再需要激活函数?Layer Normalization也具有非线性表达!
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
ICML 2024|Transformer究竟如何推理?基于样例还是基于规则
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
小红书怎么用大模型?顶会作者在线等你来聊
允中 发自 凹非寺量子位 | 公众号 QbitAI大模型正引领新一轮的研究热潮,业界和学术界都涌现出了众多的创新成果。 小红书技术团队也在这一浪潮中不断探索,多...
无需人类或GPT-4打标签!南大&旷视研究院无监督范式大幅降低视觉大模型对齐成本
旷视研究院 投稿量子位 | 公众号 QbitAI不用打标签,也能解决视觉大模型的偏好对齐问题了。 南大与旷视研究院的研究人员,推出了适用于VLM的无监督范式。 对...
小红书这场大模型论文分享会,集齐了四大国际顶会的作者
大模型正引领新一轮的研究热潮,业界和学术界都涌现出了众多的创新成果。 小红书技术团队也在这一浪潮中不断探索,多篇论文研究成果在 ICLR、ACL、CVPR、AAAI...
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST 【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成...
ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
8B模型奥数成绩比肩GPT-4!上海AI Lab出品
克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有...
偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳
机器之心报道 编辑:陈萍本文提出的 Poseidon 在样本效率和准确率方面都表现出色。偏微分方程(PDEs)被称为物理学的语言,因为它们可以在广泛的时间 - 空间...
Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成
机器之心报道 编辑:蛋酱、小舟音频生成领域又有好消息:刚刚,Stability AI 宣布推出开放模型 Stable Audio Open,该模型能够生成高质量的音频数据。项目地...
首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度
UrbanGPT团队 投稿量子位 | 公众号 QbitAI时空预测技术,迎来ChatGPT时刻。 时空预测致力于捕捉城市生活的动态变化,并预测其未来走向,它不仅关注交通和人流...
登天文学顶刊MNRAS!中科院上海天文台利用AI发现107例中性碳吸收线,探测精度达99.8%
作者:田小幺 编辑:李宝珠,三羊 中国科学院上海天文台研究员葛健带领的国际团队,通过深度学习方法,在斯隆巡天三期释放的数据中发现了 107 例宇宙早期中性...
CoT提出者Jason Wei:大模型评估基准的「七宗罪」
机器之心报道 机器之心编辑部Jason Wei 是思维链提出者,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 进行工作。在 CV ...
陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替
克雷西 发自 凹非寺量子位 | 公众号 QbitAI比斯坦福DPO(直接偏好优化)更简单的RLHF平替来了,来自陈丹琦团队。 该方式在多项测试中性能都远超DPO,还能让8B...