人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

本文探讨了外部慢思考在LLM推理中的作用机制,为理解外部慢思考方法提供了理论支撑,并为优化LLM的推理能力提供了新思路。
阅读原文

如何优化测试时计算?解决「元强化学习」问题

通过改变 LLM 训练目标,可以重用现有数据以及更多的测试时计算来训练模型以做得更好。
阅读原文

DynVFX

DynVFX是创新的视频增强技术,能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉语言模型(VLM),实现了在不...
阅读原文

Omakase AI

Omakase AI 是 ZEALS 推出的智能购物助手工具,通过简单的网址输入,为用户提供个性化的商品推荐。用户只需提供目标网址,如商品平台或品牌官网,Omakase AI ...
阅读原文

WorldSense

WorldSense是小红书和上海交通大学推出的,用在评估多模态大型语言模型(MLLMs)在现实世界场景中对视觉、听觉和文本输入的综合理解能力的基准测试。WorldSen...
阅读原文

Airweave

Airweave 是开源工具,能将任何应用程序的数据(包括API、数据库、网站等)同步到图数据库和向量数据库中,让数据能基于智能代理或搜索机制进行检索。Airweav...
阅读原文

马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首!

原标题:马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首! 文章来源:新智元 内容字数:6843字法国Mistral AI的Le Chat横扫AI市场,欧洲AI...
阅读原文

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

原标题:诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步 文章来源:新智元 内容字数:3485字DeepSeek引发的AI巨头论战:技术突破还...
阅读原文

LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升

原标题:LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升 文章来源:新智元 内容字数:7670字Satori:赋予LLM自回归搜索能力的7B参数模...
阅读原文