标签:方法

Llama2-7B升级为Pro版本!腾讯提出「块扩展」训练法,效果全面提升

夕小瑶科技说 原创作者 | 付奶茶、python大语言模型在编程、数学、生物医学和金融等专业领域性能不佳,通过特定领域后训练可在降低资源消耗的同时提升性能。...
阅读原文

一部iPhone实时渲染300平房间,精度达厘米级别!谷歌最新研究证明NeRF没死

新智元报道编辑:桃子 【新智元导读】3D实时渲染又要进入新时代了!谷歌团队最新研究SMERF能够在手机、电脑上实时渲染大型3D场景。3D实时渲染大型场景,一台...
阅读原文

百川智能RAG方案总结:搜索出生的百川智能大模型RAG爬坑之路

直播预告 | 1月17日晚7点,「多模态大模型线上闭门会」正式开讲!阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,携手刘兆洋、李彦玮、文束三位青年学者...
阅读原文

奋战一年,LangChain首个稳定版本终于发布,LangGraph把智能体构建为图

机器之心报道 编辑:张倩著名的大模型智能体工具,现在有大版本更新了。 不知不觉,LangChain 已经问世一年了。作为一个开源框架,LangChain 提供了构建基于...
阅读原文

顺着网线爬过来成真了,Audio2Photoreal通过对话就能生成逼真表情与动作

机器之心报道 编辑:大盘鸡、佳琪多模态的发展已经开始超乎我们的想象了。 当你和朋友隔着冷冰冰的手机屏幕聊天时,你得猜猜对方的语气。当 Ta 发语音时,你...
阅读原文

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

张俊武 唐振宇 投稿量子位 | 公众号 QbitAI只需两分钟,玩转图片转3D! 还是高纹理质量、多视角高一致性的那种。 不管是什么物种,输入时的单视图图像还是这...
阅读原文

李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了

机器之心报道 编辑:大盘鸡、小舟即使遮挡,也能渲染出高保真的 3D 人体。AR/VR 、电影和医疗等领域都在广泛地应用视频渲染人类形象。由于单目摄像头的视频获...
阅读原文

让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接

机器之心专栏 机器之心编辑部来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略(generalizable vision-b...
阅读原文

如果我搬出RLHF+GAN这个设定,你如何应对

前阵子腾讯AI Lab悄悄挂出了一篇文章:Adversarial Preference Optimization (APO)[1],看到设定我就惊呆了:RLHF+GAN,难道还嫌RLHF本身不够难训吗?但读下...
阅读原文

谷歌推出创新SynCLR技术:借助AI生成的数据实现高效图像建模,开启自我训练新纪元!

夕小瑶科技说 原创作者 | 付奶茶谷歌推出了一种创新性的合成图像框架,这一框架独特之处在于它完全不依赖真实数据。这个框架首先从合成的图像标题开始,然后...
阅读原文

AI研究也能借鉴印象派?这些栩栩如生的人竟然是3D模型

机器之心报道 编辑:rome rome创建逼真的动态虚拟角色,要么在训练期间需要准确的 3D 配准,要么在测试期间需要密集的输入图像,有时则两者都需要,也许 D3GA...
阅读原文

用扩散模型监督NeRF,清华文生3D新方法成新SOTA

清华王霞投稿量子位 | 公众号 QbitAI用文字合成3D图形的AI模型,又有了新的SOTA! 近日,清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。 ...
阅读原文

​这次重生,AI要夺回网文界的一切

机器之心报道 编辑:大盘鸡、佳琪重生了,这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里,我看到很多选题,偶尔也会吐槽一下...
阅读原文

大模型玩星际争霸能秀到什么程度?有意识,有预判,中科院和汪军团队发布

机器之心专栏 机器之心编辑部全球最重要的电竞赛事之一DreamHack刚刚落幕,来自世界各地的星际争霸 II 顶尖选手们展开了激烈的较量。在这场紧张精彩的赛事中...
阅读原文

清华大学提出三维重建的新方法:O²-Recon,用2D扩散模型补全残缺的3D物体

机器之心专栏 机器之心编辑部在计算机视觉中,物体级别的三维表面重建技术面临诸多挑战。与场景级别的重建技术不同,物体级别的三维重建需要为场景中的每个物...
阅读原文
1131415161720