标签:语义

谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

新智元报道编辑:桃子 【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷...
阅读原文

海马体掌管记忆的神,我是你的破壁人 | 追问顶刊

▷本文为追问特约长文,7000字,阅读需17min。建议收藏或转发朋友圈,分多次阅读,愿有所收获。本文已开快捷转载,如需另外开白,还请留言。记忆是如何形成的...
阅读原文

通用高级RAG技术详解

今天给大家解读一篇写的还不错的文章,介绍了一些通用的高级RAG技术,这里很多模块都可以参考,加入到整个RAG流程中。 聊的是这篇外文博客: https://pub.tow...
阅读原文

GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评

新智元报道编辑:LRS 好困 【新智元导读】华中科技大学联合华南理工大学、北京科技大学等机构的研究人员对14个主流多模态大模型进行了全面测评,涵盖5个任务...
阅读原文

征召!开源项目JioNLP优化开发

Hello,大家好,我是 JioNLP。 工具包 jionlp 里有一个时间语义解析功能,我想征召大伙一起把这个功能优化一下。所谓时间语义解析,也就是把自然语言的时间表...
阅读原文

详解面向大模型的检索增强生成(RAG)

RAG最近有一篇广受关注的综述,最近是花了不少时间给啃了个大概,里面提及的挺多文章其实都挺精彩的,甚至是让人兴奋的。我先把链接放上。 论文:Retrieval-A...
阅读原文

第一家完成大模型研发和开源的央企为何是Ta?我们和电信AI团队聊了聊|视频

常史聘 假装发自 凹非寺量子位 | 公众号 QbitAI前不久,中国电信的星辰语义大模型正式开源,也就此成为第一家完成大模型研发和开源的央企。 星辰语义大模型由...
阅读原文

纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了

机器之心报道 编辑:Panda、蛋酱人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」,往往只能靠单个摄像头或单张...
阅读原文

央企第一家:中国电信开源星辰语义大模型,共享超1T 高质基础数据

机器之心原创 作者:吴昕2024 年伊始,中国电信开源星辰语义大模型- 7B,成为第一家开源大模型的央企。同时开源的还有超 1T 的高质量清洗基础数据。 随着新一...
阅读原文

央企第一家:中国电信开源星辰语义大模型,共享超1T高质基础数据

机器之心原创 作者:吴昕2024 年伊始,中国电信开源星辰语义大模型-7B,成为第一家开源大模型的央企。同时开源的还有超 1T 的高质量清洗基础数据。 随着新一...
阅读原文

李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%

新智元报道编辑:桃子 【新智元导读】激发大模型解决复杂问题的重要技术之一CoT,如今要被颠覆了?谷歌DeepMind斯坦福UC伯克利共同提出了「代码链」(CoC),...
阅读原文

Midjourney 发布 V6 beta:增强语义理解,支持嵌入英文单词

赶在圣诞假期前,Midjourney 发布了 V6 beta 版本,北京时间下午13:56,老美那边大概夜里10点。 他们是想趁着还没回家过圣诞,赶紧先发了。然后让大家一边过...
阅读原文

NeurIPS 2023|有效提高视频编辑一致性!美图&国科大联合提出基于文生图模型的新方法 EI2

美图影像研究院(MT Lab)与中国科学院大学突破性地提出基于文生图模型的视频生成新方法EI2,用于提高视频编辑过程中的语义和内容两方面的一致性。 该论文从...
阅读原文

NeurIPS 2023|有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²

机器之心专栏 机器之心编辑部美图影像研究院(MT Lab)与中国科学院大学突破性地提出了基于文生图模型的视频生成新方法 EI2,用于提高视频编辑过程中的语义和...
阅读原文

阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效

机器之心报道编辑:张倩、陈萍文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生...
阅读原文