标签:文本
一切模态,无限接近AGI!新加坡华人团队开源全能「大一统」多模态大模型
新智元报道编辑:好困【新智元导读】继各类输入端多模态大语言模型之后,新加坡国立大学华人团队近期开源了一种支持任意模态输入和任意模态输出的「大一统」...
Adobe 这个 AI 作图神器,终于全面开放
欢迎收看最新一期的 Hunt Good 周报!在本期内容你会看到:4 条新鲜资讯3 个有用工具3 个鲜明观点1 个有趣案例Hunt for News|先进头条👀 Meta 计划明年初开始...
CIKM 2023|TASTE:通过文本匹配缓解序列化推荐中流行偏差问题
作者丨刘正皓1、梅森1、熊辰炎2、李晓华1、于是 3、刘知远3、谷峪1、于戈1机构丨1. 东北大学;2. 卡内基梅隆大学;3. 清华大学该论文发表于CIKM-2023论文链接...
几行代码,几秒钟就能生成令人惊叹的音频样本!HuggingFace推出音频生成Pipeline
夕小瑶科技说 原创编辑 | 谢年年音频是我们日常生活中不可或缺的一部分,而如今,AI+音频带来了前所未有的体验。通过AI技术,只需简单地输入一些文本提示就可...
腾讯混元大模型发布!全自研、参数规模超千亿
在今日举行的2023腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生正式发布腾讯混元大模型。据悉,该大模型为腾讯全链路自研大...
带你穿越清明上河图!DragNUWA惊艳亮相:一拖一拽让静图秒变视频
新智元报道编辑:Lumina【新智元导读】微软提出文本图像轨迹条件视频生成模型DragNUWA,支持手绘轨迹驱动图像动态化,实现复杂运动及场景控制。微软开发的视...
MVDream:轻松实现从文本到3D渲染图像
近日,字节跳动研究人员推出了名为MVDream的新技术,它可以仅通过文本描述生成高质量的3D图像。这种从文本到图像的生成技术,被称为“文本到3D”技术,是当前计...
免费科研利器!Meta祭出Nougat,PDF格式转换,公式表格精准识别,扫描版文档也可以
新智元报道编辑:桃子【新智元导读】最新科研神器Nougat,可以把PDF中公示、文本提取出来。做研究的童鞋们简直要狂喜!近来,Meta AI研究人员推出一款OCR神器...
国产语音对话大模型来了:李开复零一万物参与,中英双语多模态,开源可商用
萧箫 发自 凹非寺量子位 | 公众号 QbitAI首个中英双语的语音对话开源大模型来了!这几天,一篇关于语音-文本多模态大模型的论文出现在arXiv上,署名公司中出...
艾伦AI推出业界最大文本数据集,包含3万亿Tokens,超过Llama 2
迄今为止最大的开源文本数据集。编译 | 香草编辑 | 李水青智东西8月21日消息,艾伦AI研究所(AI2)于8月19日在其官方博客发布用于训练大型语言模型(LLM)的...