AnimateAnything:创新统一可控视频生成技术提升内容创作效率

AnimateAnything是浙江大学和北京航空航天大学研究者推出的统一可控视频生成技术。AnimateAnything能精确操作视频,包括控制相机轨迹、文本提示和用户动作注...
阅读原文

抖音AI分身:打造你的虚拟分身,开启创作新纪元的AI工具

抖音AI分身是抖音“V项目”中专为创作者推出的AI虚拟分身工具,支持创作者培养与自己性格和思维习惯相似的虚拟分身,与用户进行互动。抖音AI分身基于豆包大模型...
阅读原文

RAG-Diffusion:区域感知文本到图像生成技术的创新应用与优势分析

RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段,实现对图像中各个区域的精确控制和细节优化。RAG-Diff...
阅读原文

FitDiT:腾讯与复旦携手打造的高保真虚拟试穿技术实现无缝体验与精准匹配

FitDiT是高保真虚拟试穿技术,是腾讯和复旦大学联合推出的。基于Diffusion Transformers(DiT)关注高分辨率特征,提升服装细节的呈现。FitDiT用服装纹理提取...
阅读原文

口语达人:游戏化学习助力口语能力飞跃提升

口语达人是专为非英语国家人士设计的英语学习应用,旨在帮助用户提升英语口语能力。通过游戏化的学习方式,将日常生活场景划分为多个单元,涵盖旅行、购物、...
阅读原文

桐小乌:桐乡市AI智能助手助力便民服务提升生活效率

桐小乌是桐乡市人民政府与支付宝合作推出的智能体,国内首个集会务与文旅服务于一体的智能助手。为2024年世界互联网大会参会者和乌镇游客提供全面的服务,包...
阅读原文

Copilot Actions:微软推出智能助手简化重复任务,提高工作效率

Copilot Actions 是微软在 Ignite 大会上推出的 Microsoft 365 Copilot一项新功能,支持用户用简单的提示自动完成日常的重复性任务,如总结 Teams 会议、生成...
阅读原文

闪令:沉浸式角色扮演与剧情探索的无限可能

闪令是互动内容社交平台,为年轻人打造的AI剧情社区。用户进行高自由度的角色扮演和剧情体验,选择古风、同人、穿越等多种剧情故事。闪令提供有声互动和情感...
阅读原文

Documind:高效PDF转图像工具助力结构化数据提取

Documind是开源的AI文档处理工具,能从PDF文档中提取结构化数据。Documind具备将PDF转换为图像、用OpenAI API进行信息提取,根据用户定义的模式格式化输出结...
阅读原文

MARS:提升大模型训练效率的字节优化框架解析

MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MARS融合预条件梯度方法与方差减少技术,基于缩放随机递归...
阅读原文

Verifier Engineering:创新后训练范式推动产品智能化与个性化升级

Verifier Engineering(验证器工程)是中国科学院、阿里巴巴和小红书联合推出的新型后训练范式,为基础模型设计,解决提供有效监督信号的挑战。Verifier Engi...
阅读原文

从深度学习到大模型:探索医学AI的前沿突破与创新之旅

2024中国生成式AI大会(上海站)12月5-6日举办~
阅读原文