AI项目和框架
MIP-Adapter
MIP-Adapter是一种个性化图像生成技术,由阿里巴巴集团推出并开源。基于IP-Adapter模型,进一步扩展其能力,支持同时处理多个参考图像,生成更准确和高质量的...
CapsWriter-Offline
CapsWriter-Offline是一款高效的PC端离线语音输入和字幕转录工具,支持用户通过简单的按键操作实现实时语音转文字。软件适合快速记录和转写大量语音信息的场...
HelloBench
HelloBench是一个用于评估大型语言模型(LLMs)长文本生成能力的开源基准测试。HelloBench包含五个基于布鲁姆分类法的子任务:开放式问答、摘要、聊天、文本...
VirtualWife
VirtualWife是一个创新的虚拟数字人项目,专注于开发具有AI的虚拟角色。角色设计用于在B站等直播平台上进行互动,提供娱乐和信息。通过集成先进的AI技术,如...
ChopperBot
ChopperBot是一款智能化的直播视频剪辑和发布机器人,ChopperBot能自动化地管理和分发直播内容。支持多个流行直播平台,如斗鱼、虎牙、B站、抖音和Twitch等,...
VideoLingo
VideoLingo 是一款一键全自动视频翻译工具,能将视频进行字幕切割、翻译、对齐和配音,最终生成 Netflix 级别的字幕和配音。VideoLingo 基于自然语言处理(NL...
ScribbleDiff
ScribbleDiff是一种先进的文本到图像生成技术,基于用户简单涂鸦的视觉提示指导图像的生成过程。通过分析涂鸦确保生成的图像中的对象方向与用户涂鸦的方向一...
LiveKit Agents
LiveKit Agents 是一个强大的框架,用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。框架支持 Python 编程,简化开发过程,支持开发者轻松集成...
Matryoshka Diffusion Models
Matryoshka Diffusion Models(MDM)是苹果公司推出的一种创新的扩散模型,主要用于生成高分辨率图像和视频。MDM通过多分辨率扩散过程,在不同尺度上同时进行...