AI工具
开源漫画图片文字翻译工具,多语言翻译无缝嵌入原图
Manga Image Translator是开源的漫画图片文字翻译工具,能一键翻译漫画和图片中的文字。Manga Image Translator基于OCR技术识别文本,结合机器翻译将文字转换...
AI试卷识别处理软件,具备高清扫描、手写擦除、试卷还原等功能
拍试卷是为学生和教师设计的试卷扫描和处理软件。拍试卷基于OCR(光学字符识别)技术,从图片中提取文字变得快速和准确,保持原有的排版格式。拍试卷具备高清...
AI Safeguard联合卡内基梅隆和斯坦福开源的轻量级多模态模型
Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI模型,专为移动端和边缘设备设计。模型拥有3B参数量,相较于其他多模态大模型,显...
清华和腾讯共同推出的图像序列着色模型
ColorFlow是清华大学和腾讯ARC实验室共同推出的图像序列着色模型,能精细化地保持图像序列中个体身份的同时进行着色。基于检索增强、上下文学习和超分辨率技...
集成多种社交媒体和通讯渠道的 AI 自动化客户管理工具
Superchat是企业级全渠道消息服务平台,帮助企业整合WhatsApp、Instagram、Facebook Messenger 等渠道建立忠实的客户关系、自动化发送新闻通讯、销售产品并回...
AI全栈开发平台,自然对话快速构建网站和Web应用
Lovable 是AI全栈工程师工具,基于自然语言处理技术,让用户能用对话快速构建网站和Web应用程序。Lovable 平台支持与Supabase集成,实现数据库连接和用户认证...
AI工作流可视化构建器,拖放节点设计复杂工作流
NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型,基于简单、可视化的界面,让用户无需编码即可快速原型设计和测试。NodeTool支持在...
中科院联合多所高校机构推出增强多模态音乐生成的框架
VMB(Visuals Music Bridge)是中国科学院信息工程研究所、中国科学院大学网络空间安全学院、上海人工智能实验室、上海交通大学等机构推出的多模态音乐生成框...
AI营销平台,分析数据快速生成个性化的营销活动
ZEPIC是AI驱动自动化营销平台。基于统一数据和渠道,帮助营销人员建立更深层次的客户联系。平台的核心是AI引擎Zenie,提供从数据管理到活动交付的端到端营销...
微软联合清华推出的多模态生成模型
LatentLM是微软研究院和清华大学共同推出的多模态生成模型,能统一处理离散数据(如文本)和连续数据(如图像、音频)。模型用变分自编码器(VAE)将连续数据...
Lyra:提升多模态交互体验的SmartMore创新解决方案
Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多...
AI服装设计工具,覆盖设计核心环节款式生成、局部优化等功能
潮际主设是AI时尚设计工具,专为服装设计师、时尚从业者和创意人士打造。基于AI技术赋能设计流程,从灵感生成到细节优化,提高设计效率,激发创意。潮际主设...
Large Action Models:微软行动大模型开发框架助力高效智能应用构建与部署
Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large Language Models,大型语言模型)...