标签:多语言支持

Lingua

Lingua 是 Meta AI推出的一个轻量级且独立的代码库,旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件,便于研究人员尝试新的模型架构、损失函数和...
阅读原文

ComfyGen

ComfyGen是由NVIDIA和特拉维夫大学研究人员推出的一种文本到图像生成系统,基于大型语言模型(LLM)自动创建与用户文本提示相匹配的工作流,提升图像生成的质...
阅读原文

PDFtoChat

PDFtoChat 是一个开源的创新AI项目,支持用户基于自然语言对话的方式与 PDF 文件互动。工具基于最新的 AI 技术,包括 Together AI 和 Mixtral,理解用户的查...
阅读原文

Napkins.dev

Napkins.dev是一个创新的开源项目,基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。该、项目背后依托于Meta的Llama 3.1 405B大型语言模型和...
阅读原文

Flair.ai

Flair.ai 是一款基于AI技术帮助用户创建高质量产品摄影图的在线设计工具。支持用户与团队成员实时协作,用拖放功能添加产品、道具和3D资产,调整光线和相机角...
阅读原文

Sekai

Sekai是一个创新的AI驱动的交互式内容平台,旨在基于结合社交和游戏元素,创造出全新的互动体验。用户能在Sekai上创建自己的虚拟角色,与他人互动。平台提供...
阅读原文

Fluid

Fluid是由Google DeepMind和MIT共同推出的文本到图像的自回归生成模型,基于连续标记和随机生成顺序的方法,在视觉质量和评估性能上取得突破性进展。模型在扩...
阅读原文

SaRA

SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基...
阅读原文

Promptopia

Promptopia 是由 Readyverse Studios 发布的一款生成式 AI 创作工具,帮助玩家通过简单的文本提示来创建沉浸式的游戏环境和数字资产。工具结合了多人游戏玩法...
阅读原文

Granite 3.0

Granite 3.0 是 IBM 推出的一系列先进的AI模型,能在多个学术和企业基准测试中展现出卓越的性能。模型设计用在企业级应用,能执行各种任务,包括文本生成、分...
阅读原文

OmniAI

OmniAI是一个强大的AI文档处理平台,基于先进的OCR技术,支持对PDF、DOCX、图片等多种文件格式进行快速处理和数据提取。平台支持用户轻松创建文档处理管道,...
阅读原文

ssemble

ssemble是一款运用人工智能技术的在线视频编辑平台,能将长视频智能切割成适合短视频平台的内容。通过AI驱动的内容识别,ssemble快速定位视频中的高光时刻,...
阅读原文

星火插件

星火插件是科大讯飞推出的基于星火大模型的浏览器扩展工具,集成讯飞星火V4.0的AI能力,用极小的内存占用兼容主流浏览器。插件让用户能进行划词搜索、翻译、...
阅读原文

Mochi 1

Mochi 1是Genmo公司推出的开源视频生成模型,在动作质量和遵循用户提示方面表现出色。Mochi 1基于Apache 2.0许可证发布,支持个人和商业用途的免费使用。模型...
阅读原文

Janus

Janus是一个由DeepSeek AI推出的自回归框架,旨在统一多模态理解和生成任务。将视觉编码分离成不同的路径解决以往方法的局限性,且用单一的变换器架构进行处...
阅读原文
1161718192026