AI项目和框架

Kimi Latest

Kimi Latest是月之暗面Kimi推出的实时更新AI模型,为用户提供同步对标Kimi智能助手的模型体验。支持128k上下文长度,可根据输入自动选择8k、32k或128k模型进...
阅读原文

Omnitool

Omnitool是开源的AI桌面环境,为用户提供统一的交互界面,能快速接入和使用多种AI模型。Omnitool支持本地运行,能在Mac、Windows或Linux设备上安装,数据存储...
阅读原文

Qihoo-T2X

Qihoo-T2X 是360 AI 研究院和中山大学推出的基于代理标记化扩散 Transformer(PT-DiT)的高效多模态生成模型,Qihoo-T2X引入稀疏代理标记注意力机制,显著降...
阅读原文

Grok-3

Grok-3是埃隆·马斯克旗下xAI公司推出的最新一代人工智能模型,模型被马斯克称为“地球上最聪明的人工智能”,推理能力在多项基准测试中超越了包括ChatGPT和Deep...
阅读原文

LangFlow

LangFlow 是低代码、可视化的 AI 应用构建工具,用于快速搭建和实验 LangChain 流水线。通过拖拽式界面,用户能轻松创建复杂的 AI 工作流,无需编写大量代码...
阅读原文

SkyReels-A1

SkyReels-A1是昆仑万维开源的中国首个SOTA(State-of-the-Art)级别的基于视频基座模型的表情动作可控算法。SkyReels-A1能实现更精准可控的人物视频生成,能...
阅读原文

Mistral Saba

Mistral Saba 是法国 Mistral AI 推出的专注于中东和南亚地区语言及文化的区域定制 AI 模型。模型拥有 240 亿参数,规模虽小,在处理阿拉伯语和印度起源语言...
阅读原文

Finedefics

Finedefics 是北京大学彭宇新教授团队推出的细粒度多模态大模型,提升多模态大语言模型(MLLMs)在细粒度视觉识别(FGVR)任务中的表现。模型通过引入对象的...
阅读原文

Step-Audio

Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高...
阅读原文

Matrix3D

Matrix3D 是南京大学、苹果公司和香港科技大学合作推出的新型的统一摄影测量模型,能在一个模型中完成多个摄影测量子任务,包括姿态估计、深度预测和新视图合...
阅读原文

ImageRAG

ImageRAG 是基于检索增强生成(Retrieval-Augmented Generation, RAG)的图像生成技术,通过动态检索相关图像来提升文本到图像(T2I)模型生成罕见或未见概念...
阅读原文

X-R1

X-R1是基于强化学习的低成本训练框架,能加速大规模语言模型的后训练(Scaling Post-Training)开发。X-R1用极低的成本训练0.5B(5亿参数)规模的R1-Zero模型...
阅读原文

Step-Video-T2V

Step-Video-T2V 是阶跃星辰团队推出的开源文本到视频预训练模型,拥有 300 亿参数,能生成长达 204 帧的高质量视频。模型基于深度压缩的变分自编码器(Video-...
阅读原文

unsloth

unsloth 是开源的大型语言模型(LLM)微调工具,基于优化计算步骤和 GPU 内核,显著提升模型训练速度减少内存使用。Unsloth支持多种主流 LLM,如 Llama-3、Mi...
阅读原文

腾讯混元T1

T1(Thinker)是腾讯混元推出的最新深度思考模型,已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考,支持联网搜索功能,能从互联网信源、微信公众号、...
阅读原文