AI项目和框架 - 第 88 页

Qwen3

Qwen3 是阿里巴巴推出的新一代大型语言模型，Qwen3 支持“思考模式”和“非思考模式”两种工作方式，思考模式模型会逐步推理，经过深思熟虑后给出最终答案，适合...

阅读原文

AI工具

1年前 (2025)

ChatDLM

ChatDLM是 Qafind Labs推出的新一代对话生成大模型，核心定位是突破传统Transformer架构在长上下文处理与推理效率上的瓶颈。模型融合了“区块扩散（Block Diff...

阅读原文

AI工具

1年前 (2025)

DeepSeek-R1T-Chimera

DeepSeek-R1T-Chimera 是TNG科技公司推出的开源语言模型。结合 DeepSeek V3-0324 和DeepSeek R1两种模型的优势，基于创新的构建方法，将两者的神经网络组件融...

阅读原文

AI工具

1年前 (2025)

UniToken

UniToken 是新型的自回归生成模型，专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示，构建了一种统一的视觉编码框架，能同时捕捉图像的高级语义...

阅读原文

AI工具

1年前 (2025)

DreamO

DreamO 是字节跳动创作团队联合北京大学深圳研究生院电子与计算机工程学院联合推出的用在图像定制生成的统一框架，基于预训练的扩散变换器（DiT）模型实现多...

阅读原文

AI工具

1年前 (2025)

Spatial-RAG

Spatial-RAG（Spatial Retrieval-Augmented Generation）是美国埃默里大学、德克萨斯大学奥斯汀分校推出的用在提升大型语言模型（LLMs）空间推理能力的框架。...

阅读原文

AI工具

1年前 (2025)

Concept Lancet

Concept Lancet（CoLan）是宾夕法尼亚大学的研究团队推出的零样本、即插即用的图像编辑框架。Concept Lancet基于在潜在空间中对图像进行稀疏分解，将图像表示...

阅读原文

AI工具

1年前 (2025)

LangGraph WhatsApp Agent

LangGraph WhatsApp Agent 是基于 LangGraph 和 Twilio 构建的开源项目，用在开发与 WhatsApp 用户互动的 AI Agent。项目支持多代理架构和图谱处理，能处理文...

阅读原文

AI工具

1年前 (2025)

WebSSL

WebSSL（Web-scale Self-Supervised Learning）是Meta、纽约大学等机构推出的视觉自监督学习（SSL）系列模型，基于大规模网络数据（如数十亿图像）训练视觉模...

阅读原文

AI工具

1年前 (2025)

Paper2Code

Paper2Code 是韩国科学技术院和DeepAuto.ai联合推出的多 Agent 大语言模型（LLM）框架，支持将机器学习领域的科学论文自动转换为可运行的代码仓库。

阅读原文

AI工具

1年前 (2025)

EmaFusion

EmaFusion 是人工智能初创公司 Ema 推出的多模型融合技术，为企业级 AI 应用提供高效、灵活且低成本的解决方案。通过动态结合 100 多种语言模型，根据任务需...

阅读原文

AI工具

1年前 (2025)

Lyria 2

Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型，作为 Vertex AI 平台的核心组件，具备高保真音频生成能力，能输出 48kHz、24-bit 的专业级立体声音...

阅读原文

AI工具

1年前 (2025)

Firefly Image Model 4

Firefly Image Model 4 是 Adobe 最新推出的图像生成模型，是目前最快、最具控制性和最逼真的 Firefly 图像模型，支持生成逼真的图像，提供更高的分辨率（最...

阅读原文

AI工具

1年前 (2025)

Step1X-Edit

Step1X-Edit 是阶跃星辰团队推出的通用图像编辑框架，能缩小开源图像编辑模型与闭源模型（如 GPT-4o 和 Gemini2 Flash）之间的性能差距。Step1X-Edit结合多模...

AI工具

1年前 (2025)

LiveCC

LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型，基于自动语音识别（ASR）字幕进行大规模训练。LiveCC像专业解说员一样快速分析视...

阅读原文

AI工具

1年前 (2025)