标签:自然语言处理

Perplexity Deep Research

Perplexity Deep Research 是 AI 搜索引擎 Perplexity 推出的免费深度研究工具,通过强大的 AI 技术为用户提供全面且高效的研究报告。能执行数十次搜索,阅读...
阅读原文

Long-VITA

Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源的多模态模型,能处理超过100万tokens的长文本输入,在短文本任务中表现出色。Long-VITA基于分阶段训练...
阅读原文

NobodyWho

NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户无需联网即可使用...
阅读原文

TIGER

TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction Network)是清华大学研究团队提出的轻量级语音分离模型,通过时频交叉建模策略,结...
阅读原文

AnyCharV

AnyCharV 是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目标驱动视频相结合,生成高质量的角...
阅读原文

Sa2VA

Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。S...
阅读原文

WebLI-100B

WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数据集的扩展版本,基于从网...
阅读原文

OpenThinker-32B

OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型,拥有 328 亿参数,支持 16,000 token 的上下文长度。模型仅使用 114k 数据...
阅读原文

GAS

GAS(Generative Avatar Synthesis from a Single Image)是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研究人员提出的从单张图像生成高质量、视角一...
阅读原文

Readdy

Readdy 是基于AI技术的产品设计工具,能将用户的想法快速转化为精美的设计稿,生成能直接使用的前端代码。用户只需用自然语言描述需求,Readdy 能在几分钟内...
阅读原文

RWKV-7-2.9B

RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练,具有 29 亿参数,支持世界所有语言。模型...
阅读原文

potpie.ai

potpie.ai 是开源平台,基于AI技术为代码库创建定制化的工程代理(Agents)。potpie.ai基于构建代码库的知识图谱,深度理解代码组件之间的关系,实现自动化代...
阅读原文

华为小艺

华为小艺是华为推出的小艺AI助手网页端,用户可以通过浏览器直接访问使用。适配了手机和PC布局,提供多种功能,包括AI问答、AI写作、编程助手和AI翻译等。小...
阅读原文

Zyler AI

Zyler AI 是专注于营销分析的人工智能平台,帮助企业和专业人士快速生成高质量的分析报告。通过一键集成 Google Analytics、Meta Ads 等主流数据源,基于强大...
阅读原文

TPO

TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言模型输出进行动态优化,更符合人类偏好。TPO通过将奖励信号转化为文本反馈,...
阅读原文
18910111257