AI工具

PartGen

PartGen是先进的3D对象生成和重建框架,是牛津大学的视觉几何小组和Meta AI共同推出的。PartGen能识别并生成由有意义部分组成的3D对象,3D对象能基于文本提示...
阅读原文

Vision Parse

Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且...
阅读原文

The Language of Motion

The Language of Motion是斯坦福大学李飞飞团队推出的多模态语言模型,能整合人类动作中的言语和非言语语言。模型能处理文本、语音和动作数据,生成对应的目...
阅读原文

Mathtutor on Groq

Mathtutor on Groq 是基于 Groq 架构的AI数学辅导工具,基于语音识别功能,支持用户用语音形式提出数学问题。工具内置强大的数学引擎,能实时计算并用 LaTeX ...
阅读原文

通义浏览器插件

通义浏览器插件是全能AI助手,提供实时语音识别、AI字幕翻译、智能总结等功能。适用于网课、追剧、线上会议等场景,帮助用户记录、翻译和总结信息。用户基于...
阅读原文

MuseGate

MuseGate是杭州霖润智能科技有限公司推出的AI智能化产品,专门服务于服饰企业。MuseGate基于生成式AI技术,能深度定制模特和场景,实现快速的服装搭配和尺寸...
阅读原文

星火标翼

星火标翼是科大讯飞推出的智能投标辅助工具,集标书知识构建、标书编写检查于一体的智能投标辅助应用。依托星火大模型解析投标所需资质、业绩、方案等内容,...
阅读原文

启元重症大模型

启元重症大模型是腾讯和迈瑞医疗联合发布的全球首个重症医疗大模型,专为ICU病房设计,解决重症监护中的痛点问题。模型整体参数量达到万亿级别,经过大量医学...
阅读原文

Poetry2Image

Poetry2Image是一个专为中文古诗词图像生成设计的迭代校正框架,哈尔滨工业大学提出。框架通过自动化的反馈和校正循环,增强了诗歌与图像之间的一致性,有效...
阅读原文

联通元景

联通元景(UniT2IXL)是中国联通AI推出的中文原生文生图模型,完全在国产昇腾AI基础软硬件平台上实现训练和推理。模型采用复合语言编码模块,优化中文长文本...
阅读原文

DiTCtrl

DiTCtrl是基于多模态扩散变换器(MM-DiT)架构的多提示视频生成方法,是香港中文大学和腾讯等机构联合推出的。DiTCtrl能在无需额外训练的情况下,实现多个文...
阅读原文

braintrust

braintrust是端到端平台,能帮助公司快速构建AI应用。基于迭代的大型语言模型(LLM)工作流程,让开发团队评估和预测模型表现,适应AI时代的开发生命周期。br...
阅读原文

Browserbase

Browserbase是为AI代理和应用程序设计的无头浏览器平台,即一种没有图形用户界面(GUI)的浏览器,能够加载和解析网页,执行JavaScript代码,及进行网络请求...
阅读原文

recurve

recurve(反曲)是AI驱动的DataOps平台,能简化企业的数据集成、设计和BI性能流程。recurve支持300多种数据连接器,覆盖数据库、文件、API等,实现数据的无缝...
阅读原文

AI Stick

AI Stick是联想集团推出的AI桌面助手“如意”,集成人工智能技术,AI Stick可以连接到多种设备上,如电脑、手机等。AI Stick搭载了豆包大模型,提供了AI搜索、A...
阅读原文