标签:自然语言处理

Cooraft

Cooraft是一款基于AI技术,将普通照片转化为具有创意和艺术性的动画和渲染图的应用程序。Cooraft提供多种艺术风格,如3D卡通、经典绘画等,一键将自拍或日常...
阅读原文

MM1.5

MM1.5是苹果公司推出的多模态大型语言模型,旨在增强文本丰富图像理解、视觉指代和定位以及多图像推理能力。模型基于数据为中心的训练方法,在大规模预训练、...
阅读原文

揽睿星舟

揽睿星舟是一个云端AI训推一体算力平台,由翼方健数自主研发。提供高性价比的GPU计算资源、开箱即用的训推环境及AI工具链,旨在解决AI协作过程中的安全信任问...
阅读原文

Surya

Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序...
阅读原文

Loong

Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语言模型(LLM...
阅读原文

MLE-bench

MLE-bench 是 OpenAI 推出的一个基准测试工具,旨在衡量AI代理(AI Agent)在机器学习工程任务中的表现。测试包含75个来自 Kaggle 的竞赛任务,覆盖自然语言...
阅读原文

LightRAG

LightRAG是由香港大学研究团队推出的一种检索增强生成(Retrieval-Augmented Generation, RAG)系统,基于整合图结构索引和双层检索机制,提升大型语言模型在...
阅读原文

T2V-Turbo

T2V-Turbo是一种先进的文本到视频生成模型,由Google、UC Santa Barbara(加利福尼亚大学圣塔芭芭拉分校)、和University of Waterloo(滑铁卢大学)的研究人...
阅读原文

OpenR

OpenR是一个由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合开源的全链条训练框架,旨在提升大型语言模型(LLM)的复...
阅读原文

Agent-S

Agent-S 是创新的代理框架,旨在基于图形用户界面(GUI)实现人机交互的自动化。Agent-S 基于模拟人类的操作方式,用鼠标和键盘直接与计算机交互,处理复杂的...
阅读原文

Voiceflow

Voiceflow是一个无代码对话式人工智能平台,旨在帮助用户快速创建和部署AI代理,以自动化客户服务和提升用户体验。通过直观的拖放界面,用户可以设计复杂的对...
阅读原文

scenario

scenario是一个专为游戏开发者设计的AI平台,基于先进的人工智能技术,可以帮助用户快速生成风格一致且高质量的游戏资产,如角色、场景和道具等。用户可以上...
阅读原文

fal

al是一个面向开发者的AI平台,专注于生成音频、视频和图像。fal提供高性能的推理引擎,支持实时应用,采用灵活的按需付费模式。fal支持跨平台集成,提供实时...
阅读原文

PodLM

PodLM是一款创新的AI播客生成器,基于先进的AI技术,让用户能轻松地将网页内容、文本或文档转换成高质量的播客节目。工具提供一个用户友好的界面,没有音频制...
阅读原文

Baichuan-Omni

Baichuan-Omni 是由百川智能推出的一款开源的 7B 多模态大型语言模型(MLLM),能同时处理和分析图像、视频、音频和文本等多种模态的数据。Baichuan-Omni 提...
阅读原文
1383940414249