标签:自然语言处理

Loong

Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语言模型(LLM...
阅读原文

MLE-bench

MLE-bench 是 OpenAI 推出的一个基准测试工具,旨在衡量AI代理(AI Agent)在机器学习工程任务中的表现。测试包含75个来自 Kaggle 的竞赛任务,覆盖自然语言...
阅读原文

LightRAG

LightRAG是由香港大学研究团队推出的一种检索增强生成(Retrieval-Augmented Generation, RAG)系统,基于整合图结构索引和双层检索机制,提升大型语言模型在...
阅读原文

T2V-Turbo

T2V-Turbo是一种先进的文本到视频生成模型,由Google、UC Santa Barbara(加利福尼亚大学圣塔芭芭拉分校)、和University of Waterloo(滑铁卢大学)的研究人...
阅读原文

OpenR

OpenR是一个由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合开源的全链条训练框架,旨在提升大型语言模型(LLM)的复...
阅读原文

Agent-S

Agent-S 是创新的代理框架,旨在基于图形用户界面(GUI)实现人机交互的自动化。Agent-S 基于模拟人类的操作方式,用鼠标和键盘直接与计算机交互,处理复杂的...
阅读原文

Voiceflow

Voiceflow是一个无代码对话式人工智能平台,旨在帮助用户快速创建和部署AI代理,以自动化客户服务和提升用户体验。通过直观的拖放界面,用户可以设计复杂的对...
阅读原文

scenario

scenario是一个专为游戏开发者设计的AI平台,基于先进的人工智能技术,可以帮助用户快速生成风格一致且高质量的游戏资产,如角色、场景和道具等。用户可以上...
阅读原文

fal

al是一个面向开发者的AI平台,专注于生成音频、视频和图像。fal提供高性能的推理引擎,支持实时应用,采用灵活的按需付费模式。fal支持跨平台集成,提供实时...
阅读原文

PodLM

PodLM是一款创新的AI播客生成器,基于先进的AI技术,让用户能轻松地将网页内容、文本或文档转换成高质量的播客节目。工具提供一个用户友好的界面,没有音频制...
阅读原文

Baichuan-Omni

Baichuan-Omni 是由百川智能推出的一款开源的 7B 多模态大型语言模型(MLLM),能同时处理和分析图像、视频、音频和文本等多种模态的数据。Baichuan-Omni 提...
阅读原文

VAPI

VAPI是一个为开发者设计的语音AI平台,基于提供简单易用的API,让开发者快速将语音识别和语音合成功能集成到各种应用中。VAPI 基于先进的机器学习技术,确保...
阅读原文

podlm-public

podlm-public是一个开源AI播客工具,旨在创建一个中文版的NotebookLM替代品,专门用在将任意URL转换成播客内容,再推送到小宇宙平台。项目基于先进的AI技术,...
阅读原文

Langotalk

Langotalk是一个创新的在线语言学习平台,基于AI技术为语言学习者提供个性化和沉浸式的学习体验。平台支持20多种语言,如英语、西班牙语、法语、德语、意大利...
阅读原文

textomap

textomap是一个创新的智能在线工具,能将文本内容快速转换成交互式地图。用户输入基于位置的文本,比如旅游行程、博客文章或新闻报道,textomap能自动识别地...
阅读原文
1131415161723