AI工具

Moonshine

Moonshine是专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景,例如现场转录和语音命令识别。Moonshin...
阅读原文

Time-MoE

Time-MoE是创新的时间序列基础模型,基于混合专家(Mixture of Experts, MoE)架构,将时间序列预训练模型的参数规模扩展至十亿级别。模型用稀疏激活机制,在...
阅读原文

Whispo

Whispo是AI驱动的语音转录工具,支持用户按住Ctrl键录制语音,在释放键时自动将转录的文本插入到正在用的任何支持文本输入的应用程序中。工具的数据处理完全...
阅读原文

AutoGLM-Web

AutoGLM-Web是模拟用户操作的智能浏览器助手,基于大型语言模型构建,能执行网页访问、信息检索、内容总结等任务。基于简单的文字或语音指令,AutoGLM-Web能...
阅读原文

OmniGen

OmniGen是用于统一图像生成的新扩散模型,能在单一框架内处理多种图像生成任务,如文本到图像的生成、图像编辑、主题驱动生成和视觉条件生成等。OmniGen涉及...
阅读原文

CogAgent

CogAgent是清华大学与智谱AI联合推出的多模态视觉大模型,专注于图形用户界面(GUI)的理解和导航。通过视觉模态对GUI界面进行感知,非传统的文本模态,更符...
阅读原文

OMNE Multiagent

OMNE Multiagent是天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)推出的大模型多智能体框架。基于长期记忆(Long Term Memory, LTM)构建,...
阅读原文

135小红书排版

135小红书排版是AI驱动的内容创作和排版工具,能帮助用户在小红书平台上优化笔记排版,轻松打造爆款内容。135小红书排版基于AI绘图、AI创作、一键生成等功能...
阅读原文

创音岛

创音岛是集录音转文字、配音和AI写歌于一体的音乐创作平台。支持将音频快速转换为文字,便于用户在会议、演讲等场合快速记录信息。创音岛提供多种音色和参数...
阅读原文

DuoAttention

DuoAttention是新型的框架,由MIT韩松团队提出,用在提高大型语言模型(LLMs)在处理长上下文时的推理效率。基于区分“检索头”和“流式头”两种注意力头,优化模...
阅读原文

dorik

dorik是一个基于AI技术的网站构建平台,支持用户用简单的提示快速创建美观且功能齐全的网站,无需任何编码或设计经验。平台提供白标CMS、网站构建器、博客平...
阅读原文

Chatsimple

Chatsimple是一个AI Copilot Chatbot构建平台,旨在帮助企业基于AI技术提升客户体验和参与度。Chatsimple提供先进的自然语言处理和机器学习算法,让企业能创...
阅读原文

Voice Design

Voice Design是ElevenLabs推出的AI语音生成工具,用户只需描述所需声音的年龄、口音、性别、语调或音高,甚至是虚构角色如精灵、食人魔等,工具能快速生成独...
阅读原文

HuggingChat macOS

HuggingChat macOS是Hugging Face推出的开源聊天应用程序,专为macOS用户设计,基于强大的开源语言模型,将先进的AI对话能力直接带到用户的桌面上。应用支持...
阅读原文

OmniParser

OmniParser是微软研究院推出的屏幕解析工具,将用户界面的屏幕截图转换成结构化数据。工具专门设计用在提高基于大型语言模型(如GPT-4V)的UI代理系统的性能...
阅读原文