AI工具
Vision Parse
Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且...
The Language of Motion
The Language of Motion是斯坦福大学李飞飞团队推出的多模态语言模型,能整合人类动作中的言语和非言语语言。模型能处理文本、语音和动作数据,生成对应的目...
Mathtutor on Groq
Mathtutor on Groq 是基于 Groq 架构的AI数学辅导工具,基于语音识别功能,支持用户用语音形式提出数学问题。工具内置强大的数学引擎,能实时计算并用 LaTeX ...
Poetry2Image
Poetry2Image是一个专为中文古诗词图像生成设计的迭代校正框架,哈尔滨工业大学提出。框架通过自动化的反馈和校正循环,增强了诗歌与图像之间的一致性,有效...
braintrust
braintrust是端到端平台,能帮助公司快速构建AI应用。基于迭代的大型语言模型(LLM)工作流程,让开发团队评估和预测模型表现,适应AI时代的开发生命周期。br...
Browserbase
Browserbase是为AI代理和应用程序设计的无头浏览器平台,即一种没有图形用户界面(GUI)的浏览器,能够加载和解析网页,执行JavaScript代码,及进行网络请求...
粤公网安备 44011502001135号