标签：图像

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

Mistral放大招：124B多模态，Canvas、搜索、图片生成免费用

Mistral AI终于放大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图...

阅读原文

AIGC动态

2年前 (2024)

超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

大会预告12月5-6日，智猩猩共同主办的2024中国生成式AI大会（上海站）将举办。北大（临港）大模型对齐中心执行主任徐骅，腾讯优图实验室天衍研究中心负责人吴...

阅读原文

AIGC动态

2年前 (2024)

多模态竞技场对标90B Llama 3.2！Pixtral 12B技术报告全公开

新智元报道编辑：alan 【新智元导读】以开源极客之姿杀入江湖的Mistral AI，在9月份甩出了自家的首款多模态大模型Pixtral 12B，如今，报告之期已至，技术细节...

阅读原文

AIGC动态

2年前 (2024)

发力了，Mistral对标ChatGPT全面升级le Chat，还祭出超大杯多模态模型

机器之心报道编辑：蛋酱、陈陈一觉醒来，Mistral AI 又发力了。就在今天，Mistral AI 多模态家族迎来了第二位成员：一个名为 Pixtral Large 的超大杯基础模...

阅读原文

AIGC动态

2年前 (2024)

AI一键解析九大生物医学成像模式，用户只需文字prompt交互，微软UW等新研究登Nature Methods

BiomedParse团队投稿量子位 | 公众号 QbitAI用AI大模型一键解析MRI、CT和病理学等九大生物医学成像模式。不仅复杂、不规则形状对象能高精度识别：而且通过...

阅读原文

AIGC动态

2年前 (2024)

攻克OCR手写识别难点！InkSight教程上线，实现高精度转写；iNatSounds数据集发布，含23万自然物种音频

手写记录是许多人在日常生活中记录灵感的方式，但如何高效地将手写内容转化为电子文本一直是一大挑战。传统的 OCR（光学字符识别）技术在处理复杂背景或不规...

阅读原文

AIGC动态

2年前 (2024)

从未见过现实世界数据，MIT在虚拟环境中训练出机器狗，照样能跑酷

机器之心报道编辑：杜伟如今，机器人学习最大的瓶颈是缺乏数据。与图片和文字相比，机器人的学习数据非常稀少。目前机器人学科的主流方向是通过扩大真实世界...

阅读原文

AIGC动态

2年前 (2024)

视频大模型无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS

克雷西发自凹非寺量子位 | 公众号 QbitAIDon’t look twice！把连续相同的图像块合并成一个token，就能让Transformer的视频处理速度大幅提升。卡内基梅隆...

阅读原文

AIGC动态

2年前 (2024)

深度解析Recraft V3：突破文本渲染限制，「文生图」黑马是怎样炼成的？

新智元报道编辑：LRST 【新智元导读】Recraft团队通过结合TextDiffuser-2技术和自训练的大型语言模型，提升了文本到图像渲染的质量和准确性，不过现有模型在...

阅读原文

AIGC动态

2年前 (2024)

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL！

新智元报道编辑：LRST 【新智元导读】刚刚，一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布，标志着图像生成即将进...

阅读原文

AIGC动态

2年前 (2024)

开源版SearchGPT来了，两张3090就可复现，超越Perplexity付费版

VSA团队投稿量子位 | 公众号 QbitAIOpenAI推出SearchGPT没几天，开源版本也来了。港中文MMLab、上海AI Lab、腾讯团队简易实现了Vision Search Assistant，...

阅读原文

AIGC动态

2年前 (2024)

真·打字P图！字节发布新模型SeedEdit，一句话爆改世界名画，可免费体验

机器之心原创作者：泽南、杨文一句话实时P图，网友又能整活了。字节豆包大模型又又又上新了！ 11 月 11 日，字节跳动豆包大模型团队推出了最新图像编辑模型 ...

阅读原文

AIGC动态

2年前 (2024)

当视觉大模型陷入认知失调，马里兰大学构建了一个幻觉自动生成框架

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

AI有鼻子了，还能远程传输气味，图像生成香水

机器之心报道编辑：Panda、张倩众所周知，图像、音乐能用 AI 生成，但出乎意料的是，气味也行。最近，一个名叫 Osmo 的初创公司宣布，他们成功地将气味数字...

阅读原文

AIGC动态

2年前 (2024)

评估大模型不看输出看「内在」，上交大新测试指标入选NeurIPS 2024

上交大MIFA实验室魏来投稿量子位 | 公众号 QbitAI能够深入大模型内部的新评测指标来了！上交大MIFA实验室提出了全新的大模型评估指标Diff-eRank。不同于...

阅读原文

AIGC动态

2年前 (2024)

12 3…48