标签：文字

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

微信公众号悄悄上线AI音色克隆，微信的一小步，却是AI的一大步。

大数据文摘受权转载自数字生命卡兹克作者：卡兹克这篇文章，可能是我有史以来最特殊的一篇文章。因为当你点开右上角的三个点，点击听全文的时候。可能你...

阅读原文

AIGC动态

2年前 (2024)

智能眼镜这个被忽略的功能，他们已经离不开了

字幕是一种权利字幕，已经成了现代人的「外挂」。通勤嘈杂，摸鱼易露馅，学习会分心，听和看并用，才能避免进度条白白走了冤枉路。然而，对一些人来说，字...

阅读原文

AIGC动态

2年前 (2024)

PPT 满屏文字？救星来了！这款神器帮你一键生成专业插图！

都说一图胜千言，但你是否经常遇到这样的场景：工作汇报、 PPT花了你大半天时间，上面的文字仍然堆积如山，网上又很难找到贴合你内容的图片，而自己设计一个...

阅读原文

AIGC动态

2年前 (2024)

Voice-first，闭关做一款语音产品的思考

三个月前我在硅谷沉浸式泡了两个多月把产品上的整体感受和几个趋势简短写在了这里，在和不同的创业者交流研究了 40 多个产品后，最终回归到了“语音”这个方向...

阅读原文

AIGC动态

2年前 (2024)

大神卡帕西安利爆火AI应用，称「或是下一个ChatGPT」

衡宇发自凹非寺量子位 | 公众号 QbitAI大神卡帕西墙裂推荐！甚至预言这个AI应用，有可能开启「和ChatGPT一样大的机会」。它就是来自谷歌的实验性AI产品，...

阅读原文

AIGC动态

2年前 (2024)

阿里8B模型拿下多页文档理解新SOTA，324个视觉token表示一页，缩减80%

mPLUG团队投稿量子位 | 公众号 QbitAI高效多页文档理解，阿里通义实验室mPLUG团队拿下新SOTA。最新多模态大模型mPLUG-DocOwl 2，仅以324个视觉token表示单...

阅读原文

AIGC动态

2年前 (2024)

文字生成秒杀MJ，AI绘图Ideogram 2.0发布，做海报稳了

大半夜的，可能是我认为做海报、做 logo、做文字最猛的 AI 绘图产品，Ideogram，更新了他们的 2.0 版本。把文字嵌入和整个图片的美学质量，又一次推上了巅峰...

阅读原文

AIGC动态

2年前 (2024)

文生视频又开始卷了！Runway、Luma、DeepMind 都有重磅更新

引领了 2024 年文生视频热潮的 Sora，至今没有正式对外开放使用，而其他的文生视频产品，在这半年内开始了疯狂进化。上周，Luma AI 发布的 Dream Machine 让...

阅读原文

AIGC动态

2年前 (2024)

最高可得 300 元现金！分享实操经验，即可轻松获得奖励

OpenBayes贝式计算平台第二期「创作者激励计划」上线啦，快来和 HyperAI超神经一起参加吧！无论你是深度学习、数据科学或大模型的资深玩家，还是刚入门技术...

阅读原文

AIGC动态

2年前 (2024)

ICDAR24 历史地图文字识别比赛欢迎参与

你是否曾经想过，那些尘封在历史长河中的珍贵地图，记录着多少不为人知的故事和秘密？而上面的文字，往往因为岁月的侵蚀而变得模糊不清，难以辨认。但如今，...

阅读原文

AIGC动态

2年前 (2024)

阿里7B多模态文档理解大模型拿下新SOTA｜开源

mPLUG团队投稿量子位 | 公众号 QbitAI多模态文档理解能力新SOTA！阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5，针对高分辨率图片文字识别、通用文档结...

阅读原文

AIGC动态

2年前 (2024)

打败 Midjourney，这个 Google 大牛推出的 AI 产品凭什么弯道超车

这可能是最懂文字的AI模型没有谁能一直称王，但加上前缀谁都有称王的机会。 AI 文生图，还能玩出什么新花样？在这片群雄割据的红海，头部被 Midjourney、D...

阅读原文

AIGC动态

2年前 (2024)

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3！5亿融资Karpathy都投了

新智元报道编辑：润好困【新智元导读】Ideogram凭借不输Midjourney的生图能力和遥遥领先的图片中文字渲染能力，获得了包括Jeff Dean和Karpathy在内一众大佬...

阅读原文

AIGC动态

2年前 (2024)

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

机器之心专栏机器之心编辑部2023 年我们正见证着多模态大模型的跨越式发展，多模态大语言模型（MLLM）已经在文本、代码、图像、视频等多模态内容处理方面表...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

白交丰色发自凹非寺量子位 | 公众号 QbitAIStable Diffusion 3，它终于来了！足足酝酿一年之多，相比上一代一共进化了三大能力。来，直接上效果！首先...

阅读原文

AIGC动态

2年前 (2024)