标签:文字
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
智能眼镜这个被忽略的功能,他们已经离不开了
字幕是 一种 权利字幕,已经成了现代人的「外挂」。通勤嘈杂,摸鱼易露馅,学习会分心,听和看并用,才能避免进度条白白走了冤枉路。 然而,对一些人来说,字...
PPT 满屏文字? 救星来了!这款神器帮你一键生成专业插图!
都说一图胜千言,但你是否经常遇到这样的场景:工作汇报、 PPT花了你大半天时间,上面的文字仍然堆积如山,网上又很难找到贴合你内容的图片,而自己设计一个...
Voice-first,闭关做一款语音产品的思考
三个月前我在硅谷沉浸式泡了两个多月把产品上的整体感受和几个趋势简短写在了这里,在和不同的创业者交流研究了 40 多个产品后,最终回归到了“语音”这个方向...
大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」
衡宇 发自 凹非寺量子位 | 公众号 QbitAI大神卡帕西墙裂推荐! 甚至预言这个AI应用,有可能开启「和ChatGPT一样大的机会」。 它就是来自谷歌的实验性AI产品,...
阿里8B模型拿下多页文档理解新SOTA,324个视觉token表示一页,缩减80%
mPLUG团队 投稿量子位 | 公众号 QbitAI高效多页文档理解,阿里通义实验室mPLUG团队拿下新SOTA。 最新多模态大模型mPLUG-DocOwl 2,仅以324个视觉token表示单...
文字生成秒杀MJ,AI绘图Ideogram 2.0发布,做海报稳了
大半夜的,可能是我认为做海报、做 logo、做文字最猛的 AI 绘图产品,Ideogram,更新了他们的 2.0 版本。 把文字嵌入和整个图片的美学质量,又一次推上了巅峰...
文生视频又开始卷了!Runway、Luma、DeepMind 都有重磅更新
引领了 2024 年文生视频热潮的 Sora,至今没有正式对外开放使用,而其他的文生视频产品,在这半年内开始了疯狂进化。 上周,Luma AI 发布的 Dream Machine 让...
最高可得 300 元现金!分享实操经验,即可轻松获得奖励
OpenBayes贝式计算平台第二期「创作者激励计划」上线啦,快来和 HyperAI超神经一起参加吧! 无论你是深度学习、数据科学或大模型的资深玩家,还是刚入门技术...
ICDAR24 历史地图文字识别比赛欢迎参与
你是否曾经想过,那些尘封在历史长河中的珍贵地图,记录着多少不为人知的故事和秘密?而上面的文字,往往因为岁月的侵蚀而变得模糊不清,难以辨认。但如今,...
阿里7B多模态文档理解大模型拿下新SOTA|开源
mPLUG团队 投稿量子位 | 公众号 QbitAI多模态文档理解能力新SOTA! 阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结...
打败 Midjourney,这个 Google 大牛推出的 AI 产品凭什么弯道超车
这可能是 最懂文字 的AI模型没有谁能一直称王,但加上前缀谁都有称王的机会。 AI 文生图,还能玩出什么新花样? 在这片群雄割据的红海,头部被 Midjourney、D...
全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了
新智元报道编辑:润 好困 【新智元导读】Ideogram凭借不输Midjourney的生图能力和遥遥领先的图片中文字渲染能力,获得了包括Jeff Dean和Karpathy在内一众大佬...
能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了
机器之心专栏 机器之心编辑部2023 年我们正见证着多模态大模型的跨越式发展,多模态大语言模型(MLLM)已经在文本、代码、图像、视频等多模态内容处理方面表...
Stable Diffusion 3更多隐藏功能曝光:文字可更改图片细节
白交 丰色 发自 凹非寺量子位 | 公众号 QbitAIStable Diffusion 3,它终于来了! 足足酝酿一年之多,相比上一代一共进化了三大能力。 来,直接上效果! 首先...
Midjourney文本渲染新升级,与DALL·E 3大比拼,看看谁更强
机器之心报道 编辑:大盘鸡文字渲染哪家强,今天你来做裁判。如果文生图中也有「敬业」代表,那 Midjourney 绝对能够提名。从发布开始,每次更新都给我们不一...
12