标签：分词

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

走近宋柔教授：78岁仍在科研前线，在语言学高校里的计算语言学家

InfoQ 特约作者｜秦海龙写在最前宋柔，北京语言大学信息科学学院教授，语言学及应用语言学博士生导师，北京工业大学计算机应用博士生导师。北京语言大学信息...

阅读原文

AIGC动态

2年前 (2024)

LLM实践系列-数据去重之Simhash&Minhash分析与实现

讲座预告11月1日上午10点，南开大学在读博士李森茂，将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解，欢迎扫码报名~今天给大家带来知乎@真中合...

阅读原文

AIGC动态

2年前 (2024)

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

机器之心报道编辑：杜伟、泽南大模型的安全性，可以说是「有很大进步空间」。 AI 大牛 Andrej Karpathy 又来科普知识了，这次的主题是「利用特殊 token 对 L...

阅读原文

AIGC动态

2年前 (2024)

关于Tokenizer的一些感想

原文：https://zhuanlan.zhihu.com/p/695307425 在现有Transformer作为大模型框架下，万物tokenizer将会是一个必然的趋势！ 01为什么我们需要Token化？tokeni...

阅读原文

AIGC动态

2年前 (2024)

英伟达Mistral AI联袂出击！120亿小模型王者强势登场，碾压Llama 3单张4090可跑

新智元报道编辑：耳朵桃子【新智元导读】GPT-4o mini头把交椅还未坐热，Mistral AI联手英伟达发布12B参数小模型Mistral Nemo，性能赶超Gemma 2 9B和Llama 3...

阅读原文

AIGC动态

2年前 (2024)

小模型卷起来了：Mistral联合英伟达开源12B小模型，128k上下文

机器之心报道机器之心编辑部小模型，正在成为 AI 巨头的新战场。今天凌晨，OpenAI 突然发布了 GPT-4o 的迷你版本 ——GPT-4o mini。这个模型替代了原来的 GPT-...

阅读原文

AIGC动态

2年前 (2024)

抄袭瓜！斯坦福作者已删库跑路！面壁和刘知远老师的最新回应

夕小瑶科技说原创作者 | 海野好家伙，AI大模型圈爆料不断，没想到今天最猛的料还是抄袭的瓜啊。 5月29日，一个斯坦福团队高调宣称，只需要500美元，就可以...

阅读原文

AIGC动态

2年前 (2024)

Meta发布多模态模型Chameleon：34B、类GPT-4o、性能接近GPT-4V

GPT-4o 的横空出世，再次创立了一个多模态模型发展的新范式。OpenAI 将其称为「首个『原生』多模态」模型，意味着 GPT-4o 与以往所有的模型，都不尽相同。传...

阅读原文

AIGC动态

2年前 (2024)

大神Karpathy强推，分词领域必读：自动钓鱼让大模型“发疯”的token，来自Transformer作者创业公司

鱼羊发自凹非寺量子位 | 公众号 QbitAI关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。主题是：自动检测大模型中那些会导致“故...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热大模型论文：首个面向AI的python编程框架，提升大模型编程能力新思路

夕小瑶科技说原创作者 | 谢年年高级编程语言Python有两个受众：一是编译和执行程序的机器，二是阅读、理解和编写程序的人类。机器关注程序的语义操作，而人...

阅读原文

AIGC动态

2年前 (2024)

LLM爆发的一周！Apple开源OpenELM（270M、450M、1.1B 和 3B）

Apple今天发布并开源OpenELM系列模型（270M、450M、1.1B 和 3B）！还包括了在公开可用数据集上训练和评估语言模型的完整框架，包括训练日志、多个checkpoint ...

阅读原文

AIGC动态

2年前 (2024)

开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线

新智元报道编辑：alan 【新智元导读】近日，LLM竞技场更新了战报，Command R+推出不到一周，就成了历史上第一个击败了GPT-4的开源模型！目前，Command R+已经...

阅读原文

AIGC动态

2年前 (2024)

1000行C语言搓出GPT-2！AI大神Karpathy新项目刚上线就狂揽2.5k星

新智元报道编辑：桃子好困【新智元导读】训大模型的方法可能要被革新了！AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2，而不再依赖庞大的GPT-2库...

阅读原文

AIGC动态

2年前 (2024)

60行代码，从头开始构建GPT！最全实践指南来了

新智元报道编辑：桃子【新智元导读】GPT早已成为大模型时代的基础。国外一位开发者发布了一篇实践指南，仅用60行代码构建GPT。60行代码，从头开始构建GPT？ ...

阅读原文

AIGC动态

2年前 (2024)

复旦发布多模态大模型AnyGPT，文图语乐样样行

夕小瑶科技说原创作者 | 芒果引言：多模态语言模型新篇章在人工智能领域，多模态语言模型的发展正迎来新的篇章。传统的大型语言模型（LLM）在理解和生成人...

阅读原文

AIGC动态

2年前 (2024)