Reddit热榜｜AI行业今日话题

2026年05月23日 ｜整理自 Reddit 全球科技社区

每天这个时候，我们从 Reddit 上最活跃的技术社区搜罗当日最热门的话题——

不是转载，不是直译，而是翻译整理后加上我们的观察和思考。

📋 本期看点

– 🔸 [MachineLearning] NuExtract3 发布：用于 Markdown、OCR 和结构化提取的开放式 4B VLM（可自…

– 🔸 [ChatGPT] Sam Altman 向所有 Y Combinator 初创公司提供“mic drop”优惠

– 🔸 [ClaudeAI] 像美酒一样陈年

– 🔸 [StableDiffusion] 腾讯发布像素空间生成器Z-Image 6B。无 VAE 和 1k 分辨率。

– 🔸 [LocalLLaMA] DeepSeek正在推进102.9亿美元融资，梁文峰承诺继续开发开源AI模型，而不是追求短期商业化目…

– 🔸 [Futurology] 微软的报告暴露了人工智能的真正成本问题：使用该技术比支付人类员工的工资更昂贵

1. NuExtract3 发布：用于 Markdown、OCR 和结构化提取的开放式 4B VLM（可自托管）[P]

📊 *r/MachineLearning ｜ ⬆ 500 票｜ 💬 100 条评论*

💬 *原帖精华*

免责声明：我在 Numind 工作，该公司是这个开放权重模型背后的公司。我们刚刚在 Apache-2.0 许可证下发布了基于 Qwen3.5-4B 的 4B 模型。目标是通过开放模型使从复杂文档中提取信息更加实用：PDF、屏幕截图、表单、表格、收据、发票、多页文档和其他可视化结构化输入。尝试一下，我们有一个完全免费的 Huggingface 空间（您甚至不必

🗣️ *高赞评论*

💬 [50⬆] 好奇发票和银行对账单任务的基准文档分布是什么样的。供应商对这些东西的基准测试几乎总是采样干净、格式良好的文档，一旦你点击扫描的传真或多彩色，这些数字就会崩溃。

💬 [45⬆] 我无法真正给您一个正确的估计，但我们的目标是尽快发布我们的基准。我知道很多公司都这么说，但从来没有这样做，但我想说我们的基准相当困难，特别是因为

💬 [40⬆] 准确地说，如果模型默默地幻觉模糊传真上的字段并破坏管道，那么聚合 F1 在生产中基本上毫无用处。我更希望有可靠的置信度分数，这样我们就可以将奇怪的布局直接发送给人工审核

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

2. Sam Altman 向所有 Y Combinator 初创公司提供“mic drop”优惠

📊 *r/ChatGPT ｜ ⬆ 455 票｜ 💬 90 条评论*

💬 *原帖精华*

请在 techcrunch 上阅读本文。 OpenAI 正在通过无上限的 SAFE 向当前 YC 批次中的每家公司（约 169 家初创公司）投入价值 200 万美元的 API 代币，并在下一轮定价时进行转换。如果估值达到 1 亿美元，则获得大约 2% 的股权。 YC 以 50 万美元现金收取 7%。最重要的是，创始人不会在它们之间做出选择。但动态是疯狂的。一

🗣️ *高赞评论*

💬 [50⬆] 嘿 /u/MineWhat ，如果您的帖子是 ChatGPT 对话的屏幕截图，请使用对话链接或提示回复此消息。如果您的帖子是 DALL-E 3 图片帖子，请回复用于制作此图片的提示。考虑

💬 [45⬆] 与此同时，AWS 只是想免费给我个人代币。

💬 [40⬆] 哈哈，AWS 的信用渠道是无与伦比的，从初创企业信用到企业折扣的免费层级，他们已经运行了 15 年，而且仍然有效。

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

3. 像美酒一样陈年

📊 *r/ClaudeAI ｜ ⬆ 500 票｜ 💬 100 条评论*

💬 *原帖精华*

chatgpt subreddit 上的 meme 在 ngl 上非常流行。我们有反重力，克劳德代码，对于后端来说它们很棒不，我的意思是非常擅长那里的任务光标也不会错过那个用于ui缝合和可运行的它的专用ui/ux调整创建令人惊叹的ui任何人都可以使用这些工具创建良好的网站但问题是那些客户想要构建一个像下一个数百万美元saas的项目我的意思是兄弟只是sybua

🗣️ *高赞评论*

💬 [50⬆] TL;DR 在 80 条评论后自动生成讨论。好的，首先，有人给 OP 一个标点符号代理。大家的共识是响亮的“是的，OP，你做到了”。新的开发人员地狱不是调试代码，而是处理 cl

💬 [45⬆] 下一个需求收集会议：“克劳德，告诉我我想要什么并实现它”

💬 [40⬆] 在会议中实时观看了这一点。作为一名工程师，我不得不保持静音并关闭相机，因为我笑得很厉害。他们关于认知屈服的观点是正确的。

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

4. 腾讯发布像素空间生成器Z-Image 6B。无 VAE 和 1k 分辨率。

📊 *r/StableDiffusion ｜ ⬆ 500 票｜ 💬 100 条评论*

💬 *原帖精华*

链接：https://nju-pcalab.github.io/projects/L2P/

🗣️ *高赞评论*

💬 [50⬆] 这是模型 https://huggingface.co/zhen-nan/L2P/tree/main

💬 [45⬆] Apache 许可 – 哇！什么时候舒服？！

💬 [40⬆] 给他们一个小时，哈哈！

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

5. DeepSeek正在推进102.9亿美元融资，梁文峰承诺继续开发开源AI模型，而不是追求短期商业化目标

📊 *r/LocalLLaMA ｜ ⬆ 500 票｜ 💬 100 条评论*

💬 *原帖精华*

https://www.bloomberg.com/news/articles/2026-05-22/deepseek-Founder-declares-agi-goal-as-10-billion-round-advances

🗣️ *高赞评论*

💬 [50⬆] 你的帖子越来越受欢迎，我们刚刚在我们的 Discord 上推荐了它！快来看看吧！您的贡献也被赋予了特殊的天赋。我们感谢您的帖子！我是一个机器人，这个动作是自动执行的。

💬 [45⬆] 哎呀，是的

💬 [40⬆] 好的。对我来说，自 GLM 5.1 以来，我们现在在编码辅助智能方面基本上处于“足够好”的开源模型。如果我们能够继续将相同的智能水平压缩为更小/更快/更高效

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

6. 微软的报告暴露了人工智能的真正成本问题：使用该技术比支付人类员工的工资更昂贵

📊 *r/Futurology ｜ ⬆ 500 票｜ 💬 100 条评论*

🗣️ *高赞评论*

💬 [50⬆] 以下提交声明由 /u/Krankenitrate 提供：据 The Verge 报道，微软已开始取消大部分直接 Claude Code 许可证，转而让工程师转向使用 GitHub Copilot CLI。那来了

💬 [45⬆] 老实说，很高兴看到人类能够真正理解他们的劳动力被低估，并在上面贴上美元符号

💬 [40⬆] 这里恰恰相反，不是吗 – 使用 AI 编码助手最终会比人们使用更多的 $$$ 例如，我可以轻松地使用大量的代币来对我正在工作的包周围的样板文件、文档字符串和示例进行振动编码

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

7. 我是唯一一个告诉我的 RAG 客户从头开始重新制作数据的人吗？

📊 *r/Rag ｜ ⬆ 500 票｜ 💬 100 条评论*

💬 *原帖精华*

虽然我了解大多数 RAQ 系统的用例是允许法学硕士智能地询问现有数据/文档，但我们也可以看到这就是常见问题发生的地方。我是一个老派的 IT 人员，以前，我们在谈论系统时总是使用“垃圾进，垃圾出”这个术语。根据多年的经验，导致问题的几乎总是蹩脚的数据，而不是解决方案本身。因此，当我与客户谈论新系统时，我立即开始谈论accu

🗣️ *高赞评论*

💬 [50⬆] 至少对于记忆来说，我在写断层线时牢记了这个原则：垃圾进垃圾出。我希望能够扩展到文档空间。也许完成之后👍

💬 [45⬆] 这不是“神奇的人工智能”。让他们做好准备。 ….或者告诉他们你可以充电两次来重做糟糕的结果。

💬 [40⬆] 你是对的，大多数人都会跳过这一步，因为这是一项乏味的工作。强调让 RAG 克服蹩脚数据的困难是一种工程应对方法，可以避免与客户就数据质量进行艰难的对话。 “嘎

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

8. COLM 2026 评论讨论 [D]

📊 *r/MachineLearning ｜ ⬆ 455 票｜ 💬 90 条评论*

💬 *原帖精华*

没看到所以想自己做一个。评论其实已经出来了，好奇大家对评论的质量有什么看法？我听说这是一个鱼龙混杂的问题，显然人工智能为某些人生成的评论数量令人担忧。

🗣️ *高赞评论*

💬 [50⬆] 提交了一篇论文并获得了 6/3、2/5、6/3、7/4 的评级/置信度分数。除了最负面的评论之外，评论似乎是合理且容易解决的，可能使用法学硕士来找出所有可能的批评（一些不合理的批评）

💬 [45⬆] 相同的。收到了一堆长期的、严厉的、挑剔的负面评论。至少你只有其中之一。我的每篇论文都有几个…

💬 [40⬆] 煮熟了。某种程度上，评论甚至比大型机器学习会议更加严厉和挑剔。许多也显然是人工智能生成的或至少是释义的

🔍 我们的观察

*Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化，这本身就是一个值得关注的时代信号。*

最后说几句

每天翻一遍 Reddit，你会发现一个很有意思的现象：

在新闻标题里，AI 是”颠覆”、”革命”、”划时代”；

而在 Reddit 的帖子和评论里，AI 是”又被老板提了新要求”、”面试官是个 bot”、”昨天刚崩了一次”。

两个版本的叙事，同时发生着。

我们更愿意相信 Reddit 那一版——因为那是活在技术第一线的人，用他们的真实感受投票出来的。

*本文由 Hermes 自动整理自 Reddit 社区，于 2026年05月23日生成。*

*内容不代表本公众号立场，仅供参考与思考。*

📋 本期看点

1. NuExtract3 发布：用于 Markdown、OCR 和结构化提取的开放式 4B VLM（可自托管）[P]

2. Sam Altman 向所有 Y Combinator 初创公司提供“mic drop”优惠

3. 像美酒一样陈年

4. 腾讯发布像素空间生成器Z-Image 6B。无 VAE 和 1k 分辨率。

5. DeepSeek正在推进102.9亿美元融资，梁文峰承诺继续开发开源AI模型，而不是追求短期商业化目标

6. 微软的报告暴露了人工智能的真正成本问题：使用该技术比支付人类员工的工资更昂贵

7. 我是唯一一个告诉我的 RAG 客户从头开始重新制作数据的人吗？

8. COLM 2026 评论讨论 [D]

最后说几句

Leave a ReplyCancel Reply