2026年06月04日 | 整理自 Reddit 全球科技社区
每天这个时候,我们从 Reddit 上最活跃的技术社区搜罗当日最热门的话题——
不是转载,不是直译,而是翻译整理后加上我们的观察和思考。
📋 本期看点
- 🔸 [artificial] Google 刚刚在您的笔记本电脑上投放了 Gemma 4 12B!
- 🔸 [StableDiffusion] Ideogram 4.0 刚刚开源!
- 🔸 [StableDiffusion] 多个角色阿尼玛一代非常好。有一些出血,但只会好起来
- 🔸 [Rag] 谷歌放弃 Gemma 4 12B,称其为最先进的型号
- 🔸 [LocalLLaMA] google/gemma-4-12B · 拥抱脸
- 🔸 [MachineLearning] NeurIPS 使用未经校准的 AI 检测器进行桌面拒绝 [D]
1. Google 刚刚在您的笔记本电脑上投放了 Gemma 4 12B!
📊 r/artificial | ⬆ 500 票 | 💬 100 条评论
💬 原帖精华
谷歌兄弟刚刚随意发布了一个 120 亿参数的多模态模型,它在 16GB 的 RAM 上运行,就像……你的 MacBook Pro 可以运行它。没有云。没有 API 调用。没有每月账单。它无需编码器,可处理图像和文本,具有 apache 2.0 许可证,因此您可以用它做任何商业用途,“云是唯一的方式”的说法正在迅速消亡。设备上的人工智能不再是一个噱头,而是真正
🗣️ 高赞评论
💬 [50⬆] 来自专用 Arm/asics 的边缘计算是个人计算的未来。数据中心用于培训企业应用程序的前沿模型。我记得最近看到过一些事情,芯片设计者能够将代码硬烧成一个
💬 [45⬆] 是的,这就是真实的轨迹。苹果已经在做这样的一个版本,将神经引擎嵌入到 M 系列芯片中,推理越来越接近硅水平,你想到的“硬烧成芯片”可能是 Et
💬 [40⬆] 永远不要假设只采用一条路径。一个简单的事实是,相对于其功能而言,模型变得越来越小、越来越好。
🔍 我们的观察
Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化,这本身就是一个值得关注的时代信号。
2. Ideogram 4.0 刚刚开源!
📊 r/StableDiffusion | ⬆ 455 票 | 💬 90 条评论
💬 原帖精华
嗨,r/StableDiffusion,我打赌你们都没有看到这一天的到来,这对于开源社区来说是一个重要的日子! Ideogram 4.0 是一个 9.3B 参数的开放权重文本到图像模型。现在 ComfyUI(最新更新)中原生支持它。权重、推理代码、完整的提示指南和采样器预设都是公开的。该存储库同时提供 fp8 和 nf4 检查点; nf4 变体适用于单个 2
🗣️ 高赞评论
💬 [50⬆] https://preview.redd.it/7lrd6rekg35h1.png?width=1024&format=png&auto=webp&s=988d678c1ecca642b6182749c6ade74e0c7ffaa1 顺便说一下。如果你得到这个,那不是 ComfyUI 的错,而是因为他们对模型进行了安全最大化。
💬 [45⬆] 这是…生成的图像吗,lmao?
💬 [40⬆] 是的,他们训练模型在检测到不安全提示时生成该图像。您必须弄清楚如何使用训练来消除/取消审查模型以将其删除。
🔍 我们的观察
开源模型的快速迭代正在改变游戏规则——AI不再只是云巨头的专利,本地部署正在成为可选项。
3. 多个角色阿尼玛一代非常好。有一些出血,但只会好起来
📊 r/StableDiffusion | ⬆ 500 票 | 💬 100 条评论
💬 原帖精华
我已附上我的 civitai 个人资料,它包含所有工作流程。我仍在学习如何更好地提示,所以会有一些提示、出血、解剖问题。对于生成图像后的第四张图像,我使用 Grok 将“Blair Witch”简笔画添加到图像中,其余所有操作均使用 Anima 完成。我很高兴 WAI Anima 即将推出。 https://civitai.red/user/Smexlo
🗣️ 高赞评论
💬 [50⬆] 哇,这些太棒了。尤其是第一个。如果它是高分辨率的,就像海报艺术一样。
💬 [45⬆] 这可以在 Illu 或 Pony 上完成吗?很可能需要良好的检查点和角色 lora,但根据我的经验,多个角色总是会出现大量出血。最糟糕的是 danbooru 标签极其有限,但有了 Anima 的自然语言帮助
💬 [40⬆] 这是一个 Pony Illustrious 模型,我在 ComfyUI 中有一个自定义节点系统来帮助纠正它。我的 3D 造型师让您设置场景,提示 IDE 让您描述放入 3D 场景中的任意数量的 3D 人体模型、自定义脸部
🔍 我们的观察
Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化,这本身就是一个值得关注的时代信号。
4. 谷歌放弃 Gemma 4 12B,称其为最先进的型号
📊 r/Rag | ⬆ 410 票 | 💬 80 条评论
💬 原帖精华
昨天在 Apache 2.0 下发布,运行在 16GB VRAM 上,声称只需一半内存即可实现接近 26B 的性能。真正有趣的是架构:没有视觉编码器,没有音频编码器,原始输入直接投射到 LLM 主干中。无编码器并不是什么新鲜事(Fuyu、Chameleon),但谷歌通过此许可证以这种大小提供它是新鲜事。
🗣️ 高赞评论
💬 [50⬆] 精彩的见解!感谢您的分享:)
💬 [45⬆] 更多详细信息:https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/
🔍 我们的观察
Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化,这本身就是一个值得关注的时代信号。
5. google/gemma-4-12B · 拥抱脸
📊 r/LocalLLaMA | ⬆ 500 票 | 💬 100 条评论
💬 原帖精华
Gemma 是由 Google DeepMind 构建的一系列开放模型。 Gemma 4 模型是多模式的,可处理文本和图像输入(E2B、E4B 和 12B 支持音频)并生成文本输出。此版本包括预训练和指令调整变体的开放权重模型。 Gemma 4 具有最多 256K 个令牌的上下文窗口,并保持超过 140 种语言的多语言支持。 Gemma 4 采用密集架构和专
🗣️ 高赞评论
💬 [50⬆] 你的帖子越来越受欢迎,我们刚刚在我们的 Discord 上推荐了它! 快来看看吧! 您的贡献也被赋予了特殊的天赋。我们感谢您的帖子! 我是一个机器人,这个动作是自动执行的。
💬 [45⬆] https://preview.redd.it/8tsvau0hb35h1.png?width=1163&format=png&auto=webp&s=231a022a3a8e2dbbdf6d9ee6ff4214421f2ffd7f
💬 [40⬆] 它在所有项目上都击败了 Gemma3-27B(不认为),所以这个 12B 对于穷人 GPU 俱乐部来说是有好处的。我可以在 8GB VRAM 上运行 Q4/Q5。
🔍 我们的观察
Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化,这本身就是一个值得关注的时代信号。
6. NeurIPS 使用未经校准的 AI 检测器进行桌面拒绝 [D]
📊 r/MachineLearning | ⬆ 500 票 | 💬 100 条评论
💬 原帖精华
最近,我的一份提交材料因涉嫌违反人工智能政策而被 NeurIPS 2026 立场文件轨道拒绝。在与赛道领导层通信并阅读他们的公开博客文章后,我认为更广泛的方法论问题值得在这里讨论。该赛道使用 Pangram(一种专有的人工智能文本检测器)作为桌面拒绝过程的一部分。我被告知,考虑用于桌面拒绝的材料是: 探测器输出 作者的人工智能使用证明 这创建了一个
🗣️ 高赞评论
💬 [50⬆] 我通过系统运行了 2022 年之前的一些比较晦涩的论文,它们有时也得分很高,哈哈。这些系统纯粹是胡说八道。会议对于使用它们来说就是一个笑话。
💬 [45⬆] 自从 ChatGPT 发布以来,AI 检测器就一直是一个骗局,现在它们仍然是一个骗局(除了像 SynthID 这样的小众水印检测器)。不敢相信世界上最大的人工智能会议也成为了这种万金油的受害者。红外线
💬 [40⬆] 这真是讽刺。
🔍 我们的观察
Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化,这本身就是一个值得关注的时代信号。
7. DocLing 面临的挑战
📊 r/Rag | ⬆ 500 票 | 💬 100 条评论
💬 原帖精华
你好,我正在开发 RAG 系统,但我陷入了第一部分,即文档解析。我使用 DocLing 来解析包含复杂表格、多列文本块等的非结构化 PDF。结果似乎……不是最好的。例如,我会有这样的内容:“Hello World and Good Morning”这将是多列文本块的标题,其中标题跨越 2 行。 DocLing 会将其视为 2 个文本块而不是 1 个。这不是唯
🗣️ 高赞评论
💬 [50⬆] 查看 Docling 示例部分,Docling 提供了 2 种更改解析和分块的方法: 实现您自己的解析器,请参阅 rag_langchain.ipynb – Colab 一旦获得了分块,您就可以更改序列化的内容。这也许就是
💬 [45⬆] 我曾短暂使用过 Mistral OCR,但还没有机会全面检查输出。我想将其与其他选项进行基准比较。从我粗略的看,我发现它非常好,但我很少看到这里讨论它,这让我认为它
💬 [40⬆] 尝试将 duckling-ui 放在上面。让生活变得更加轻松。
🔍 我们的观察
Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化,这本身就是一个值得关注的时代信号。
8. 首先,加州市以压倒性多数投票永久禁止数据中心
📊 r/technology | ⬆ 500 票 | 💬 100 条评论
🗣️ 高赞评论
💬 [50⬆] 无论如何,谁会想要数据中心呢?他们不提供任何长期工作。从字面上看,对普通公民来说有什么好处? 编辑:你们对自己没有读过的文章发表评论是很尴尬的。主题是关于不想在 c 中使用数据中心
💬 [45⬆] 没有,因此我们需要摆脱它们并禁止建造未来的,或者对它们征税。
💬 [40⬆] 我们在我住的地方看到了同样的事情,但有一家大牌啤酒厂。 他们说服当地政府允许他们重新划定受保护的农业用地。然后他们在仓库式建筑中建造了一家啤酒厂,如此快速地建造了混凝土和钢材。它迪
🔍 我们的观察
Reddit技术社区的整体态度呈现明显的”乐观派 vs 务实派”分化,这本身就是一个值得关注的时代信号。
最后说几句
每天翻一遍 Reddit,你会发现一个很有意思的现象:
在新闻标题里,AI 是”颠覆”、”革命”、”划时代”;
而在 Reddit 的帖子和评论里,AI 是”又被老板提了新要求”、”面试官是个 bot”、”昨天刚崩了一次”。
两个版本的叙事,同时发生着。
我们更愿意相信 Reddit 那一版——因为那是活在技术第一线的人,用他们的真实感受投票出来的。
本文由 Hermes 自动整理自 Reddit 社区,于 2026年06月04日 生成。
内容不代表本公众号立场,仅供参考与思考。