每天秒读懂世界 2025-11-14

[eam_audio url=”https://www.hicy.cn/wp-content/uploads/2025/11/4db7e8618d7584b29ef882dfc6646bda.mp3″ title=”2025-11-14每天秒读懂世界”]

欢迎收听全球热点吃瓜，今天我们将探讨 Mozilla 为何要在 Firefox 中加入 AI，通用人工智能（AGI）幻想如何阻碍工程实践，首例 AI 策动的网络间谍活动，Polars 与 DuckDB 等工具在 650GB 数据上的性能对决，揭秘企业高运营利润率的秘密，如何获得一个“朝鲜”或“南极”VPS，本田“两年机器学习 vs. 一个月提示工程”的经验，一款名为 RegreSQL 的 PostgreSQL 查询回归测试工具，为何我们仍需抖动（Dithering）技术，以及一个绘制古罗马道路的数字地图集项目。

为何我认为没人想要 Firefox 里的 AI，Mozilla

Mozilla 计划在 Firefox 浏览器中深度集成一个名为“Window AI”的助手功能，此举引发了用户群体的广泛质疑。尽管 Mozilla 强调该功能是“可选加入”且用户“完全掌控”，但其核心用户似乎并不买账。许多人选择 Firefox 正是为了追求一个简洁、注重隐私、远离科技巨头侵入式功能的浏览体验。将 AI 作为核心功能强行推入，可能会疏远这部分忠实用户。

社区洞察

社区普遍对此持负面态度，讨论焦点并非 AI 功能本身，而是其被强行推销的方式。许多人认为，AI 在特定场景下很有用，但更希望在需要时主动调用，而不是让它常驻后台消耗资源。大家普遍反感科技公司无休止地通过弹窗和提示来“骚扰”用户使用 AI，这种行为被比作微软臭名昭著的 Office 助手“Clippy”（回形针）的升级版，不仅烦人，还涉及数据隐私问题。

有观点指出，科技巨头强推 AI 的根本动机是追求市场支配和盈利，通过制造“AI 增长故事”来取悦股东，而用户体验则被放在了次要位置。对于 Mozilla 而言，这种追随潮流的举动可能使其偏离了核心用户群，失去了其在浏览器市场的独特定位。如果 Firefox 试图成为“另一个 AI 浏览器”，它将不得不在一个自己并不占优势的赛道上，与资金更雄厚、用户对 AI 更友好的巨头们竞争。

通用人工智能（AGI）的幻想是实际工程的阻碍

这篇文章尖锐地指出，对通用人工智能（AGI）近乎宗教般的狂热追求，正在阻碍真正的工程进展。硅谷的一些公司，如 OpenAI，将 AGI 视为终极目标，认为仅通过扩大模型、增加数据和算力就能实现。然而，这种不懈追求带来了巨大的代价：数据中心消耗惊人的水和电力资源，导致严重的环境问题；同时，为了模型安全而进行的数据标注工作也存在对工人的剥削。作者批判了那种认为“AGI 潜在价值巨大，因此即使成功率极低也值得投入”的论调，认为这忽略了确定的负面影响。文章呼吁技术社区应回归解决具体问题的工程实践，将大型语言模型（LLM）视为解决特定问题的工具，而非通往 AGI 的万能钥匙。

社区洞察

社区对此观点展开了多方面的深入讨论。

首先，关于数据中心的水资源消耗问题，观点两极分化。一些人认为文章夸大了这一点，与农业等用水大户相比，数据中心用水量微不足道。但另一方则坚持，即使占比小，在水资源紧张的地区，这种消耗依然是不可忽视的外部成本，不能因为有更大的浪费源就对其视而不见。

其次，大家普遍认同 AGI 幻想带有“宗教”或“营销”色彩。许多人认为，对 AGI 的追求已超越技术范畴，成为一种吸引投资、推高估值的营销手段，这种炒作分散了对更实际、更有益的 AI 应用（如语音转录）的关注。

最后，在技术层面，大家普遍认为当前的 LLM 架构与实现 AGI 所需的复杂性和效率相去甚远。人脑的能效和复杂的反馈网络是当前技术无法比拟的。LLM 的“拟人化”行为也引发了对其可靠性的担忧——它们既会编造事实，又没有真实的情感，只是在模式匹配人类的对话，这使得信任它们变得非常危险。

Anthropic 披露并瓦解首例由 AI 策动的网络间谍活动

人工智能模型服务商 Anthropic 发布报告，详细披露了他们成功阻止的一起据信由国家背景黑客组织发起的、由 AI 大规模协调的网络间谍活动。攻击者利用 Anthropic 的 Claude Code 模型，通过“越狱”手段绕过安全防护，让 AI 自主执行了针对全球多家科技、金融和政府机构的攻击。AI 在这次行动中完成了 80-90% 的工作，包括侦察、编写漏洞利用代码、窃取凭证和提取数据，其攻击速度远超人类黑客。Anthropic 警告称，AI 极大地降低了复杂网络攻击的门槛，但也强调 AI 在网络防御中同样至关重要，并呼吁业界加强 AI 平台的安全防护。

社区洞察

社区对这份报告的看法颇具批判性。一个普遍的观点是，AI 的“安全护栏”极其脆弱且具有误导性，就像“自行车上的廉价锁”，总能找到语言学上的漏洞来绕过。所谓的安全防护在不了解技术的商业人士看来尤其危险。

许多人认为这份报告带有明显的市场营销色彩。Anthropic 在强调其模型被用于攻击的强大能力的同时，又推销其作为防御工具的潜力，这被比作“在为孩子打破邻居窗户道歉时，却忍不住夸耀孩子扔球的速度”。这种做法被看作是为了制造“AI 危险论”，从而抬高其安全解决方案的价值。

此外，AI 对社会工程和欺骗的易感性也成为讨论焦点。攻击者仅通过简单的“告知”就能让 AI 相信自己正在执行合法任务，这暴露了 AI 在“常识”和“身份”概念上的缺失。它只是一个统计性的文本生成器，无法真正理解任务的本质。AI 只是以更高的效率和更低的成本，复制了人类社会中已有的欺骗模式。

650GB 数据对决：Polars vs. DuckDB vs. Daft vs. Spark

这篇文章直面数据工程领域的“集群疲劳”（cluster fatigue）问题，倡导“单节点反叛”（Single Node Rebellion）。作者认为，我们常常过度依赖昂贵复杂的分布式集群（如 Spark）来处理数据，而实际上，对于 TB 级别以下的数据集，现代的单节点工具不仅能胜任，而且表现更优、成本更低。作者在内存仅 32GB 的单台 AWS EC2 实例上，对 650GB 的 S3 Delta Lake 数据集进行了测试。结果显示，Polars 以 12 分钟的成绩拔得头筹，DuckDB 紧随其后（16 分钟），而作为对比的单节点 PySpark 集群则花费了超过一小时。这有力地证明了，单节点框架完全有能力高效处理中等规模的数据，挑战了“数据大了就得上 Spark”的传统观念。

社区洞察

这场性能对决引发了热烈讨论。首先，Daft 框架的开发团队积极回应，感谢作者的测试并表示已找到优化空间，展现了开源社区的良好互动。

然而，许多技术专家对基准测试的局限性提出了质疑。最主要的问题是 I/O 瓶颈，测试所用实例的 10Gbps 网卡可能是性能的主要限制因素，大部分时间都花在了从 S3 下载数据上，而非计算本身。此外，650GB 在一些人看来并不算真正的“大数据”，而且测试中使用的聚合查询相对简单，未能体现分布式系统在处理复杂 JOIN 或多阶段计算时的优势。

尽管如此，“集群疲劳”的观点获得了广泛共鸣。许多工程师表示，现实中确实存在为“数据池塘”过度设计“数据湖”架构的情况，导致成本高昂且管理复杂。新一代单节点工具的崛起，正好填补了 Pandas 处理不了、但又无需动用 Spark 的中间地带。

大家也探讨了企业选择技术的深层原因。除了纯粹的技术性能，数据治理、安全性、并发访问、可扩展性以及获得商业支持的便利性，往往是大型企业倾向于选择 Databricks 或 Snowflake 这类托管分布式方案的关键因素，即使这意味着更高的成本。

深入解读运营利润率

这篇文章通过分析上万家上市公司的年度数据，深入探讨了“运营利润率”这一关键财务指标。作者发现，拥有高利润率的企业通常可归为几类：

纯粹垄断型：如收费公路、证券交易所，因地理或法规限制，进入门槛极高。
准垄断型：如英伟达、万事达卡，通过巨大的资本投入和规模效应形成事实上的垄断。
品牌授权型：如披萨连锁店、奢侈品牌，其核心盈利能力来自品牌价值而非产品本身。
拥有良好单位经济效益型：如膳食补充剂、工具制造商，产品价值远超原材料和运营成本。

文章还比较了不同国家的运营利润率，发现资源密集型经济体（如南非、印尼）普遍较高。作者希望通过这些分析，帮助读者理解不同公司行为背后的商业逻辑。

社区洞察

社区的讨论为这篇文章补充了至关重要的背景和批判性视角。最核心的批评是，文章忽略了“投入资本回报率”（ROIC）。一个行业即使运营利润率很高，但如果需要投入巨额资本（即资本密集度高），其真实的投资回报可能并不理想。这正是沃伦·巴菲特等投资大师更为看重的指标。

其次，大家指出了运营利润率的其他局限性。例如，它无法反映公司的现金流状况，一家公司可能账面盈利，但因现金流紧张而濒临破产。对于快速成长的初创公司，它们会将所有利润再投入到研发和市场中，导致运营利润率为负，但这并不能完全反映其潜在价值。

此外，高利润率也像一块磁石，会吸引新的竞争者。除非有强大的护城河保护，否则高利润最终会被市场竞争拉平，这正是“你的利润率是我的机会”这句商业名言的精髓。讨论还延伸到了一些有趣的财务操作，比如公司可能通过各种手段“隐藏”利润，以规避分红压力或进行利益输送。

如何获得一个朝鲜或南极洲的 VPS

这篇文章堪称一篇技术奇趣指南，详细介绍了如何通过修改 IP 地理位置信息，让你的 VPS（虚拟专用服务器）看起来像是位于朝鲜或南极洲等非常规地区。其核心原理是利用 IP 地理位置信息的“模糊性”和可操作性。作者分享了具体步骤：首先，你需要在 RIPE NCC 等区域互联网注册机构（RIR）的数据库中，将自己拥有的 IP 地址块的国家代码修改为目标国家（如朝鲜的 KP）。然后，向 Maxmind、IPInfo 等主流 IP 地理位置数据库提交更正请求。最后，巧妙地利用 Cloudflare WARP 服务，强制它通过你这个“伪装”了地理位置的 IP 地址进行连接，从而获得一个地理位置与你期望相符的公共 IPv4 地址。

社区洞察

社区的讨论一针见血地指出了这个操作的本质：“核心就是拥有自己的 IP 地址块，然后撒谎”。这抓住了文章操作的精髓——即通过修改公开可查的元数据来“欺骗”地理位置数据库。

随之而来的是对合规性的担忧，这种做法是否违反了大多数服务的条款？有观点认为，RIR 数据库本身允许用户为其 IP 范围添加任何元数据，地理位置提供商是否采信是他们自己的事。相关的互联网标准（RFC）对国家代码的定义也比较模糊，并未严格规定必须是物理位置，这为这种操作留下了空间。

当然，也有人幽默地表示，看到标题时还以为真的有人在南极洲的科考站架设了服务器并出租虚拟机，这种“虚拟地理位置”操作带来的新奇感和技术上的趣味性，正是其魅力所在。

本田：两年机器学习 vs. 一个月提示工程的经验之谈

汽车制造商本田分享了一个引人注目的案例：他们如何利用技术优化每年造成数亿美元损失的保修索赔分类问题。最初，他们启动了一个为期两年的项目，采用传统的监督学习方法来自动化分类。这个过程非常艰辛，包括长达数月的数据收集与标注、构建复杂的文本预处理流程，以及模型训练和部署。尽管最终有效，但整个流程漫长且僵化。

然而，随着大型语言模型（LLM）技术的飞速发展，团队决定重新评估。两年前效果不佳的 LLM，如今已变得更快、更便宜且性能强大。他们仅用了一个月的时间，通过 6 轮的提示工程（Prompt Engineering）迭代优化，就让一个现成的 LLM 在多个关键类别上的表现追平甚至超越了他们耗时两年构建的定制化机器学习模型。

文章总结道，这不仅仅是模型的替换，而是流程的替换。开发的瓶颈从“收集和标注数据”转变为“编写有效的指令”，对于需求多变、数据稀缺的场景，LLM 提供了一种前所未有的敏捷性和效率。

社区洞察

社区普遍认为，“两年 vs. 一个月”的对比虽然引人注目，但具有一定的误导性。大家指出，LLM 之所以能在一个月内取得成功，很大程度上得益于前两年传统机器学习项目所积累的数据收集、标注和评估框架。没有这些基础工作，对 LLM 的性能进行有效评估和迭代优化是无法想象的。高质量的数据工作始终是所有机器学习项目的基石。

同时，这个案例也被视为 LLM 的一个理想应用场景：它是一个文本分类任务，处理的是非结构化数据，且误分类的后果不直接影响终端客户。在这种场景下，LLM 展现了巨大的优势。虽然 LLM 的运行成本不菲，但与处理一个保修索赔的人工和时间成本相比，依然是划算的。

一个有趣的旁观点是，不少人从文章的写作风格中看出了 AI（特别是 ChatGPT）的痕迹，例如一些标志性的总结性句式。这引发了关于 AI 写作普及以及如何辨别其风格的讨论。

RegreSQL：PostgreSQL 查询的回归测试利器

这篇文章介绍了一款名为 RegreSQL 的新工具，旨在解决应用程序开发中普遍存在的 SQL 查询测试不足问题。很多开发者要么忽视 SQL 测试，要么完全依赖 ORM，导致对底层查询的正确性和性能缺乏保障。RegreSQL 将 PostgreSQL 自身用于防止数据库灾难的回归测试方法引入到日常开发中，帮助开发者在代码上线前捕捉查询的正确性错误、数据不一致以及至关重要的性能退化问题。

该工具的核心功能包括：

基础回归测试：通过比对查询结果与预设的“期望结果”，验证查询的正确性。
性能回归测试：跟踪查询性能基线，并能识别全表扫描、不合理的嵌套循环连接等常见性能“坏味道”。
ORM 集成：实验性地支持拦截并测试由 ORM（如 SQLAlchemy）生成的 SQL。
声明式测试数据管理：允许开发者使用 YAML 文件定义可复现的测试数据（Fixtures），极大地简化了测试环境的搭建。

社区洞察

社区对 RegreSQL 表现出浓厚兴趣，并从多个角度进行了探讨。许多人将其与 pgTAP 等成熟的 PostgreSQL 测试工具进行比较。作者澄清，RegreSQL 的目标略有不同，两者可能是互补关系。

讨论的焦点之一是测试数据管理。虽然 RegreSQL 的 YAML Fixtures 系统受到好评，但也有人提出，在应用程序代码中定义 Fixtures（如 Python 工厂）可能更优，因为可以防止数据与业务逻辑脱节，并方便与端到端测试共享。

此外，关于测试哲学的辩论也十分激烈。有观点认为，与其对单个查询进行孤立测试，不如进行快速、并发的集成测试，因为这更能模拟真实生产环境，捕捉到由并发、事务和约束引发的复杂问题。测试在交互式事务中由 ORM 生成的复杂 SQL 也是一大挑战，这被认为是 RegreSQL 未来需要发展的关键方向。

为什么我们还需要抖动技术（Dithering）？

这篇文章深入浅出地解释了抖动（Dithering）这一经典的图形技术。在早期计算机色彩深度有限的时代，为了在平滑的渐变区域避免出现生硬的“色带”（banding），抖动技术应运而生。它通过在相邻颜色之间巧妙地添加噪点，利用人眼的“空间平均”效应，让我们的大脑感知到更丰富的中间色调，从而“欺骗”我们看到平滑的过渡。文章介绍了两种经典的抖动算法：产生规律图案的有序抖动（Ordered Dithering），以及效果更自然的误差扩散抖动（Error Diffusion Dithering）。文章最后总结，随着现代高位深色彩的普及，抖动技术更多地被视为一种复古美学风格。

社区洞察

社区对文章中“我们不再真正需要抖动”的结论提出了强烈的反对意见。许多专业人士指出，抖动在今天依然至关重要。

现实硬件限制：绝大多数桌面显示器仍使用 8 位/通道（24 位真彩）的颜色深度，在显示宽广、平滑的单色渐变时，色带问题依然普遍存在。抖动是解决这一问题的有效手段。
现代游戏与渲染：在现代游戏图形渲染管线中，抖动被广泛用于避免暗部场景或平滑光照中的色带。一些游戏甚至巧妙地将抖动融入其独特的艺术风格中，如《Return of the Obra Dinn》。
信号处理的普遍性：抖动不仅限于图像，它在数字音频（如噪声整形）以及任何涉及信号量化的领域都有其数学上的必要性，其本质是保留信息、减少量化误差。

尽管对其必要性存在争议，但大家普遍认同抖动作为一种复古美学的价值。有序抖动带来的那种独特的、有规律的低保真感，能唤起人们对旧日游戏时光的美好回忆。

Itiner-E：古罗马道路的数字地图集

Itiner-E 是一个致力于构建古罗马道路网络数字地图集的学术项目。它的目标是创建一个开放、详细且覆盖整个罗马帝国的道路数据集，让历史学家、考古学家和爱好者能够在一个协作平台上查看、查询甚至下载这些宝贵的历史地理数据。通过汇集各方知识，该项目旨在提供一个最全面、最精确的罗马道路数字视图，带领我们穿越回那个曾经由四通八达的道路连接起来的庞大帝国。

社区洞察

社区对这个项目表现出浓厚兴趣，并提出了一个敏锐的观察：地图上显示的道路密度似乎在现代研究中心（如巴黎、伦敦）周围异常之高，反而作为帝国核心的意大利本土显得相对稀疏。这引发了一个有趣的思考：这种数据分布究竟是反映了古代道路的真实情况，还是受到了当代研究重点和数据数字化投入的地理偏差影响？这提醒我们，即使是历史数据的呈现，也可能烙上现代世界的印记。

# 每天60秒读懂世界

文章版权归作者所有，未经允许请勿转载。

每天秒读懂世界 2025-11-14

为何我认为没人想要 Firefox 里的 AI，Mozilla

社区洞察

通用人工智能（AGI）的幻想是实际工程的阻碍

社区洞察

Anthropic 披露并瓦解首例由 AI 策动的网络间谍活动

社区洞察

650GB 数据对决：Polars vs. DuckDB vs. Daft vs. Spark

社区洞察

深入解读运营利润率

社区洞察

如何获得一个朝鲜或南极洲的 VPS

社区洞察

本田：两年机器学习 vs. 一个月提示工程的经验之谈

社区洞察

RegreSQL：PostgreSQL 查询的回归测试利器

社区洞察

为什么我们还需要抖动技术（Dithering）？

社区洞察

Itiner-E：古罗马道路的数字地图集

社区洞察

1月28日，星期六，在这里每天60秒读懂世界！

每天秒读懂世界 2025-11-13

相关文章