PGNexus 每周新闻

本周 PostgreSQL 技术动态

本周涵盖多项重要 PostgreSQL 话题:TigerData 发布 pg_textsearch 1.0,提供原生 BM25 搜索,查询速度比 ParadeDB 快最高 6.5 倍;PostgreSQL 18 引入符合 SQL:2023 标准的 NOT ENFORCED 约束;Greenmask 发布多个新版本,新增 PostgreSQL 18 支持和数据匿名化功能;同时深入分析峰值吞吐量基准测试为何会误导运维人员,掩盖 autovacuum、WAL 和索引退化导致的持续性能瓶颈。

pg_textsearch 1.0:在 Postgres Pages 上构建 BM25 搜索引擎的方法

2026年3月31日 | Todd J. Green

pg_textsearch 1.0:在 Postgres Pages 上构建 BM25 搜索引擎的方法

TigerData 发布了 pg_textsearch 1.0,这是一个直接构建在 PostgreSQL 存储层上的原生 BM25 搜索引擎。与 PostgreSQL 内置的 ts_rank 缺乏逆文档频率和词频饱和度不同,pg_textsearch 实现了真正的 BM25 评分,并采用 Block-Max WAND 优化来高效处理 top-k 查询。该扩…

阅读原文
Postgres 性能分析:为什么吞吐量峰值基准测试无法反映真实问题

2026年3月27日 | Matty Stratton

Postgres 性能分析:为什么吞吐量峰值基准测试无法反映真实问题

传统的 PostgreSQL 基准测试通常只测量峰值吞吐量,但会遗漏关键的生产环境问题。虽然基准测试可能显示每秒 80,000 次插入且延迟表现良好,但在持续运行数月后,生产环境会暴露不同的约束条件。真正重要的指标是持续吞吐量上限——即所有维护进程(autovacuum、检查点、WAL 归档、复制)能够无限期跟上的写入速率。随着数据增长,这个上限会下降,主…

阅读原文

Top 5 Hacker 技术讨论

当前开发涉及多个方向:索引预取(v19,收到扫描抽象架构反馈)、pg_plan_advice(存在断言失败、锁竞争、内存泄漏及六大设计维度争议,v19 发布前悬而未决)、通过消除 xl_heap_visible 减少 WAL(已提交,foreach 清理推迟至冻结后)、使用 rdtsc 优化 EXPLAIN ANALYZE 计时(首个补丁已合入)、以及逻辑复制发布中的模式跳过功能(文档结构审查后已提交)。贯穿各讨论的共同主题包括代码可读性、锁性能及补丁增量协调。

发布项目中跳过模式更改

这个讨论涉及PostgreSQL发布中跳过模式变更的补丁。Peter Smith对补丁v4版本提供了审查意见,特别询问了psql中制表符补全格式的问题,即括号周围的空格在不同版本间发生了变化。Hayato Kuroda解释说,根据代码库中的现有示例,括号前后的空格是合适的。Peter接受了这个解释,表示他只是想确认从v3到v4的格式变更是否是故意的。随后A…

阅读讨论
索引预取机制

Peter Geoghegan 提交了 index prefetching 补丁的 v19 版本,回应了 Andres Freund 对 v18 的反馈。主要改进包括将 heap_hot_search_buffer 移至新的 heapam_indexscan.c 文件以获得性能提升,在 Andres 最近的提交使其变得不必要后移除了 UnlockBuffe…

阅读讨论
减少 WAL 日志:移除 xl_heap_visible 记录(并最终改为访问时设置 VM)

Melanie Plageman已经提交了消除xl_heap_visible WAL记录的补丁,用于减少预写日志的开销。David Rowley审查了最终版本(v48-0001),并提出了一个小建议:在standard_planner()中填充Bitmapsets时,应该使用foreach_int()和foreach_node()而不是通用的foreach…

阅读讨论
PostgreSQL 查询计划优化建议工具

讨论围绕Robert Haas最近提交的pg_plan_advice功能出现的问题展开。Alexander Lakhin报告说,虽然来自skink和morepork等buildfarm机器的初始故障尚未重现,但更改某些GUC会触发警告和断言失败。当join_collapse_limit被提高(导致使用GEQO)以及特定参数组合(包括enable_paral…

阅读讨论
能否用 rdtsc 来降低 EXPLAIN ANALYZE 的计时开销?

John Naylor 推送了一个补丁系列的第一个补丁,该系列旨在使用 rdtsc 减少 EXPLAIN ANALYZE 的计时开销。讨论重点围绕一个小的代码审查问题,Lukas Fittl 同意将单字母参数名 "r" 改为 "reg" 以提高可读性。John 采纳了这个建议并实施了修改,同时将一些注释变更从补丁 0005 移到当前补丁中,以减少与即将到来…

阅读讨论

本周行业动态

Mistral 发布开源语音生成模型进军语音 AI 市场,Google 推出聊天机器人切换工具以吸引用户迁移至 Gemini。Anthropic 的 Claude 今年付费订阅用户数增长超一倍。Oracle 通过凌晨邮件裁员多达 3 万人,以释放数十亿美元现金流支持激进的 AI 基础设施扩张,尽管公司已背负 580 亿美元新增债务。

Mistral 发布开源语音生成模型

techcrunch.com

Mistral 发布开源语音生成模型

法国 AI 公司 Mistral 发布了一款专为语音生成设计的新开源模型,主要面向企业级语音代理在销售和客户服务方面的应用。这一发布使 Mistral 与 ElevenLabs、Deepgram 和 OpenAI 等语音 AI 市场的成熟企业形成直接竞争。该模型让企业能够构建定制化的语音代理,将 Mistral 的产品组合从基于文本的 AI 扩展到快速增长…

Google推出Gemini聊天机器人切换功能

techcrunch.com

Google推出Gemini聊天机器人切换功能

Google推出了新的"切换工具",让用户能够将聊天记录和个人信息从其他聊天机器人直接转移到Gemini。这项功能旨在让竞争对手AI助手的用户更容易迁移到Google的聊天机器人平台。该工具实现了无缝数据迁移,可能在竞争激烈的AI助手市场中为Google带来竞争优势。此举体现了Google通过消除切换阻力并利用现有用户数据和对话历史来吸引竞争平台用户的努力。

techcrunch.com

Claude 付费用户数激增,成为消费者新宠

Anthropic的AI助手Claude在付费订阅方面正在快速增长,该公司表示今年的付费订阅用户数量增长了一倍多。虽然总用户数估算差异很大,从1800万到3000万不等,但付费用户的激增表明了强劲的市场接受度。这一增长使Claude成为消费者AI助手市场的重要竞争者。这一成功反映出消费者对AI服务付费意愿的提高,标志着从免费试验性使用向付费专业应用的转变。…

Oracle凌晨6点冷血邮件裁撤3万名员工

eu.36kr.com

Oracle凌晨6点冷血邮件裁撤3万名员工

Oracle宣布大规模裁员,全球范围内裁撤2万至3万名员工,约占其16.2万名员工的18%。解聘通知在美东时间凌晨6点左右通过电子邮件发送,未事先由人力资源部门或经理发出任何警告。受影响的团队包括RHS(收入与健康科学)、SVOS(SaaS和虚拟运营服务)以及NetSuite印度开发中心,部分部门裁员比例达30%或以上。此次裁员与Oracle激进扩张AI基…

想要了解更多 PostgreSQL 社区和行业消息吗?
访问 PGNexus 了解更多