
统一日志与追踪:Observability Analytics 支持 SQL 查询

开发和 SRE 面对分散的日志和追踪数据,想定位一个跨微服务的慢请求或 AI agent 的失败根因,往往得在不同工具间来回切换、手动拼凑上下文,效率极低。更糟的是,为了做聚合分析还得把数据导出到外部系统,成本高、延迟大。核心痛苦就是日志和追踪数据割裂,导致排查和优化都像盲人摸象。
Google Cloud 这次把 Log Analytics 升级成 Observability Analytics,核心思路就是不再让你搬数据。它直接在 Cloud Logging 和 Trace 原位上支持 SQL 查询,一条 SQL 就能把日志和追踪 span join 起来,比如找出所有耗时超 5 秒的 checkout 请求,然后立即看到是哪个内部微服务最慢。对 AI agent 场景,还能批量分析数千次工具调用的失败率和 P95 延迟,定位瓶颈。这相当于给可观测性加了一个灵活的查询层,不用再导出到 BigQuery 了。
我的看法是,这种“原位分析”思路比单纯加个仪表盘聪明得多,因为它真正降低了深度排查的门槛。尤其对于 AI agent 这类新负载,传统 trace 图根本看不过来,必须用聚合查询来系统化调试工具调用行为。另外,能和 BigQuery 业务表 join 也是隐藏亮点——技术延迟到底影响了多少转化率,终于能算清楚了。这会让可观测性从“看数据”变成真的“做决策”。


