assets/2026-05-30-质效精研-系列预告_2026-06-01_09-49-25.jpg

今天这篇没有按照规划的顺序来, 因为工作中遇到, 就把P29先写出来了, 请见谅, 后期系列完结会按顺序整理一篇 汇总版 .

[!ABSTRACT] 核心摘要
项目编号:质效精研 · P29
专业领域:医院数据治理 / 统计指标标准化
核心命题:当同一个指标在不同口径下得出截然不同的数字时,医院数据治理该怎么做?
三条战线

  • 🟢 基础扫盲:总诊疗人次、出院人次、占用床日、手术量、三四级手术——五大指标的每一种「口径分岔」全拆解
  • 🟡 实战操作:多口径并存 vs 统一口径 vs 混合策略——三种治理哲学的利弊权衡与落地路径
  • 🔴 极客升维:主数据管理平台 + 口径自动校验 + 数据血缘追踪——让口径不再依赖人脑记忆
    目标篇幅:10,000 字

前言:一个让所有质控人都崩溃过的场景

年终总结会上。

医务部主任:「今年我院门诊量 142 万,同比增长 8%。」

财务科科长打断:「不对,我们收费系统统计的是 131 万。」

信息科主任扶了扶眼镜:「HIS 后台日报汇总是 138 万。」

院长脸色铁青,看向你——质管办主任:「到底哪个数是对的?」

你深吸一口气,站起来说:「都对。」

会议室安静了三秒。然后院长差点把杯子摔了。

这不是一个虚构的场景。这是中国绝大多数三级医院每年都会上演的真实剧情。同一个医院、同一年度、同一个指标——「门诊量」——医务部、财务科、信息科、医保办、质管办各自拉出来的数据,可以差出 10 万。

而当你追问每个人「你的口径是什么」的时候,你会发现——他们每个人都有自己的道理

  • 医务部用的是挂号系统的「挂号人次」(含退号,含体检挂号)
  • 财务科用的是收费系统的「结算人次」(不含退号,不含免费号)
  • 信息科用的是 HIS 的「接诊记录条数」(一个患者在同一天看两个科,算两次)
  • 医保办只统计「医保结算的门诊人次」(不含自费患者)
  • 质管办用的是卫统报表口径(含急诊,不含单纯开药和体检)

五个部门,五种口径,五种数字。没有一个是错的,但也没有一个能和别人对上。

这就是数据治理中最不性感、最不炫技、但最要命的问题——口径。

它不像 AI 辅助诊断那么酷,不像手术机器人那么炫,不像「数字化转型」那么有战略高度。但它是所有这一切的地基。地基歪了,上面盖再高的楼也是危楼。

狼叔在做质控培训时,习惯先问现场学员一个问题:「你们医院的『门诊量』是怎么算的?三秒钟之内,能答出来的人请举手。」五十个人的会场,通常不超过三个手举起来。

今天这篇文章,我们就来把这个「地基」一砖一瓦地翻开来看:基础指标到底有哪些天然的歧义?不同的口径为什么会产生不同的数字?面对这些歧义,医院应该选择「多口径并存」还是「强行统一」?最后,如何用技术手段把这些口径锁死在系统里,让「数据打架」成为历史?


Part 1:基础扫盲层——五大基础指标的「口径迷宫」

本层目标:让每一位质控人、统计员、信息科工程师,看清楚医院最基础的五个指标到底有多少种可能的统计口径,以及每一种口径产生的数字差异有多大。

任何一个做过医院统计的人都知道,绝大多数分析指标——平均住院日、病床使用率、手术占比、CMI、科室效率、人均工作量——它们的分子或分母都逃不开以下五个「元指标」:

  1. 总诊疗人次(门诊量)
  2. 出院人次
  3. 占用床日数
  4. 手术量
  5. 三四级手术量

这五个元指标就像是数据世界的「基本粒子」。它们的一丁点波动,会沿着所有衍生指标产生雪崩式的连锁反应。而它们天然就具备高度的口径敏感性——每一条「取数边界」稍微挪动一下,数字就翻篇。

下面,我把每一个指标的「口径迷宫」拆开给你看。

1.1 总诊疗人次——门诊量到底算「到院的人」还是「挂了号的人」?

这是所有指标中使用频率最高、口径分歧最多、也是最容易「打脸」的一个指标。我画一张表,让你直观感受它的复杂性:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
┌──────────────────────────────────────────────────────────────┐
│ 总诊疗人次 · 口径分岔全景图 │
├──────────┬────────────────────┬────────────┬─────────────────┤
│ 分岔点 │ 口径选项A │ 口径选项B │ 数字差异级 │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 急诊 │ 包含急诊人次 │ 不含急诊 │ 可差 15%-30% │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 体检 │ 包含体检人次 │ 不含体检 │ 可差 5%-15% │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 社康/分院│ 包含社康/分院数据 │ 仅本院区 │ 可差 20%-50% │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 单纯开药 │ 包含(挂号即算) │ 不含 │ 可差 3%-8% │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 退号 │ 含退号(挂号人次) │ 不含退号 │ 可差 2%-5% │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 一次多科 │ 按挂号次数算(n次) │ 按患者算(1次)│ 可差 10%-20% │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 统计时点 │ 挂号时间 │ 接诊时间 │ 跨日/跨月差异 │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 互联网 │ 包含线上问诊 │ 不含 │ 越来越大的差异 │
│ 诊疗 │ │ │ │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 本院职工 │ 包含职工就诊 │ 不含 │ 可差 1%-3% │
├──────────┼────────────────────┼────────────┼─────────────────┤
│ 多院区 │ 合并 vs 分列 │ 按执业许可│ 组织架构影响 │
│ 归口 │ 按管理归属 │ 证归口 │ │
└──────────┴────────────────────┴────────────┴─────────────────┘

实战案例

某省会城市三甲医院,2024 年度「门诊量」的五个版本:

数据来源 口径描述 数字
挂号系统 所有挂号记录(含退号、含体检、含单纯开药) 178 万
HIS 接诊 医生工作站实际接诊记录 152 万
收费系统 产生费用的门诊结算记录 143 万
医保上传 医保结算的门诊人次 89 万
卫统报表 按国家卫统制度口径(不含单纯检查/开药/体检) 136 万

最高 178 万,最低 89 万,差距接近一倍。而医院对外宣传用的是「年门诊量突破 170 万」(取的挂号系统),卫健委考核用的却是「136 万」——一个医院,两张面孔。

[!WARNING] 关键洞察
门诊量口径的核心矛盾在于:是一张「号」就算一次?还是一个「人」来一次算一次?还是一个「医生看了」算一次?还是一笔「费用产生了」算一次? 这四个问题的答案决定了这个指标的本质定义——它到底在衡量「流量」「服务量」「工作量」还是「收入单元量」。不同的使用场景需要不同的定义。

1.2 出院人次——以哪天为准?以谁为准?

如果说门诊量的问题在于「算谁」,出院人次的问题则在于「算哪天」和「算什么状态」。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
┌──────────────────────────────────────────────────────────────┐
│ 出院人次 · 口径分岔全景图 │
├──────────────┬──────────────────┬────────────┬───────────────┤
│ 分岔点 │ 口径选项A │ 口径选项B │ 影响 │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 统计时点 │ 出院日期 │ 入院日期 │ 年月切面差异大 │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 结算状态 │ 已结算才算 │ 办理出院即算│ 跨月未结算差异 │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 在院病人 │ 不含在院病人 │ 含在院出院 │ 实时快照vs期间 │
│ │ │(已出院) │ │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 死亡患者 │ 包含 │ 不含 │ 死亡率计算影响 │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 转科患者 │ 按最后科室计 │ 按入院科室计 │ 科室绩效差异 │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 24h内出入院 │ 包含 │ 不含 │ 可差 3%-8% │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 新生儿 │ 含产科新生儿 │ 仅NICU │ 产科医院差异大 │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 日间病房 │ 含日间住院 │ 仅常规住院 │ 可差 10%-20% │
├──────────────┼──────────────────┼────────────┼───────────────┤
│ 跨年结算 │ 出院日期归年 │ 结算日期归年 │ 年底月初差异 │
└──────────────┴──────────────────┴────────────┴───────────────┘

实战案例

某院 2024 年 12 月 31 日这一天,发生了如下事件:

  • 患者 A 上午办理出院手续,下午结账 → 算不算 12 月的出院人次?
  • 患者 B 12 月 29 日出院,1 月 3 日才来结账 → 算哪个月?
  • 患者 C 于 12 月 31 日从心内科转至呼吸科,1 月 2 日从呼吸科出院 → 归哪个科?算哪个月?
  • 患者 D 是产科新生儿,出生后即入 NICU,1 月 5 日出院 → 算产科还是儿科?

这四个患者在三个不同口径下(按出院日期、按结算日期、按科室归属),会出现在完全不同的报表格子中。这也是为什么财务科和医务部的出院人次永远对不上——财务科关心的是什么时候收到钱,医务部关心的是什么时候人走了。当这两个时间点不重合(跨月),差异就产生了。

「在院」这个维度尤其容易被忽略。 如果院领导问:「现在全院住了多少病人?」不同系统给出的答案可能是:

  • HIS 住院系统:当前在院病人(实时)
  • 护理系统:当前在科病人(含刚转来但 HIS 尚未更新的)
  • 结算系统:当前未办理出院结算的(含人已走但未结账的)

这三个数字的差异不是误差,是时间差和状态差。但如果你不定义清楚你要的是哪个维度的「在院」,你永远不知道自己拿到的是什么。

1.3 占用床日数——是「人头×天数」还是「床位×每天累加」?

这个指标有两个经典的计算口径,给出的数字可能天差地别:

口径一:出院者占用总床日数

公式 = 所有出院患者的「住院天数」之和
住院天数 = 出院日期 - 入院日期(当天不算或算半天,各地不同)

口径二:实际占用总床日数

公式 = 每天零点在院患者数的逐日累加
即:1 月 1 日在院 500 人 + 1 月 2 日在院 502 人 + …… + 1 月 31 日在院 495 人

这两个口径的核心差异在于:

维度 出院者占用床日 实际占用床日
数据来源 病案首页(回顾性) HIS 在院快照(实时)
覆盖范围 仅统计已出院患者 含在院患者(未出院也计入)
时间窗口 按出院日期归属 按实际发生的每一天
适用场景 最终报表、成本核算 运营监控、床位调配
差异方向 出院者 ≤ 实际占用(长住院患者出院前不计入前者)

一个极端的例子:某院 ICU 有一个住院超过 365 天的长期患者。在「出院者占用床日」口径下,这位患者 365 天的床日全部集中在出院的那一天所归属的月份和年度——这意味着前 11 个月的报表里,这位患者「不存在」。但在「实际占用床日」口径下,他每一天都在。

这也是为什么,当你用出院者占用床日来计算「平均住院日」时,你可能高估了真实水平——因为长期住院患者尚未出院,他们被排除在分母之外。

[!INFO] 卫统的口径选择
国家卫生统计报表采用的是「实际占用总床日数」口径,要求在指定时段内「每天 24 时在院人数」逐日累加。这意味着医院需要 HIS 系统具备每天零点的自动快照能力。如果你的 HIS 做不到这一点(很多老系统确实做不到),你就只能在月末用出院者床日数「近似替代」——然后祈祷没有人来审计你。

1.4 手术量——最大的坑:到底什么才算「手术」?

如果说门诊量和出院人次的争议在于「从哪里取数」,手术量的争议则上升到了哲学层面——「什么是手术?」

这个问题看起来莫名其妙,但在医院数据治理中,它是所有坑里最深的一个。我们一层一层拆:

第一层:手术编码的边界在哪里?

国家临床版手术操作代码(ICD-9-CM-3)包含了从「开颅手术」到「清创缝合」到「导尿」的全部操作。但日常管理中说的「手术量」显然不等于「所有有编码的操作量」——否则导尿也算手术,拆线也算手术,那么手术量将毫无意义。

问题来了:谁来决定「什么编码算手术」?

  • 院内的手术分级目录?
  • 国考的手术目录?
  • 医保的收费项目分类?
  • 广东省三甲评审的手术定义?
  • 科室自己认为的手术?

每一个来源对「手术」的边界都不一样。医保不关心是不是手术,只关心给不给报销;国考关心的是四级手术占比,它的重点在「高难度」;而科室关心的是一切有创操作——包括那些没有 ICD 编码但临床意义重大的操作。

第二层:场所在哪里重要吗?

场景 算不算手术?
在手术室做的腹腔镜胆囊切除术 ✅ 毫无疑问
在内镜中心做的肠镜下息肉切除术 ❓ 争议
在门诊手术室做的体表肿物切除 ❓ 争议
在 DSA 介入室做的冠状动脉支架植入 ❓ 争议
在超声引导下做的肝穿刺活检 ❓ 争议
在 ICU 床旁做的气管切开 ❓ 争议

如果按「在手术室做的」来算,肠镜息肉切除不算手术(内镜中心),但 ICU 床旁气管切开也不算——这显然不符合临床常识。如果按「有创操作」来算,导尿、抽血、清创缝合全算手术——这又太宽了。

第三层:同一个人做两次算几次?

某患者住院期间做了两次手术:入院第 2 天做了冠脉造影 + 支架植入,入院第 5 天因术后并发症做了二次探查手术。

  • 手术台次算:2 次
  • 手术患者数算:1 人(该患者视为一个「手术病人」)
  • 四级手术量算:2 次(如果两次都是四级)

这三种口径分别服务于不同的管理需求——手术室排班关心台次,医务部绩效关心患者数,国考上报关心四级手术量。它们不是互相替代的关系,而是互补视角。

第四层:按哪天算?

  • 手术发生的实际日期 → 真实反映手术室工作负荷
  • 患者的出院日期 → 与出院人次对齐,方便做关联分析

当患者跨月住院时(比如 6 月 28 日手术,7 月 3 日出院),这两种算法给出的月度分布完全不同。

第五层:只有收费名称、没有 ICD 编码的怎么算?

这是最令人头疼的「灰色地带」。很多医院存在大量「有操作、有收费、但病案首页没有编码」的手术记录——原因可能是:

  • 门诊手术不需要首页编码
  • 部分操作尚未进入编码体系
  • 编码员资源不足,部分操作漏编
  • 信息系统不互联,收费系统和病案系统是两套独立的数据库

这部分「隐形手术」的体量有多大?笔者的调研显示,在不同医院中,它可以占到手术总量的 5%-20%。如果以病案首页编码为准,这部分手术就是「不存在的手术」。

1
2
3
4
5
6
7
8
9
10
11
┌──────────────────────────────────────────────────────────────┐
│ 手术量 · 七大分岔维度全景图 │
├────────────────────┬─────────────────────────────────────────┤
│ ① 手术定义 │ 有ICD编码就算?/ 按院内分级目录?/ 按国考? │
│ ② 手术场所 │ 仅手术室?/ 含内镜中心?/ 含DSA?/ 含门诊? │
│ ③ 计数单位 │ 按台次?/ 按患者?/ 按四级手术? │
│ ④ 时间归属 │ 按手术发生日期?/ 按出院日期? │
│ ⑤ 编码缺口 │ 仅有收费无编码的算不算? │
│ ⑥ 日间手术 │ 单独统计还是合并? │
│ ⑦ 非计划重返 │ 算一次还是两次? │
└────────────────────┴─────────────────────────────────────────┘

1.5 三四级手术量——同一台手术,在院内是四级,国考可能是三级

这个问题的荒诞程度,足以让任何一个质控人血压升高。

院内手术分级:根据《医疗机构手术分级管理办法》,由医院手术分级管理委员会自行确定。标准是什么?「根据手术的风险性、难易程度和资源消耗」。这三个词——风险性、难易程度、资源消耗——都是定性词,不是定量词。于是,同一台手术:

  • 在 A 医院被列为四级(因为 A 医院没有这个亚专业,做得很吃力)
  • 在 B 医院被列为三级(因为 B 医院有全国顶尖的该亚专业团队,做起来跟切菜一样)

国考四级手术:国家卫健委每年发布《四级手术目录》,这是一个硬性清单——某种手术编码在不在这个清单里,决定了它是不是国考口径下的「四级手术」。

矛盾来了:某医院将「腹腔镜辅助远端胃癌根治术」列为自己院内的四级手术(因为它确实难度很大),但国考目录可能将其列为三级(因为在国家级专家的认知中,这只是胃癌手术的常规操作)。那么,在国考报表中,这台手术不能计入四级手术量。

更具体地说,会出现三种情况:

院内分级 国考分级 院内报表 国考报表 影响
四级 四级 计入四级 计入四级 ✅ 一致
四级 三级 计入四级 不计入 ⚠️ 差 1 台
三级 四级 不计入 计入 ⚠️ 差 1 台

当医院的「院内分级标准」和「国考目录」不一致时,院内管理报表中的「四级手术占比」和国考成绩中的「四级手术占比」可能就是两个完全不同的数字。而且这两个数字的差距不是「计算错误」,而是评级标准本身不同

1.6 更多隐藏的「口径地雷」

以上五个指标只是冰山一角。在实际工作中,还有大量看似简单、实则暗藏歧义的基础指标:

「入院人数」

  • 含不含 24 小时内出入院患者?
  • 含不含日间病房?
  • 含不含产科新生儿(新生儿与产妇分开建床还是一床两人)?
  • 医保患者和自费患者是合并还是分开?
  • 转科患者算几次入院?

「床位编制数」

  • 以卫健委批准的编制床位为准,还是以实际开放床位为准?
  • 加床算不算?
  • 疫情期间征用后又还回来的床位怎么算?
  • 分院区是合计还是分列?

「平均住院日」

  • 分子(住院天数)= 出院日期 - 入院日期?还是按小时折算?
  • 当天出入院算 0 天还是 1 天?
  • 转科患者的住院天数在转出科和转入科之间怎么分?
  • 分母不含 24 小时内出入院的,分母一变平均值就大变

「住院死亡率」

  • 是「住院期间死亡」还是「出院诊断为死亡」?
  • 自己要求出院回家、到家后死亡的患者,算不算?
  • 急诊抢救室死亡的患者(未办理住院),是否纳入住院死亡率?

「非计划重返手术室率」

  • 「非计划」怎么定义?是「术前讨论未提及的」还是「出院前新发的」?
  • 重返的时间窗口是 24 小时、48 小时、72 小时还是住院期间任意时间?
  • 因术后出血重返和因切口感染重返,算不算同一类指标?

「抢救次数」

  • 一个患者同一天抢救了三次,算一次还是三次?
  • 家属签字放弃的抢救算不算?
  • 门诊抢救和住院抢救是否分开?

[!INFO] 核心认知
每一个指标的口径问题,本质上都是在回答同一个问题:「这个指标的受众是谁?他们要拿这个数字做什么决策?」 口径不是绝对的对错问题,而是适用性问题。面向卫健委上报,用卫统口径;面向院内运营管理,用院内口径;面向科室绩效考核,还要叠加科室归属逻辑。搞清「给谁看、干什么用」是口径治理的起点。


Part 2:实战进阶层——口径治理的两种哲学与混合策略

本层目标:让质控主任和信息科负责人掌握「该用多口径并存还是统一口径」的判断框架,以及口径字典的建立方法。

2.1 哲学分歧:多口径并存 vs 统一口径

在数据治理界,关于口径的策略存在两种截然对立的哲学立场。我先把它们各自的逻辑摊开来:

立场 A:多口径并存(Each consumer, Each caliber)

核心逻辑:不同的使用者有不同的业务场景,强行统一口径只会导致「所有人都不满意」。 与其削足适履,不如按需定制。

优势:

  • 每个部门拿到自己业务所需的数字,不需要「翻译」
  • 灵活性高,能适应不同的外部上报要求(卫健委要 A 口径,医保局要 B 口径,院长要看 C 口径——全给)
  • 保留数据全貌,不会因为暴力统一而丢失信息

劣势:

  • 数据冗余:同一份数据要维护多套口径逻辑
  • 口径膨胀:随着时间的推移,会不断有人提出新的口径需求,最终变成 50 套口径共存
  • 解释成本:每一次跨部门开会,前 15 分钟都在「对口径」
  • 容易产生「数字便利」——对外宣传挑最大的数,对内考核挑最小的数

立场 B:统一口径(One caliber to rule them all)

核心逻辑:一个医院只能有一个官方数字,否则就是「数据混乱」。 以国家卫统制度为基准,所有部门统一使用同一口径。

优势:

  • 数据一致性:所有报表、所有会议、所有报告引用同一个数字,不存在「数据打架」
  • 简化管理:只需维护一套取数规则
  • 权威性:对外口径一致,避免外界质疑

劣势:

  • 削足适履:强制所有部门用卫统口径,财务科不干了(「我要的是实际结算数!」);医务部也不干了(「我要的是服务量,不是上报数!」)
  • 业务场景不兼容:卫统口径也不一定能解决所有问题。比如,卫统要求「门诊人次不含单纯检查」,但院领导想看「所有来院的人」(因为涉及停车位规划和安保配置)
  • 历史包袱:如果过去五年的数据都是按旧口径统计的,突然换口径会导致「同比失去意义」

2.2 狼叔的实战答案:混合策略——「主数据口径 + 场景口径 + 口径标签」

我给出的实战答案是:既不是全量多口径,也不是强行统一,而是一个三层的混合架构。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
┌──────────────────────────────────────────────────────────────┐
│ 口径治理的三层混合架构 │
├──────────────────────────────────────────────────────────────┤
│ │
│ 第一层:主数据口径(全院唯一真相来源) │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ · 由质管办牵头,联合医务、财务、信息、医保共同确认 │ │
│ │ · 每年修订一次,全院统一执行 │ │
│ │ · 所有「对外报告、院内考核、历史对比」以此为准 │ │
│ │ · 必须写在制度文件里,经院长办公会审议通过 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ ↕ │
│ 第二层:场景口径(满足特殊业务需求) │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ · 医保结算口径(面向医保局上传) │ │
│ │ · 财务管理口径(面向成本核算和收费统计) │ │
│ │ · 运营管理口径(面向实时床位调度和排班) │ │
│ │ · 科室绩效口径(面向绩效分配,含科室归属逻辑) │ │
│ │ · 每一个场景口径必须明确标注与主数据口径的差异和换算关系 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ ↕ │
│ 第三层:口径标签(元数据层,确保可追溯) │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ · 每一个数字都携带其口径标签 │ │
│ │ · 标签内容包括:取数来源、取数时点、边界条件、 │ │
│ │ 适用场景、与主数据口径的差异说明 │ │
│ │ · 报表展示时,数字后面自动带上口径标签(或悬停提示) │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │
└──────────────────────────────────────────────────────────────┘

实操示例:门诊量的三层口径体系

层级 口径名称 口径定义 数字(2024年度) 用途
主数据 门急诊总人次 HIS 医生工作站实际接诊记录数(不含单纯开药、不含体检、不含退号) 136 万 对外报告、院内考核、历史对比
场景A 门急诊结算人次 产生费用的门急诊结算记录数(含单纯开药,不含退号) 143 万 财务科成本核算
场景B 门急诊到院人次 所有挂号后到院的人次(含退号,按人头去重) 152 万 安保/后勤/停车位规划
场景C 医保门急诊人次 医保结算的上传数据 89 万 医保局报表

四个数字,四种用途。没人撒谎,没人出错。区别只在于——你到底问的是谁的问题。

2.3 口径字典:把每一条取数规则写成「谁都能看懂的话」

三层架构要落地,核心工具就是口径字典。这不是一个花哨的概念,而是一张实实在在的表。我提供一个实战模板:

口径字典模板(以「出院人次」为例)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
┌──────────────────────────────────────────────────────────────┐
│ 指标口径字典 │
├──────────────────────────────────────────────────────────────┤
│ │
│ 指标编码:IND-002 │
│ 指标名称:出院人次 │
│ 指标层级:主数据口径 │
│ 业务定义:在统计周期内,办理了出院手续并完成结算的住院患者人次 │
│ │
│ 【取数规则】 │
│ 数据来源:HIS住院管理系统 - 出院登记模块 │
│ 取数SQL/逻辑: │
│ SELECT COUNT(DISTINCT patient_id) │
│ FROM inpatient_record │
│ WHERE discharge_date BETWEEN '{start_date}' AND '{end_date}'│
│ AND discharge_status = '已完成' │
│ AND discharge_type NOT IN ('转科', '自动出院未结算') │
│ │
│ 【边界条件】 │
│ 包含:已结算出院的全部患者(含死亡、24h内出入院) │
│ 不包含:仅办理出院手续但未结算的(计入结算完成当月) │
│ 不包含:转科(转科不产生新的出院记录) │
│ 特殊处理:产科新生儿单独建床的,按独立出院人次计入 │
│ 日间病房:单独统计,不计入常规出院人次(见IND-002B) │
│ │
│ 【与场景口径的差异】 │
│ - 与财务口径(IND-002-FIN)的差异: │
│ 财务口径以结算日期为准,可能导致跨月差异 │
│ 主数据口径以出院日期为准 │
│ 月度差异通常在 2%-5% 之间 │
│ - 与医保口径(IND-002-MI)的差异: │
│ 医保口径仅含医保结算患者(不含全自费/工伤/异地未直结) │
│ 主数据口径含所有患者 │
│ │
│ 【适用场景】 │
│ · 卫统报表上报 │
│ · 国考指标计算(次均费用、平均住院日等)的分母 │
│ · 院内年度统计公报 │
│ · 科室效率指标对比 │
│ │
│ 【修订记录】 │
│ V1.0 2024-01-15 首次发布 起草人:质管办 │
│ V1.1 2024-06-20 新增日间病房排除规则 修订人:质管办 │
│ │
└──────────────────────────────────────────────────────────────┘

[!TIP] 落地要诀
口径字典的核心价值不在于「写得多详细」,而在于「有没有人维护」和「有没有人遵守」。建议:

  • 指定质管办一名专人担任「口径管理员」,负责字典的维护和版本管理
  • 每年 12 月进行一次全量修订,年中进行一次半年核查
  • 任何部门提出新口径需求时,必须先写入字典,再开发取数脚本
  • 字典放在 OA 知识库或内部 Wiki 中,全院可查阅(只读)

2.4 口径落地最容易被忽视的三件事

第一件:退号的处理逻辑

一个看似微不足道的退号,如果处理不当,会在挂号系统和接诊系统之间产生永久性的差异。建议规则:

  • 当日退号:挂号系统标记作废,不进入任何统计
  • 跨日退号(次日退前一天的号):挂号系统标记作废并从原日期的挂号人次中减去
  • 已经接诊后退号:极其罕见但确实存在。如果有,视为已产生诊疗记录,不退号

第二件:跨年未结算患者的归属

每年 12 月 31 日都会产生一批「已出院但未结算」的患者。他们在新年的 1 月初来结账。这笔数据如何归属?

两个选项:

  • 按出院日期计入上一年(保持统计口径纯净,但财务对不上)
  • 按结算日期计入新一年(和财务对齐,但统计上出现「去年出院的新年患者」)

笔者的建议:统计口径按出院日期,财务口径按结算日期。在口径字典中明确标注差异。不要试图抹平它——抹不平的。 年终对账时,把差异作为「未结算出院人次调节项」列出来,比硬性统一更诚实也更实用。

第三件:多院区的归口原则

当一个医院集团有多个院区时,指标归口的原则是什么?

  • 按执业许可证归属?(法律地位)
  • 按组织管理归属?(行政关系)
  • 按地理位置?(物理边界)

这三种归口原则适用于不同场景。建议在口径字典中同时保留「按院区」和「按管理归属」两套维度,并在报表中支持按两种维度分别下钻。


Part 3:高阶极客层——用系统「锁死」口径

本层目标:让信息化负责人掌握如何通过主数据管理平台、口径自动校验和数据血缘追踪,将口径规则从「人脑记忆」转化为「系统强制」。

3.1 主数据管理平台:所有指标的唯一源头

口径混乱的根源在于——每个系统都有自己的数据字典,而且彼此不通。

  • HIS 里「科室」叫「心血管内科」
  • 病案系统里叫「心内科」
  • 人事系统里叫「心脏中心」
  • 医保上传系统里要求用标准科室代码

同一个科室,四个名字。任何跨系统的数据分析都在这个层面就开始出错了——你还没算指标呢,连数据都合并不上。

主数据管理平台(MDM)的职责就是:定义并维护全院唯一的标准数据字典。

核心主数据包括:

主数据类型 内容 维护部门
组织机构 科室、病区、护理单元的标准名称和编码 医务处
人员 医护技人员的唯一 ID、姓名、职称、科室归属 人事科
患者索引 患者唯一标识(EMPI),关联多次就诊记录 信息科
ICD 字典 诊断编码和手术操作编码的标准版本 病案室
收费项目 医疗服务项目、药品、耗材的标准名称和编码 财务科

有了 MDM 之后,口径治理就变成了:

不再问「谁取了什么数」,而是问「这个数是从主数据口径的哪个映射路径来的」。

3.2 口径自动校验:让系统帮你「查口径」

人工校验口径是不现实的——每个月几千条数据,没人能逐条看。但机器可以。

校验规则设计示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
┌──────────────────────────────────────────────────────────────┐
│ 口径自动校验规则示例 │
├──────────┬──────────────────────────────────┬────────────────┤
│ 校验规则 │ 逻辑 │ 违规示例 │
├──────────┼──────────────────────────────────┼────────────────┤
│ 出院日期 │ 出院日期 ≥ 入院日期 │ 出院日期早于 │
│ 合理性 │ 且 ≤ 入院日期 + 365 天 │ 入院日期 │
├──────────┼──────────────────────────────────┼────────────────┤
│ 手术编码 │ 手术操作编码必须在 ICD-9-CM-3 │ 编码字典中不 │
│ 有效性 │ 有效编码范围内 │ 存在的编码 │
├──────────┼──────────────────────────────────┼────────────────┤
│ 切口愈合 │ 有手术记录则必须有切口愈合等级 │ 手术记录为空但 │
│ 等级 │ 无手术记录则必须为空 │ 切口等级不为空 │
├──────────┼──────────────────────────────────┼────────────────┤
│ 新生儿 │ 入院年龄 < 28 天 → 必须有出生体重 │ NICU 新生儿缺 │
│ 必填项 │ 和入院体重 │ 出生体重 │
├──────────┼──────────────────────────────────┼────────────────┤
│ 入出院 │ 入院科别和出院科别相同的, │ 自相矛盾的 │
│ 科别 │ 转科次数必须为 0 │ 记录 │
├──────────┼──────────────────────────────────┼────────────────┤
│ 费用与 │ 出院患者必须「费用合计 > 0」 │ 费用为 0 的 │
│ 出院状态 │ 除非离院方式为「死亡」或「自动出院」 │ 普通出院 │
├──────────┼──────────────────────────────────┼────────────────┤
│ 手术日期 │ 手术日期 ≥ 入院日期 │ 手术日期早于 │
│ 合理性 │ 且 ≤ 出院日期 │ 入院日期 │
└──────────┴──────────────────────────────────┴────────────────┘

这些校验规则可以配置在数据仓库的 ETL 流程中,当数据从业务系统抽取到数据仓库时,自动扫描一遍。违规记录不直接拒绝(避免数据丢失),而是标记为「口径异常」,并将异常清单每日推送给口径管理员。

3.3 数据血缘追踪:每一个数字的「出生证明」

这是口径治理的终极武器。但在解释它之前,我想先问你一个问题:

当院长问质管办主任「这个 136 万的门诊量是从哪里来的」时,你能否在 10 秒内回答:从哪个系统的哪张表、经过什么过滤条件、在哪一天跑的 SQL、由谁执行的?

大多数医院做不到。因为数据从 HIS 到报表的路程中,经过了太多「黑箱」——导出 Excel、手动整理、公式计算、复制粘贴。每一个环节都可能引入错误,而没有人能追溯错误来源。

数据血缘(Data Lineage)就是为每一个数字建立从源头到终端的完整追踪链:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
┌──────────────────────────────────────────────────────────────┐
│ 数据血缘追踪示例 │
├──────────────────────────────────────────────────────────────┤
│ │
│ HIS住院系统 │
│ └─ inpatient_record 表 │
│ └─ 抽取条件:discharge_date BETWEEN '2024-01-01' AND │
│ '2024-12-31' AND discharge_status = '已完成' │
│ └─ ETL作业 #DW-DAILY-003 执行时间:每日 02:00 │
│ └─ 写入 ODS 层表:ods_inpatient_discharge │
│ └─ 清洗规则:去除 test 患者、去除重复记录 │
│ └─ 聚合作业 #DW-MONTH-001 执行时间:每月1日 │
│ └─ 写入 DWD 层表:dwd_discharge_monthly │
│ └─ 口径过滤:主数据口径 IND-002 │
│ └─ 写入报表表:rpt_kpi_discharge │
│ └─ BI 看板:出院人次 = 45,821 │
│ │
│ 血缘追踪 ID:L-2024-IND002-12M │
│ 数据时点:2024年1月-12月 │
│ 最后更新:2025-01-01 03:15 │
│ 更新人:ETL_SYSTEM │
│ │
└──────────────────────────────────────────────────────────────┘

有了血缘追踪,任何一个数字都可以「反查」——它从哪里来、经过了哪些加工、谁在什么时候改过它。这是口径治理从「纪律管理」到「技术管理」的关键跨越。

[!INFO] 落地建议
数据血缘功能通常由数据治理平台(如 Apache Atlas、DataHub)或商业 BI 工具(如 Power BI 的数据血缘视图)提供。对于预算有限的医院,退而求其次的方案是:在一张 Excel 表里手动维护「报表 ↔ SQL ↔ 源表 ↘ 口径」的映射关系。 虽然原始,但至少做到了可追溯。比什么记录都没有强一万倍。

3.4 面向未来的架构建议

口径治理不是一朝一夕的事情。如果医院正在进行数字化转型规划,建议将以下三项纳入蓝图:

  1. 统一患者索引(EMPI):解决同一个患者多次就诊(门诊、住院、体检、急诊)中身份不统一的问题。这是所有指标聚合分析的基石。
  2. 指标中台:将全院所有 KPI 指标的计算逻辑封装在一个独立的指标服务层中。任何系统需要某个指标数据时,调用指标中台的 API 而非自己写 SQL。这保证了「同一个指标只有一个算法」。
  3. 口径版本管理:口径字典应纳入版本管理(Git 或类似的版本控制系统)。每次修改口径定义必须经过审批,保留修改历史,支持「回溯到某一历史版本口径重新计算」的能力。

结语:把「数据打架」变成历史

回到本文开头的那个年终总结会。

如果医院建立了口径字典——
如果 HIS、财务、病案三套系统共享了主数据——
如果每一个数字的出生证明(数据血缘)都可以实时追溯——
如果院长的管理驾驶舱里,每个指标旁边都有一个小小的「口径标签」——

那么质管办主任就不会站起来说「都对」了。

他会站起来,调出管理驾驶舱,指着屏幕上「门诊量 136 万(主数据口径——门急诊接诊总人次)」这个数字,说:

「院长,这是我们全院统一的主数据口径下的门诊量。如果您需要看财务结算口径,这里是 143 万;如果您关注到院总人次数,那是 152 万。每一个数字的取数规则都在口径字典里,我已经发到您的 OA。我们现在以主数据口径 136 万为准,同比去年增长 6.7%。」

那一刻,会议室不会安静。院长会说:「好,继续。」

这就是数据治理的价值——不是让数字变得完美,而是让数字变得诚实。

它不能让你少干活,但能让你干的活不再被质疑。它不能消除所有分歧,但能让分歧变得透明可解。它不能帮你回答「增长的 6.7% 是好还是不好」,但它能确保——你说的 6.7% 和财务科长手里的 6.7% 是同一个 6.7%。

对于一个医院的质量管理体系来说,这就是地基。地基打好了,你才能在上面建高楼。


质效精研系列 · 往期回顾

  • P1:[[2026-06-01-质效精研-P1-序言-重塑医质管知识体系|序言:为什么我们需要重塑医质管的知识体系?]]
  • P2:[[2026-06-02-质效精研-P2-顶层设计-三位一体质管架构|顶层设计:建立「三位一体」质管架构的逻辑与坑点]]
  • P3:[[2026-06-03-质效精研-P3-法规解码-万字实战手册|法规解码:三部核心法规的阶梯式实战全书]]
  • P4:[[2026-06-04-质效精研-P4-岗位职责-猫鼠游戏如何终结|岗位职责:质控员、科主任、质管办的「猫鼠游戏」如何终结?]]
  • P5:[[2026-06-05-质效精研-P5-文明建设-正义文化消除瞒报焦虑|文明建设:如何通过「正义文化」消除瞒报焦虑?]]