数据规范 · 让数据有规矩

📌 一句话理解

数据规范就是“给数据定规矩”:规定数据长什么样、怎么填、存哪里,让不同系统能看懂、能交换。


📏 数据规范是什么?

数据规范是指对数据的格式、类型、长度、取值范围等制定的统一标准。它就像“数据界的普通话”,让不同地方的数据能互相理解。

┌─────────────────────────────────────────────────────────────────┐
│                    没有规范 vs 有规范                            │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│   没有规范(混乱)                    有规范(统一)              │
│                                                                 │
│   ┌─────────────────────┐           ┌─────────────────────┐     │
│   │ 姓名:张三          │           │ 姓名:张三          │     │
│   │ 电话:13812345678   │           │ 电话:13812345678   │     │
│   │ 生日:1990.1.1      │           │ 生日:1990-01-01    │     │
│   └─────────────────────┘           └─────────────────────┘     │
│                                                                 │
│   ┌─────────────────────┐           ┌─────────────────────┐     │
│   │ name: 李四          │           │ 姓名:李四          │     │
│   │ tel: 13987654321    │           │ 电话:13987654321   │     │
│   │ birth: 1995/01/01   │           │ 生日:1995-01-01    │     │
│   └─────────────────────┘           └─────────────────────┘     │
│                                                                 │
│   同一人,不同写法                   统一格式,能互相理解         │
│   计算机看不懂!                      计算机能处理!              │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

🔧 数据规范包含哪些内容?

规范项说明例子
数据类型是什么类型的数据字符型、数字型、日期型
数据长度最多能填多少个字符用户名:8-16位
格式要求数据必须长什么样手机号:11位数字
取值范围只能填什么值性别:男/女
是否必填能不能空着姓名:必填
默认值不填时自动是什么状态:正常

📝 数据字典:规范的说明书

数据字典是数据规范的“说明书”,把每个数据的规则写清楚。

┌─────────────────────────────────────────────────────────────────┐
│                    数据字典示例                                  │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│   ┌─────────────────────────────────────────────────────────┐   │
│   │                                                         │   │
│   │  数据项名称:username(用户名)                          │   │
│   │  ├── 数据类型:字符型                                    │   │
│   │  ├── 长度要求:8-16位                                   │   │
│   │  ├── 格式要求:必须包含字母和数字                         │   │
│   │  ├── 是否必填:是                                        │   │
│   │  └── 备注:不能使用特殊字符                               │   │
│   │                                                         │   │
│   │  数据项名称:password(密码)                             │   │
│   │  ├── 数据类型:字符型                                    │   │
│   │  ├── 长度要求:8-20位                                   │   │
│   │  ├── 格式要求:字母+数字+符号组合                         │   │
│   │  ├── 是否必填:是                                        │   │
│   │  └── 备注:加密存储                                       │   │
│   │                                                         │   │
│   └─────────────────────────────────────────────────────────┘   │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

📊 常见数据的格式规范

数据类型规范要求正确示例错误示例
手机号11位数字,1开头13812345678138-1234-5678
身份证号18位,最后可能是X11010119900307663X11010119900307663
日期YYYY-MM-DD2024-01-152024/1/15
邮箱包含@和.zhangsan@qq.comzhangsanqq.com
邮政编码6位数字10000010000
用户名字母数字组合zhangsan_123张三

🏠 生活中的数据规范

场景规范要求
注册账号用户名8-16位,密码含字母数字
填快递单手机号11位,地址省市区格式
办银行卡身份证号18位,姓名不能有空格
考试报名照片大小、格式有要求
填表格日期格式统一,性别下拉选择

🔄 为什么需要数据规范?

┌─────────────────────────────────────────────────────────────────┐
│                    没有数据规范的问题                            │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│   ┌─────────────────────────────────────────────────────────┐   │
│   │                                                         │   │
│   │   问题1:数据对不上                                       │   │
│   │   A系统存“1990年1月1日”                                  │   │
│   │   B系统存“1990/01/01”                                   │   │
│   │   C系统存“1990-1-1”                                     │   │
│   │   同一人,三个日期!计算机认不出来                         │   │
│   │                                                         │   │
│   │   问题2:数据填错                                         │   │
│   │   手机号填成“138 1234 5678”                              │   │
│   │   系统不检查,短信发不出去                                 │   │
│   │                                                         │   │
│   │   问题3:系统间无法交换                                    │   │
│   │   学校系统和医院系统数据格式不一样                         │   │
│   │   想共享信息?不行!                                       │   │
│   │                                                         │   │
│   └─────────────────────────────────────────────────────────┘   │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

✅ 数据规范的好处

好处说明
保证质量防止填错、填漏
便于处理计算机能自动处理
方便交换不同系统能共享数据
易于管理统一标准,好维护
支持分析数据整齐,才好分析

🔗 相关术语


✅ 自测小问题

  1. 数据规范是什么?
  2. 数据规范包含哪些内容?
  3. 为什么需要数据规范?举一个例子。
点击查看答案
  1. 给数据定的统一规矩,规定格式、类型、长度等
  2. 数据类型、长度、格式、取值范围、是否必填、默认值
  3. 防止数据混乱,让不同系统能互相理解。例如:手机号统一11位数字,才能发短信

📚 教材链接

  • 教材位置:第二章 2.2.1 信息系统的输入功能(数据字典)