Post

理解数据结构分类与二进制编码原理

2026-05-07

数据结构分类与基本数据类型的二进制存储机制

本文围绕计算机科学中两类核心数据结构（线性与非线性）的分类实现，以及基本数据类型的二进制存储规则展开。重点解析数据结构的底层实现基础，以及计算机如何通过原码、反码、补码等编码方式存储数值型数据。

线性结构以线性方式组织数据元素，其特点是元素间存在一对一的邻接关系。主要类型包括：

这些结构可通过数组或链表实现。例如：

非线性结构中元素间存在多对多或一对多的关联关系，主要类型包括：

需注意：原始笔记中对哈希表的分类存在矛盾——线性结构中描述为"一对一"，非线性结构中描述为"一对多"，这可能源于不同实现方式的差异。

现代计算机以二进制形式存储数据，基本数据类型是CPU可直接运算的类型，主要包括：

1字节（byte）由8位（bit）组成，存储时需考虑符号位和数值位的分配。

计算机通过三种编码方式表示有符号整数：

补码是现代计算机中最常用的表示方式，解决了原码和反码中+0与-0的冗余问题，并简化了加减法运算。

注意：原始笔记中未明确说明浮点数的存储规则，此处仅讨论整数类型的编码方式。

数据结构实现
所有数据结构最终都基于数组或链表实现，但具体选择取决于场景需求。例如：
- 需要频繁随机访问时优先选数组
- 需要动态扩展时优先选链表
编码规则适用性
原码、反码、补码规则适用于整数类型，浮点数采用IEEE 754标准（原始笔记未涉及）。不同编程语言对基本数据类型的存储可能略有差异，需参考具体语言规范。
存储单位差异
不同操作系统对字节的定义可能存在差异（如某些嵌入式系统中1字节为4位），但现代主流系统均采用8位/字节标准。