写给小白的数据库入门科普

原创 鲜枣课堂 2025-01-24 19:25
今天这篇文章,我们来聊聊数据库。

 什么是数据库

对于数据库,大家应该都不会觉得陌生。作为重要的基础软件,数据库在我们的工作和生活无处不在。

最简单的,我们电脑里有很多的excel表,其实也可以算是一个“微型数据库


从定义上来看,数据库,是一个存放和管理数据的仓库。或者说,是一个数据集合。

那么,我们硬盘上也有大量的数据,是不是硬盘也是一个数据库呢?

当然不是。

硬盘是一个硬件。基于硬盘构建的文件系统,存储了大量的数据,但这些数据是以不同类型文件的形式存在的,彼此独立。

而数据库是一个软件层面的概念。它对数据进行了登记和整理,形成了一个整体系统,既包括了数据,也包括了数据之间的逻辑关系。

简单来说,如果有一个仓库,你往里面放了各种类型的物品,例如家具、花草、书籍等。那么,硬盘就像是这个仓库,文件就是这些物品。

如果你在仓库里划分了一个区域,安排了一个管理员,负责存放物品并进行登记。那么,这个区域(这套体系),就是数据库。


广义的数据库,是一种数据集合。我们口头上所说的数据库(狭义),大部分是指那些用于搭建、使用和维护广义数据库的系统软件,叫做数据库管理系统(DBMS)。


数据库管理系统对数据进行统一控制管理,以保证数据的完整性和安全性。它还具有对外的标准接口,方便其它应用软件对数据进行读写操作。

我们比较熟悉的数据库管理系统,包括MySQL、SQL Server、Oracle、DB2、Redis、MongoDB等。


 数据库的作用和优势

之所以要有数据库,主要是为了方便管理和使用数据。

数据库是信息时代最重要的基础软件之一,地位仅次于操作系统。

如今,大量的信息化系统遍布社会的每个角落,每时每刻都在产生海量的数据。如果没有一个高效的系统和平台对这些数据进行统一管理,那么,效率就会下降。


数据库存储了海量的多类型数据。用户可以通过数据库,创建数据、查找数据、修改数据、删除数据、分析数据、共享数据。

对于个人、企业甚至国家部门,数据库有着不可替代的作用。现在整个社会都在讲数据价值挖掘。AI的三大要素里,也包括了数据。数据的价值在提升,数据库的价值也随之提升。

一个优秀的数据库管理系统,需要具备以下几个方面的优势。

首先,是性能。

数据库涉及到大量的数据读写操作,所以,性能就显得非常重要。


如果数据库的用户少,问题倒是不大。但是如果用户多,例如12306、淘宝双11等场景,瞬时并发读写特别大,就要看数据库是否能hold得住。


这里就要提到著名的ACID(原子性、一致性、隔离性、持久性)特性。

原子性(Atomicity):为避免纠纷,数据库中的事务执行被视作原子不可再分,事务(例如转账)中的操作要么全部执行,要么失败回滚(Rollback)。

一致性(Consistency):为保证业务逻辑的一致性,数据库通过设置约束和触发器来保证其完整性约束不被破坏,即每个事务能够看到的数据总是保持一致。

隔离性(Isolation):为防止事务之间的脏读、幻读、不可重复读,数据库通过加锁,保证多个事务并发访问时,事务之间是隔离的,互不干扰。

持久性(Durability):为防止意外事故(例如断电)导致数据缺失,数据库保证事务对其所作的修改被永久保存,不会被回滚。

其次,是容量。

数据库要存放数据,所以,容量要满足设计需求。

现在业务需求变化很快,数据库的数据很可能迅猛增长。所以,数据库也需要具备一定的扩展性和弹性,能够灵活地变大或者变小,满足需求和成本之间的平衡。

第三,是安全性。

数据安全的重要性,无需多言。一个优秀的数据库,需要拥有完善的安全机制,保护数据免受未授权的访问,以及来自外部的攻击。

数据库也需要有完善的备份和恢复机制,在极端情况下,能够快速恢复到最近的状态。

第四,是兼容性。

数据库需要遵循开放标准的API,使得自身更容易与其它应用和服务集成,促进数据共享和互操作性。

总之,数据库的作用远不止于简单的数据存放。作为一个核心组件,它必须经过严格且缜密的设计,能够为各类应用程序提供稳定可靠的支撑,保障数据的安全性、完整性和高效利用。


 数据库的类别

接下来,我们再看看数据库的类别。

数据库的种类很多,分类方法也很多。我们不妨就以历史时间线的维度,对几种主要的分类方式进行介绍。

  • 1960-1970:萌芽阶段

上世纪60年代,随着计算机技术的不断发展和成熟,越来越多的大型机开始应用于金融证券、航空航天、工业制造、军事国防等领域,掀起了一场信息化革命。


有了信息化,就催生了大量的数据。为了更好地管理这些数据,就有人开始提出数据库系统的概念。

1961年,美国通用电气公司的查尔斯·巴赫曼(Charles Bachman),成功开发出世界上第一个数据库管理系统——IDS(IntegratedData Store,集成数据存储),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。

1968年,IBM公司创建了层次式数据库管理系统IMS(Information Management System),是世界上首个商业数据库系统。

  • 1970-2000:关系型、事务型数据库

又过了两年,到了1970年,IBM公司的研究员埃德加·弗兰克·科德(Edgar Frank Codd)发表了一篇名为《大型共享数据库数据的关系模型》的重磅论文。在论文中,他提出了数据库的关系模型,开创了关系数据库时代。


1973年,IBM启动了System R项目。后来,在System R项目的基础上,加利福尼亚大学柏克莱分校启动了ingres项目。

这两个项目的意义极为重大。1970-80年代出现的多个经典数据库产品,包括Oracle、DB2、Informix、Sybase、SQL Server,都是基于System R和ingres项目衍生出来的。这些数据库产品,极大地助力了当时的信息化浪潮,为计算机的普及发挥了重要作用。


刚才提到的这些数据库产品,全部都是关系型数据库。

数据库有很多种模型。比较原始的,是层次模型和网状模型。比较主流的,是关系模型和非关系模型。


关系模型的最大特点,就是可以使用表格来表示实体和实体之间的关系。每一行代表一个实体实例,每一列代表实体的一个属性。

关系型数据库中,每个表有唯一的名字。表的每一行代表了一组值之间的联系,称为元组(Tuple)。每一列是实体的描述,具有相同的数据类型,称为属性(Attribute)或者字段(Field)。


大家应该注意到了,很多关系型数据库(包括SQL Server、MySQL、PostgreSQL),都有一个SQL


SQL的意思,是Structured Query Language,结构化查询语言。

这是一种用于访问和处理“关系型数据库”的标准计算机语言。SQL语句既可以查询数据库中的数据,也可以添加、更新和删除数据库中的数据,还可以对数据库进行管理和维护操作。

例如,下面这个,就是一个典型的SQL命令,表示要插入一条数据

INSERT INTO students (id, name, age) VALUES (1, '张三', 20);

80-90年代的主流数据库,除了基本属于关系型数据库之外,在业务类型上,也属于事务型数据库(交易型数据库),即OLTP(Online Transactional Processing)

这类数据库主要用于管理实时交易(银行、电商、订票等),主要特点是能够支持大量的读写操作(简短的、小规模),能够确保数据库的完整性和一致性。

  • 2000-2010:非关系型、分析型数据库

上世纪90年代末,数据库的发展进入一个新的阶段。非关系型数据库开始崛起。

1998年,卡罗·斯特罗兹(Carlo Strozzi)开发了一个轻量、开源、不提供SQL功能的数据库,即NoSQL。


值得一提的是,NoSQL并不是“No SQL”(拒绝SQL)意思,而是“Not Only SQL”(不只是SQL)。

NoSQL并非完全替代关系型数据库,而是为了应对Web 2.0时代互联网应用快速增长所带来的挑战。它针对不同的应用场景,提供了更多选择。

非关系数据模型并不遵循传统的关系数据库模型及其SQL查询语言。它的出现,能够解决关系型数据库在扩展性和灵活性方面的一些局限性。


非关系型数据库包括了很多子类型,例如键值数据库、列族数据库、文档数据库、图数据库等。具体类型和典型产品如下:


除了非关系型数据库之外,数据库也从事务性向分析型发展,即OLAP(Online Analytical Processing)。

这也是由时代决定的。因为数据除了用于查询和记录之外,要开始为大数据、数据分析等新兴业务服务。

分析型数据库允许用户对大量历史数据进行复杂的查询和分析,以揭示隐藏在数据中的模式和趋势,为上层决策提供支持。


需要注意的是,那一时期,数据仓库(Data Warehouse)的概念出现了。

所谓数据仓库,就是数据库的一种演进。它集成了来自不同来源的数据,并经过清洗、转换和整合,以便于进行高效的数据分析和报告。

限于篇幅,关于数据仓库和待会提到的数据湖,小枣君后续会专门介绍。

  • 2010-现在:融合、云化、AI、国产

2010年之后,数据库技术继续蓬勃发展,出现了很多新的趋势。

首先,继SQL、NoSQL之后,又出现了NewSQL的概念。


NewSQL是一类新型的关系型数据库管理系统,结合了SQL和NoSQL的优点。

它解决了传统关系型数据库在处理大规模数据和高并发访问时的性能瓶颈,同时保留ACID特性以及对SQL查询语言的支持,非常适用于需要处理大规模数据和高并发访问的场景。

NewSQL的代表产品,包括Google Spanner、CockroachDB、TiDB等。

其次,继事务性、分析型之后,出现了混合型数据库(HTAP,Hybrid Transactional / Analytical Processing)。

这也是一种融合趋势。

简单来说,HTAP是结合了OLTP和OLAP的优点。它是一种新兴的数据库架构,能够同时支撑OLTP和OLAP场景,避免传统架构中大量数据交互造成的资源浪费和冲突。



第三,是云数据库和分布式数据库的崛起。

这个比较好理解。以前都是单机数据库。后来,数据库并发越来越大,对安全要求越来越高,就有了主从数据库,再然后,就是分布式数据库。

分布式数据库,数据分布在多台服务器上,通过网络连接协同工作。这样一来,既可以扩展存储和处理能力,也可以提高系统的可用性和容错性。


当然,分布式数据库,管理和维护方面会更复杂一些。

云数据库,是响应云计算的发展,把本地数据库迁移到云端。

第四,继数据仓库之后,又出现了数据湖、湖仓一体。

限于篇幅,后续专门给大家介绍这几个概念。

第五,是数据库开始引入AI,走向智能化。

将AI人工智能引入数据库,也是一个重要趋势。

AI能发挥的作用很多。一方面,可以实现更高的查询和存储效率,并自动化处理各种任务。另一方面,可以分析大量数据记录,标记异常值和异常模式,自动防范恶意访问与攻击,提升安全性。

除此之外,AI还可以主动实现数据库的智能调优,提升数据库的整体性能。或者,自动进行系统维护操作,减少运营维护成本,也避免人为错误。

第六,是国产数据库替代的加速。

最近十多年,国产数据库的发展速度极快。在信创战略的推动下,越来越多的国内企业和政府部门开始启用国产数据库,进行国产化替代。

图片引用来源:艾瑞咨询


 结语

好啦,以上就是关于数据库的基本介绍。

数据是21世纪最有价值的无形资产。存储和利用数据,对每个人、每个企业、每个政府都意义重大。像数据库、数据仓库、数据湖这样的数据平台,是充分利用数据价值的前提,也是发展AI的前提。

相信未来几年,数据库技术还将保持高速发展,涌现出更多的创新。


鲜枣课堂 学通信,学5G,就上鲜枣课堂!
评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 267浏览
  • 不让汽车专美于前,近年来哈雷(Harley-Davidson)和本田(Honda)等大型重型机车大厂的旗下车款皆已陆续配备车载娱乐系统与语音助理,在路上也有越来越多的普通机车车主开始使用安全帽麦克风,在骑车时透过蓝牙连线执行语音搜寻地点导航、音乐播放控制或免持拨打接听电话等各种「机车语音助理」功能。客户背景与面临的挑战以本次分享的客户个案为例,该客户是一个跨国车用语音软件供货商,过往是与车厂合作开发前装车机为主,且有着多年的「汽车语音助理」产品经验。由于客户这次是首度跨足「机车语音助理」产品,因
    百佳泰测试实验室 2025-01-24 17:00 58浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 803浏览
  • 书接上回:【2022年终总结】阳光总在风雨后,启航2023-面包板社区  https://mbb.eet-china.com/blog/468701-438244.html 总结2019,松山湖有个欧洲小镇-面包板社区  https://mbb.eet-china.com/blog/468701-413397.html        2025年该是总结下2024年的喜怒哀乐,有个好的开始,才能更好的面对2025年即将
    liweicheng 2025-01-24 23:18 101浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 466浏览
  • 项目展示①正面、反面②左侧、右侧项目源码:https://mbb.eet-china.com/download/316656.html前言为什么想到要做这个小玩意呢,作为一个死宅,懒得看手机,但又想要抬头就能看见时间和天气信息,于是就做个这么个小东西,放在示波器上面正好(示波器外壳有个小槽,刚好可以卡住)功能主要有,获取国家气象局的天气信息,还有实时的温湿度,主控采用ESP32,所以后续还可以开放更多奇奇怪怪的功能,比如油价信息、股票信息之类的,反正能联网可操作性就大多了原理图、PCB、面板设计
    小恶魔owo 2025-01-25 22:09 114浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 1009浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 192浏览
  • 随着AI大模型训练和推理对计算能力的需求呈指数级增长,AI数据中心的网络带宽需求大幅提升,推动了高速光模块的发展。光模块作为数据中心和高性能计算系统中的关键器件,主要用于提供高速和大容量的数据传输服务。 光模块提升带宽的方法有两种:1)提高每个通道的比特速率,如直接提升波特率,或者保持波特率不变,使用复杂的调制解调方式(如PAM4);2)增加通道数,如提升并行光纤数量,或采用波分复用(CWDM、LWDM)。按照传输模式,光模块可分为并行和波分两种类型,其中并行方案主要应用在中短距传输场景中成本
    hycsystembella 2025-01-25 17:24 50浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 136浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 155浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 201浏览
  • 前篇文章中『服务器散热效能不佳有解吗?』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。AI服务器的散热架构三大重点:GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。
    百佳泰测试实验室 2025-01-24 16:58 52浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦