DBA技术栈MongoDB:简介

在这里插入图片描述

1.1 什么是MongoDB?

MongoDB是一个可扩展、开源、表结构自由、用C++语言编写且面向文档的数据库,旨在为Web应用程序提供高性能、高可用性且易扩展的数据存储解决方案。
MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中 功能最丰富、最像关系数据库的NoSQL数据库;它支持的查询语言非常强大,其语法有 点类似于面向对象的查询语言,可以实现类似关系数据里单表查询的绝大部分功能,而且还支持对数据建立索引。

1.2 MongoDB特点

在这里插入图片描述
它用与JSON格式类似的键值对来存储(在MongoDB中叫BSON对象),其中值的数据类型有常见的字符串、数字、日期,还可以是BSON对象、数组以及数组的元素,也可以是BSON对象,通过这种嵌套的方式,使MongoDB的数据类型变得相当丰富。 MongoDB与传统关系数据库还有一个重大区别就是:可扩展的表结构。也就是说collection (表)中的document (—行记录)所拥有的字段(列)是可以变化的,下面文档对象document ( —行记录)比上面列出的文档对象document (—行记录)多一个time字段,但它们可以共存在同一个collection (表)中。

 db.movies.find()
{ "_id" : ObjectId("65a8e26baa7aec49b06f7918"), "title" : "The Favourite", "genres" : [ "Drama", "History" ], "runtime" : 121, "rated" : "R", "year" : 2018, "directors" : [ "Yorgos Lanthimos" ], "cast" : [ "Olivia Colman", "Emma Stone", "Rachel Weisz" ], "type" : "movie" }
{ "_id" : ObjectId("65a8e29caa7aec49b06f7919"), "title" : "Jurassic World: Fallen Kingdom", "genres" : [ "Action", "Sci-Fi" ], "runtime" : 130, "rated" : "PG-13", "year" : 2018, "directors" : [ "J. A. Bayona" ], "cast" : [ "Chris Pratt", "Bryce Dallas Howard", "Rafe Spall" ], "type" : "movie" }
{ "_id" : ObjectId("65a8e931aa7aec49b06f791b"), "title" : "Jurassic World: Fallen Kingdom", "genres" : [ "Action", "Sci-Fi" ], "runtime" : 130, "rated" : "PG-13", "year" : 2018, "directors" : [ "J. A. Bayona" ], "cast" : [ "Chris Pratt", "Bryce Dallas Howard", "Rafe Spall" ], "type" : "movie" }
{ "_id" : ObjectId("65a92e692725916a6012a44e"), "title" : "Jurassic World: Fallen Kingdom", "genres" : [ "Action", "Sci-Fi" ], "runtime" : 130, "rated" : "PG-13", "year" : 2018, "directors" : [ "J. A. Bayona" ], "cast" : [ "Chris Pratt", "Bryce Dallas Howard", "Rafe Spall" ], "type" : "movie", "time" : "2024-01-18" }

MongoDB查询语句不是按照SQL的标准来开发的,它围绕JSON这种特殊格式的文 档型存储模型开发了一套自己的查询体系,这就是现在非常流行的NoSQL体系。关系数据库中常用的SQL语句在MongoDB中都有对应的解决方案。当然也有例外,MongoDB不支持Join语句。我们知道传统关系数据库中Join操作可能会产生笛卡尔积的虚拟表,消耗较多系统资源,而MongoDB的文档对象集合collection可以是任何结构,我们可以通过设计较好的数据模型尽量避开这样的操作需求。如果真的需要从多个collection (表)中检索数据,那我们可以通过多次查询得到。
在关系数据库中经常用到的group by等分组聚集函数,在MongoDB中也有,而且MongoDB提供了更加强大的MapReduce方案(GOOGLE提出的并行编程),为海量数据的统计、分析提供了便利。
MongoDB支持日志功能Journaling,对数据库的增、删、改操作会记录在日志文件中。MongoDB每100ms将内存中的数据刷到磁盘上,如果意外停机,在数据库重新启动时,MongoDB能通过Journaling日志功能恢复。
MongoDB支持复制集(Replset), —个复制集在生产环境中最少需要3台独立的机器 (测试的时候为了方便可能都部署在一台机器上),一台作主节点(primary), —台作次节点(secondary), —台作仲裁节点(只负责选出主节点),备份、自动故障转移,这些特性都是复制集支持的。
MongoDB支持自动分片Sharding,分片的功能实现海量数据的分布式存储,分片通常与复制集配合起来使用,实现读写分离、负载均衡,当然如何选择片键是实现分片功能的关键。如何实现读写分离我们后面会详细分析。

1.3. 适合哪些业务

  1. Web应用程序
    传统的关系数据库表结构都是固定的,增加一个业务或者横向扩展数据库都会带来 巨大的工作量。MongoDB支持无固定结构的表模型,因此很容易增加或减少表中的字段,适应业务的变化;同时MongoDB本身就支持分片集群,很容易实现水平扩展,将数据分散到集群中的各个片上,提高了系统的存储容量和读写吞吐量。Web应用程序还有一个特点就是“热数据”读并发很高,也就是说最新的数据被请求的次数会最多。
    为了提供读的性能,在传统的关系数据将中会采用其他的缓存技术来将这部分数据放在内存中,而MongoDB本身就支持这一点,它是通过内存映射数据文件来实现的。它会维护一个工作集,将最热的数据放在内存中,不需要其他技术的协助,这为系统开发提供了简便性。
    2.缓存系统
    这种使用场景是与关系数据库搭配使用,作为关系数据库的缓存前端。目前缓存技术有很多种,最常见的就是使用memcached,但是这些缓存系统都有个缺点,就是支持的数据类型有限,查询语句也有限,只能保存少量的数据且不能持久化。而MongoDB这些都能支持,因此可以作为缓存使用。
    3.日志分析系统
    这类系统的特点是数据量大,允许部分数据丢失,不会影响整个系统的可靠性。以前将日志直接保存到操作系统的文件上,我们需要用其他工具打开日志文件或编写工具读曰志进行分析,这样的话对于大量的日志查询会比较困难。如果用MongoDB数据库来保存这些日志,一来可以利用分片集群使日志系统的容量海量大,二来使用MongoDB特有的查询语句自酿快速找到某条日志记录。最重要的是MongoDB支持聚集分析甚至MapReduce的能力,为大数据的分析和决策提供了强有力的支持。

1.4 总结

MongoDB是一个面向文档的数据库,不支持关系数据库中的join操作和事务。它用集合的概念代替了关系数据库中的表,用最小逻辑单元文档代替关系数据库中的行。它的集合结构是动态的,没有必要像关系数据库一样插入数据前先定义表结构,而且可以随时増加、修改、删除组成文档的字段。
MongoDB支持当前所有主流编程语言的客户端驱动,使用方便,应用广泛,非常适合文档管理系统的应用、移动APP应用、游戏开发、电子商务应用、分析决策系统、归档和曰志系统等应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/413818.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【前端设计】输入框

欢迎来到前端设计专栏&#xff0c;本专栏收藏了一些好看且实用的前端作品&#xff0c;使用简单的html、css语法打造创意有趣的作品&#xff0c;为网站加入更多高级创意的元素。 html <!DOCTYPE html> <html lang"en"> <head><meta charset&quo…

Redis--Zset使用场景举例(滑动窗口实现限流)

文章目录 前言什么是滑动窗口zset实现滑动窗口小结附录 前言 在Redis–Zset的语法和使用场景举例&#xff08;朋友圈点赞&#xff0c;排行榜&#xff09;一文中&#xff0c;提及了redis数据结构zset的指令语法和一些使用场景&#xff0c;今天我们使用zset来实现滑动窗口限流&a…

蓝天采集器,功能逆天的网站数据抓取神器,轻松助你成为采集达人,附带搭建配置文档

源码介绍 蓝天采集器是一款专为web服务器打造的数据采集神器。与市面上常见的桌面端采集工具&#xff08;如火车头等&#xff09;相比&#xff0c;蓝天采集器在易用性、上手成本和灵活性方面更胜一筹。它部署简便&#xff0c;无需复杂的设置&#xff0c;即可迅速融入您的web服…

python统计分析——样本均值的分布(上)

参考资料&#xff1a;用python动手学统计学 1、导入库 import numpy as np import pandas as pd import scipy as sp from scipy import statsfrom matplotlib import pyplot as plt import seaborn as sns 2、设置总体 本次研究总体是均值为4、标准差为0.8的正态总体。 po…

python222网站实战(SpringBoot+SpringSecurity+MybatisPlus+thymeleaf+layui)-热门帖子推荐显示实现

锋哥原创的SpringbootLayui python222网站实战&#xff1a; python222网站实战课程视频教程&#xff08;SpringBootPython爬虫实战&#xff09; ( 火爆连载更新中... )_哔哩哔哩_bilibilipython222网站实战课程视频教程&#xff08;SpringBootPython爬虫实战&#xff09; ( 火…

每日一题——LeetCode1266.访问所有点的最小时间

方法一 个人方法 找规律&#xff1a; 当前的点为current&#xff0c;下一个点为next&#xff0c;x为两点横坐标之间距离&#xff0c;y为两点竖坐标之间距离 1、当两点横坐标相同时&#xff0c;两点距离为y 2、当两点竖坐标相同时&#xff0c;两点距离为x 3、当两点x与y相同…

回归预测 | Matlab实现SSA-BP麻雀算法优化BP神经网络多变量回归预测

回归预测 | Matlab实现SSA-BP麻雀算法优化BP神经网络多变量回归预测 目录 回归预测 | Matlab实现SSA-BP麻雀算法优化BP神经网络多变量回归预测预测效果基本描述程序设计参考资料 预测效果 基本描述 1.Matlab实现SSA-BP麻雀算法优化BP神经网络多变量回归预测&#xff1b; 2.数据…

UML-实现图(组件图和部署图)

实现图是从系统的层次来描述的&#xff0c;描述硬件的组成和布局&#xff0c;描述软件系统划分和功能实现。 UML-实现图&#xff08;组件图和部署图&#xff09; 一、组件图1.组件图的元素&#xff08;1&#xff09;组件&#xff08;2&#xff09;接口&#xff08;3&#xff09…

C++后端笔记

C后端笔记 资源整理一、高级语言程序设计1.1 进制1.2 程序结构基本知识1.3 数据类型ASCII码命名规则变量间的赋值浮点型变量的作用字符变量常变量 const运算符 二、高级语言程序设计&#xff08;荣&#xff09; 资源整理 C后端开发学习路线及推荐学习时间 C基础知识大全 C那…

Flink TaskManager内存管理机制介绍与调优总结

内存模型 因为 TaskManager 是负责执行用户代码的角色&#xff0c;一般配置 TaskManager 内存的情况会比较多&#xff0c;所以本文当作重点讲解。根据实际需求为 TaskManager 配置内存将有助于减少 Flink 的资源占用&#xff0c;增强作业运行的稳定性。 TaskManager 内…

02 MyBatisPlus核心功能之基于Mapper接口CRUD+基于Service接口实现CRUD

项目结构&#xff1a; 1.1 Insert方法 // 插入一条记录 // T 就是要插入的实体对象 // 默认主键生成策略为雪花算法&#xff08;后面讲解&#xff09; //返回值是影响条数 int insert(T entity);1.2 Delete方法 // 根据 entity 条件&#xff0c;删除记录 int delete(Param(…

详解JDBC各个对象

文章目录 DriverManagerConnectionStatementPreparedStatementResultSet案例案例一&#xff1a;JDBC控制事务案例二&#xff1a;SQL 注入错误演示 DriverManager 概述&#xff1a;DriverManager 是驱动管理类 作用 获取数据库连接 // 返回数据库连接的对象&#xff0c;url 是指…