共计 4342 个字符,预计需要花费 11 分钟才能阅读完成。
明确 MongoDB 在企业级应用中充当的角色,为之后的技术选型提供一个可查阅的信息简报。
1、MongoDB 是什么?
2、为什么要使用 MongoDB?
3、主要特性
4、C/ S 服务模型
5、完善的命令行工具
6、几个 shell 实操
7、在 Java 中使用 MongoDB
1、MongoDB 是什么?
MongoDB 是一款为 web 应用程序和互联网基础设施设计的数据库管理系统。没错 MongoDB 就是数据库,是 NoSQL 类型的数据库
2、为什么要用 MongoDB?
(1)MongoDB 提出的是文档、集合的概念,使用 BSON(类 JSON)作为其数据模型结构,其结构是面向对象的而不是二维表,存储一个用户在 MongoDB 中是这样子的。
{
username:'123',
password:'123'
}
使用这样的数据模型,使得 MongoDB 能在生产环境中提供高读写的能力,吞吐量较于 mysql 等 SQL 数据库大大增强。
(2)易伸缩,自动故障转移。易伸缩指的是提供了分片能力,能对数据集进行分片,数据的存储压力分摊给多台服务器。自动故障转移是副本集的概念,MongoDB 能检测主节点是否存活,当失活时能自动提升从节点为主节点,达到故障转移。
(3)数据模型因为是面向对象的,所以可以表示丰富的、有层级的数据结构,比如博客系统中能把“评论”直接怼到“文章“的文档中,而不必像 myqsl 一样创建三张表来描述这样的关系。
3、主要特性
(1)文档数据类型
SQL 类型的数据库是正规化的,可以通过主键或者外键的约束保证数据的完整性与唯一性,所以 SQL 类型的数据库常用于对数据完整性较高的系统。MongoDB 在这一方面是不如 SQL 类型的数据库,且 MongoDB 没有固定的 Schema,正因为 MongoDB 少了一些这样的约束条件,可以让数据的存储数据结构更灵活,存储速度更加快。
(2)即时查询能力
MongoDB 保留了关系型数据库即时查询的能力,保留了索引(底层是基于 B tree)的能力。这一点汲取了关系型数据库的优点,相比于同类型的 NoSQL redis 并没有上述的能力。
(3)复制能力
MongoDB 自身提供了副本集能将数据分布在多台机器上实现冗余,目的是可以提供自动故障转移、扩展读能力。
(4)速度与持久性
MongoDB 的驱动实现一个写入语义 fire and forget,即通过驱动调用写入时,可以立即得到返回得到成功的结果(即使是报错),这样让写入的速度更加快,当然会有一定的不安全性,完全依赖网络。
MongoDB 提供了 Journaling 日志的概念,实际上像 mysql 的 bin-log 日志,当需要插入的时候会先往日志里面写入记录,再完成实际的数据操作,这样如果出现停电,进程突然中断的情况,可以保障数据不会错误,可以通过修复功能读取 Journaling 日志进行修复。
(5)数据扩展
MongoDB 使用分片技术对数据进行扩展,MongoDB 能自动分片、自动转移分片里面的数据块,让每一个服务器里面存储的数据都是一样大小。
4、C/ S 服务模型
MongoDB 核心服务器主要是通过 mongod 程序启动的,而且在启动时不需对 MongoDB 使用的内存进行配置,因为其设计哲学是内存管理最好是交给操作系统,缺少内存配置是 MongoDB 的设计亮点,另外,还可通过 mongos 路由服务器使用分片功能。
MongoDB 的主要客户端是可以交互的 js shell 通过 mongo 启动,使用 js shell 能使用 js 直接与 MongoDB 进行交流,像使用 sql 语句查询 mysql 数据一样使用 js 语法查询 MongoDB 的数据,另外还提供了各种语言的驱动包,方便各种语言的接入。
5、完善的命令行工具
mongodump 和 mongorestore, 备份和恢复数据库的标准工具。输出 BSON 格式,迁移数据库。
mongoexport 和 mongoimport,用来导入导出 JSON、CSV 和 TSV 数据,数据需要支持多格式时有用。mongoimport 还能用与大数据集的初始导入,但是在导入前顺便还要注意一下,为了能充分利用好 mongoDB 通常需要对数据模型做一些调整。
mongosniff, 网络嗅探工具,用来观察发送到数据库的操作。基本就是把网络上传输的 BSON 转换为易于人们阅读的 shell 语句。
因此,可以总结得到,MongoDB 结合键值存储和关系数据库的最好特性。因为简单,所以数据极快,而且相对容易伸缩还提供复杂查询机制的数据库。MongoDB 需要跑在 64 位的服务器上面,且最好单独部署,因为是数据库,所以也需要对其进行热备、冷备处理。
6、几个 shell 实操
因为本篇文章不是 API 手册,所有这里对 shell 的使用也是基础的介绍什么功能可以用什么语句,主要是为了展示使用 MongoDB shell 的方便性,如果需要知道具体的 MongoDB shell 语法可以查阅官方文档。
1、切换数据库
use dba
创建数据库并不是必须的操作,数据库与集合只有在第一次插入文档时才会被创建,与对数据的动态处理方式是一致的。简化并加速开发过程,而且有利于动态分配命名空间。如果担心数据库或集合被意外创建,可以开启严格模式
2、插入语法
db.users.insert({username:"smith"})
db.users.save({username:"smith"})
3、查找语法
db.users.find()
db.users.count()
4、更新语法
db.users.update({username:"smith"},{$set:{country:"Canada"}})
// 把用户名为 smith 的用户的国家改成 Canada
db.users.update({username:"smith"},{$unset:{country:1}})
// 把用户名为 smith 的用户的国家字段给移除
db.users.update({username:"jones"},{$set:{favorites:{movies:["casablance","rocky"]}}})
// 这里主要体现多值修改,在 favorties 字段中添加多个值
db.users.update({"favorites.movies":"casablance"},{$addToSet:{favorites.movies:"the maltese"}},false,true)
// 多项更新
5、删除语法
db.foo.remove() // 删除所有数据
db.foo.remove({favorties.cities:"cheyene"}) // 根据条件进行删除
db.drop() // 删除整个集合
6、索引相关语法
db.numbers.ensureIndex({num:1})
// 创建一个升序索引
db.numbers.getIndexes()
// 获取全部索引
7、基本管理语法
show dbs
// 查询所有数据库
show collections
// 显示所有表
db.stats()
// 显示数据库状态信息
db.numbers.stats()
// 显示集合表状态信息
db,shutdownServer()
// 停止数据库
db.help()
// 获取数据库操作命令
db.foo.help()
// 获取表操作命令
tab 键 // 能自动帮我们补全命令
以上的命令只是简单实例,假设如果你之前没有学习过任何数据库语法,同时开始学 sql 查询语法和 MongoDB 查询语法,你会发现哪一个更简单呢?如果你使用的是 java 驱动去操作 MongoDB,你会发现任何的查询都像 Hibernate 提供出来的查询方式一样,只要构建好一个查询条件对象,便能轻松查询(接下来会给出示例),博主之前熟悉 ES6,所以入手 MongoDB js shell 完成没问题,也正因为这样简洁,完善的查询机制,深深的爱上了 MongoDB。
7、在 Java 中使用 MongoDB
1、使用 maven 引入 jar 包
这里引用的是最新的驱动包,提供了一套新的访问连接方式
<dependency>
<groupId>org.mongodb</groupId>
<artifactId>mongodb-driver-sync</artifactId>
<version>3.8.0-beta3</version>
</dependency>
2、创建一个访问客户端
MongoClient client = MongoClients.create(“mongodb://10.201.76.94:27017”);
3、获取集合数量
public long count() {MongoClient client = this.getClient();
MongoCollection<Document> collections= client.getDatabase("mongodb_db_name").getCollection("mongodb_collection_name");
return collections.count();}
4、查询集合
public List<Document> find(Document params,Bson sort,int skip,int limit) {MongoClient client = this.getClient();
MongoCollection<Document> collections= client.getDatabase("mongodb_db_name").getCollection("mongodb_collection_name");
List<Document> list = new ArrayList<Document>(Integer.valueOf(config.getPro("sync_limit")));
collections.find(params).sort(sort).skip(skip).limit(limit).forEach(new Block<Document>() {
@Override
public void apply(Document document) {list.add(document);
}
});
return list;
}
这里只举例了简单的链接与简单的 MongoDB 操作,可见其操作的容易性。使用驱动时是基于 TCP 套接字与 MongoDB 进行通信的,如果查询结果较多,恰好无法全部放进第一服务器中,将会向服务器发送一个 getmore 指令获取下一批查询结果。
插入数据到服务器时间,不会等待服务器的响应,驱动会假设写入是成功的,实际是使用客户端生成对象 id,但是该行为可以通过配置配置,可以通过安全模式开启,安全模式可以校验服务器端插入的错误。