MongoDB 中聚合统计计算 – $SUM表达式

207次阅读

共计 3094 个字符，预计需要花费 8 分钟才能阅读完成。

我们一般通过表达式 $sum 来计算总和。因为 MongoDB 的文档有数组字段，所以可以简单的将计算总和分成两种：1，统计符合条件的所有文档的某个字段的总和；2，统计每个文档的数组字段里面的各个数据值的和。这两种情况都可以通过 $sum 表达式来完成。以上两种情况的聚合统计，分别对应与聚合框架中的 $group 操作步骤和 $project 操作步骤。

1.$group

直接看例子吧。

Case 1

测试集合 mycol 中的数据如下：

{
title: ‘MongoDB Overview’,
description: ‘MongoDB is no sql database’,
by_user: ‘runoob.com’,
url: ‘http://www.runoob.com’,
tags: [‘mongodb’, ‘database’, ‘NoSQL’],
likes: 100
},
{
title: ‘NoSQL Overview’,
description: ‘No sql database is very fast’,
by_user: ‘runoob.com’,
url: ‘http://www.runoob.com’,
tags: [‘mongodb’, ‘database’, ‘NoSQL’],
likes: 10
},
{
title: ‘Neo4j Overview’,
description: ‘Neo4j is no sql database’,
by_user: ‘Neo4j’,
url: ‘http://www.neo4j.com’,
tags: [‘neo4j’, ‘database’, ‘NoSQL’],
likes: 750
}

现在我们通过以上集合计算每个作者所写的文章数，使用 aggregate() 计算

db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$sum : 1}}}])

查询结果如下：

/* 1 */
{
“_id” : “Neo4j”,
“num_tutorial” : 1
},

/* 2 */
{
“_id” : “runoob.com”,
“num_tutorial” : 2
}

Case 2

统计每个作者被 like 的总和，计算表达式：

db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$sum : “$likes”}}}])

查询结果如下;

/* 1 */
{
“_id” : “Neo4j”,
“num_tutorial” : 750
},

/* 2 */
{
“_id” : “runoob.com”,
“num_tutorial” : 110
}

Case 3

上面例子有些简单，我们再丰富一下，测试集合 sales 的数据如下：

{“_id” : 1, “item” : “abc”, “price” : 10, “quantity” : 2, “date” : ISODate(“2014-01-01T08:00:00Z”) }
{“_id” : 2, “item” : “jkl”, “price” : 20, “quantity” : 1, “date” : ISODate(“2014-02-03T09:00:00Z”) }
{“_id” : 3, “item” : “xyz”, “price” : 5, “quantity” : 5, “date” : ISODate(“2014-02-03T09:05:00Z”) }
{“_id” : 4, “item” : “abc”, “price” : 10, “quantity” : 10, “date” : ISODate(“2014-02-15T08:00:00Z”) }
{“_id” : 5, “item” : “xyz”, “price” : 5, “quantity” : 10, “date” : ISODate(“2014-02-15T09:05:00Z”) }

需要完成的目标是，基于日期分组，统计每天的销售额，聚合公式为：

db.sales.aggregate(
[
{
$group:
{
_id: {day: { $dayOfYear: “$date”}, year: {$year: “$date”} },
totalAmount: {$sum: { $multiply: [ “$price”, “$quantity”] } },
count: {$sum: 1}
}
}
]
)

查询结果是：

{“_id” : { “day” : 46, “year” : 2014}, “totalAmount” : 150, “count” : 2 }
{“_id” : { “day” : 34, “year” : 2014}, “totalAmount” : 45, “count” : 2 }
{“_id” : { “day” : 1, “year” : 2014}, “totalAmount” : 20, “count” : 1 }

Case 4

上面的，可以看出 $group，我们都使用了_id, 使用了分组，那么如果，我们的需求不需要分组，应该怎么办呢？

例如。我们现在要统计 sales 集合中一共卖出了多少件商品。

如果直接去掉 group 阶段的_id, 如下:

db.sales.aggregate(
[
{
$group:
{

totalAmount: {$sum: “$quantity”}
}
}
]
)

则报错：

{
“message” : “a group specification must include an _id”,
“ok” : 0,
“code” : 15955,
“codeName” : “Location15955”,
“name” : “MongoError”
}

我们还是需要添加上_id, 但是可以添加个常量，及时根据常量分组, 可以为 _id : “0” 可以是 _id : “a”, _id : “b”, 还可以使_id : “x”, _id : “y” 等等。

。

例如：

db.sales.aggregate(
[
{
$group:
{
_id : “Total”
totalAmount: {$sum: “$quantity”}
}
}
]
)

查询结果为：

{
“_id” : “Total”,
“totalAmount” : 28
}

2.$project 阶段

Case 5

假设存在一个 students 集合，其数据结构如下：

{“_id”: 1, “quizzes”: [ 10, 6, 7], “labs”: [5, 8], “final”: 80, “midterm”: 75 }
{“_id”: 2, “quizzes”: [ 9, 10], “labs”: [8, 8], “final”: 95, “midterm”: 80 }
{“_id”: 3, “quizzes”: [ 4, 5, 5], “labs”: [6, 5], “final”: 78, “midterm”: 70 }

现在的需求是统计每个学生的平常的测验分数总和、实验分数总和、期末其中分数总和。

db.students.aggregate([
{
$project: {
quizTotal: {$sum: “$quizzes”},
labTotal: {$sum: “$labs”},
examTotal: {$sum: [ “$final”, “$midterm”] }
}
}
])

其查询输出结果如下：

{“_id” : 1, “quizTotal” : 23, “labTotal” : 13, “examTotal” : 155}
{“_id” : 2, “quizTotal” : 19, “labTotal” : 16, “examTotal” : 175}
{“_id” : 3, “quizTotal” : 14, “labTotal” : 11, “examTotal” : 148}

正文完

星哥玩云-微信公众号