常用聚合
阶段
$group
$group
阶段根据“组键”将文档分成组。输出是每个唯一组键的一个文档。
-
组键通常是一个字段或一组字段。组键也可以是表达式的结果。使用
$group
管道阶段中的_id
字段来设置组键。请参阅下面的使用示例。 -
在
$group
阶段输出中,_id
字段被设为该文档的组键。 -
$group
不会对其输出文档进行排序。
$group
阶段具有以下原型形式:
{
$group:
{
_id: <expression>, // Group key
<field1>: { <accumulator1> : <expression1> },
...
}
}
字段 | 说明 |
---|---|
_id | 必需。 _id 表达式指定群组键。如果指定的_id 值为空值或任何其他常量值,$group 阶段将返回聚合所有输入文档值的单个文档。请参阅按空值分组示例。 |
field | 可选。使用累加器操作符进行计算。 |
_id
和累加器操作符可以接受任何有效的expression
。
累加器操作符
详见:https://www.mongodb.com/zh-cn/docs/manual/reference/operator/aggregation/group/#accumulator-operator
$addToSet
:将数据组成集合$push
:将数据组成列表$avg
:平均值,忽略非数值$sum
:数值总和$bottom
/$top
:按指定顺序返回最后一个/第一个$count
:文档数$max
/$min
:最大/最小值
$match
根据指定的查询谓词筛选文档。匹配的文档将传递到下一个管道阶段。
{ $match: { <query predicate> } }
$match
查询谓词的语法与 find()
命令的查询参数中使用的语法相同。
- 尽可能早地将
$match
放在聚合管道中。由于$match
限制了聚合管道中的文档总数,因此早期的$match
操作会最大限度地减少管道中的处理量。 - 如果在管道的开头放置一个
$match
,查询可以像使用任何其他db.collection.find()
或db.collection.findOne()
那样使用索引。
$count
将文档传递到下一阶段,该阶段包含输入到该阶段的文档数的计数。
{ $count: <string> }
<string>
是以计数为值的输出字段的名称。<string>
必须是非空字符串,不能以 $
开头,也不能包含 .
字符。
$count
阶段相当于以下 $group
和 $project
序列:
db.collection.aggregate( [
{ $group: { _id: null, myCount: { $sum: 1 } } },
{ $project: { _id: 0 } }
] )
示例
使用以下文档创建名为 scores
的集合:
db.scores.insertMany( [
{ "_id" : 1, "subject" : "History", "score" : 88 },
{ "_id" : 2, "subject" : "History", "score" : 92 },
{ "_id" : 3, "subject" : "History", "score" : 97 },
{ "_id" : 4, "subject" : "History", "score" : 71 },
{ "_id" : 5, "subject" : "History", "score" : 79 },
{ "_id" : 6, "subject" : "History", "score" : 83 }
] )
以下聚合操作有两个阶段:
$match
阶段会排除score
值小于或等于80
的文档,以便将score
大于80
的文档传递到下一个阶段。$count
阶段会返回聚合管道中剩余文档的计数,并将该值分配给名为passing_scores
的字段。
db.scores.aggregate( [
{ $match: { score: { $gt: 80 } } },
{ $count: "passing_scores" }
] )
该操作返回以下结果:
{ "passing_scores" : 4 }
如果输入数据集为空,则 $count
不会返回结果。
$unwind
解构输入文档中的数组字段,以便为每个元素输出文档。每个输出文档都是输入文档,并用该元素替换该数组字段的值。
基础语法:
{ $unwind: <field path> }
可以将文档传递给 $unwind
以指定各种行为选项。
{
$unwind:
{
path: <field path>,
includeArrayIndex: <string>,
preserveNullAndEmptyArrays: <boolean>
}
}
字段 | 类型 | 说明 |
---|---|---|
路径 | 字符串 | 数组字段的字段路径。如需指定字段路径,请在字段名称前加上美元符号 $ ,并用引号括起来。 |
includeArrayIndex | 字符串 | 可选。新字段的名称,用于保存该元素的数组索引。名称不能以美元符号 $ 开头。 |
preserveNullAndEmptyArrays | 布尔 | 可选。true 如果为 ,如果path 为 null、缺失或空大量,则$unwind 会输出文档。false 如果为path ,如果 为 null、缺失或空大量,则$unwind 不会输出文档。默认值为 false 。 |
示例
展开数组
创建名为 inventory
的示例集合,其中包含以下文档:
db.inventory.insertOne({ "_id" : 1, "item" : "ABC1", sizes: [ "S", "M", "L"] })
以下聚合使用 $unwind
阶段为 sizes
数组中的每个元素输出一个文档:
db.inventory.aggregate( [ { $unwind : "$sizes" } ] )
操作返回以下结果:
{ "_id" : 1, "item" : "ABC1", "sizes" : "S" }
{ "_id" : 1, "item" : "ABC1", "sizes" : "M" }
{ "_id" : 1, "item" : "ABC1", "sizes" : "L" }