常用聚合
阶段
$group
$group
阶段根据“组键”将文档分成组。输出是每个唯一组键的一个文档。
-
组键通常是一个字段或一组字段。组键也可以是表达式的结果。使用
$group
管道阶段中的_id
字段来设置组键。请参阅下面的使用示例。 -
在
$group
阶段输出中,_id
字段被设为该文档的组键。 -
$group
不会对其输出文档进行排序。
$group
阶段具有以下原型形式:
{
$group:
{
_id: <expression>, // Group key
<field1>: { <accumulator1> : <expression1> },
...
}
}
字段 | 说明 |
---|---|
_id | 必需。 _id 表达式指定群组键。如果指定的_id 值为空值或任何其他常量值,$group 阶段将返回聚合所有输入文档值的单个文档。请参阅按空值分组示例。 |
field | 可选。使用累加器操作符进行计算。 |
_id
和累加器操作符可以接受任何有效的expression
。
累加器操作符
详见:https://www.mongodb.com/zh-cn/docs/manual/reference/operator/aggregation/group/#accumulator-operator
$addToSet
:将数据组成集合$push
:将数据组成列表$avg
:平均值,忽略非数值$sum
:数值总和$bottom
/$top
:按指定顺序返回最后一个/第一个$count
:文档数$max
/$min
:最大/最小值
$match
根据指定的查询谓词筛选文档。匹配的文档将传递到下一个管道阶段。
{ $match: { <query predicate> } }
$match
查询谓词的语法与 find()
命令的查询参数中使用的语法相同。
- 尽可能早地将
$match
放在聚合管道中。由于$match
限制了聚合管道中的文档总数,因此早期的$match
操作会最大限度地减少管道中的处理量。 - 如果在管道的开头放置一个
$match
,查询可以像使用任何其他db.collection.find()
或db.collection.findOne()
那样使用索引。
$count
将文档传递到下一阶段,该阶段包含输入到该阶段的文档数的计数。
{ $count: <string> }
<string>
是以计数为值的输出字段的名称。<string>
必须是非空字符串,不能以 $
开头,也不能包含 .
字符。
$count
阶段相当于以下 $group
和 $project
序列:
db.collection.aggregate( [
{ $group: { _id: null, myCount: { $sum: 1 } } },
{ $project: { _id: 0 } }
] )
示例
使用以下文档创建名为 scores
的集合:
db.scores.insertMany( [
{ "_id" : 1, "subject" : "History", "score" : 88 },
{ "_id" : 2, "subject" : "History", "score" : 92 },
{ "_id" : 3, "subject" : "History", "score" : 97 },
{ "_id" : 4, "subject" : "History", "score" : 71 },
{ "_id" : 5, "subject" : "History", "score" : 79 },
{ "_id" : 6, "subject" : "History", "score" : 83 }
] )