web-dev-qa-db-fra.com

Nombre de groupes avec MongoDB en utilisant le cadre d'agrégation

Disons que mon schéma MongoDB ressemble à ceci:

{car_id: "...", owner_id: "..."}

Il s'agit d'une relation plusieurs-à-plusieurs. Par exemple, les données peuvent ressembler à ceci:

+-----+----------+--------+
| _id | owner_id | car_id |
+-----+----------+--------+
|   1 |        1 |      1 |
|   2 |        1 |      2 |
|   3 |        1 |      3 |
|   4 |        2 |      1 |
|   5 |        2 |      2 |
|   6 |        3 |      4 |
|   7 |        3 |      5 |
|   8 |        3 |      6 |
|   9 |        3 |      7 |
|  10 |        1 |      1 | <-- not unique
+-----+----------+--------+

Je veux obtenir le nombre de voitures appartenant à chaque propriétaire. En SQL, cela pourrait ressembler à:

SELECT owner_id, COUNT(*) AS cars_owned
FROM (SELECT owner_id FROM car_owners GROUP BY owner_id, car_id) AS t
GROUP BY owner_id;

Dans ce cas, le résultat ressemblerait à ceci:

+----------+------------+
| owner_id | cars_owned |
+----------+------------+
|        1 |          3 |
|        2 |          2 |
|        3 |          4 |
+----------+------------+

Comment puis-je accomplir cette même chose en utilisant MongoDB en utilisant le cadre d'agrégation?

43
Matthew Ratzloff

Pour gérer les doublons potentiels, vous devez utiliser deux $group opérations:

db.test.aggregate([
    { $group: {
        _id: { owner_id: '$owner_id', car_id: '$car_id' }
    }},
    { $group: {
        _id: '$_id.owner_id',
        cars_owned: { $sum: 1 }
    }},
    { $project: {
        _id: 0,
        owner_id: '$_id',
        cars_owned: 1
    }}]
    , function(err, result){
        console.log(result);
    }
);

Donne un résultat au format:

[ { cars_owned: 2, owner_id: 10 },
  { cars_owned: 1, owner_id: 11 } ]
71
JohnnyHK

$group est similaire à SQL Group by command. Dans l'exemple ci-dessous, nous allons regrouper les entreprises en fonction de l'année de leur création. Et calculez le nombre moyen d'employés pour chaque entreprise.


db.companies.aggregate([{
    $group: {
      _id: {
        founded_year: "$founded_year"
      },
      average_number_of_employees: {
        $avg: "$number_of_employees"
      }
    }
  }, {
    $sort: {
      average_number_of_employees: -1
    }
  }
])

$avg operator MongoDB

Ce pipeline d'agrégation comporte 2 étapes

  1. $group
  2. $sort

Maintenant, fondamental pour le $group l'étape est le _id champ que nous spécifions comme partie du document. C'est la valeur de $group opérateur lui-même utilisant une interprétation très stricte de la syntaxe du cadre d'arrogation. _id est la façon dont nous définissons, comment nous contrôlons, comment nous ajustons ce que la phase de groupe utilise pour organiser les documents qu'elle voit.

La requête ci-dessous permet de trouver les relations des personnes avec les entreprises utilisant $sum opérateur:


db.companies.aggregate([{
  $match: {
    "relationships.person": {
      $ne: null
    }
  }
}, {
  $project: {
    relationships: 1,
    _id: 0
  }
}, {
  $unwind: "$relationships"
}, {
  $group: {
    _id: "$relationships.person",
    count: {
      $sum: 1
    }
  }
}, {
  $sort: {
    count: -1
  }
}])

$sum in MongoDB

0
student