Mongodb で重複を見つける方法


次の構文を使用して、MongoDB 内で重複する値を持つドキュメントを検索できます。

 db.collection.aggregate([
    {" $group ": { "_id": " $field1 ", "count": { " $sum ": 1 } } },
    {" $match ": {"_id" :{ " $ne " : null } , "count" : {" $gt ": 1} } }, 
    {" $project ": {"name": " $_id ", "_id": 0} }
])

この構文の動作は次のとおりです。

  • フィールド 1 に同じ値を持つすべてのドキュメントをグループ化します
  • 複数のドキュメントを持つグループを照合する
  • 複数のドキュメントを持つすべてのグループを投影する

この特定のクエリは、 field1列で重複する値を検索します。この値を編集するだけで、検索するフィールドを変更できます。

次の例は、次のドキュメントを使用して収集チームでこの構文を使用する方法を示しています。

 db.teams.insertOne({team: " Mavs ", position: " Guard ", points: 31 })
db.teams.insertOne({team: " Mavs ", position: " Guard ", points: 22 })
db.teams.insertOne({team: " Rockets ", position: " Center ", points: 19 })
db.teams.insertOne({team: " Rockets ", position: " Forward ", points: 26 })
db.teams.insertOne({team: " Cavs ", position: " Guard ", points: 33 })

例: 重複した値を持つドキュメントの検索

次のコードを使用して、「チーム」列内の重複する値をすべて検索できます。

 db.teams.aggregate([
    {" $group ": { "_id": " $team ", "count": { " $sum ": 1 } } },
    {" $match ": {"_id" :{ " $ne " : null } , "count" : {" $gt ": 1} } }, 
    {" $project ": {"name": " $_id ", "_id": 0} }
])

このクエリは次の結果を返します。

 { name: 'Rockets' }
{ name: 'Mavs' }

これは、値「Rockets」と「Mavs」が「team」フィールドに複数回出現していることを示しています。

$team を$positionに置き換えるだけで、代わりに「position」フィールドで重複する値を検索できることに注意してください。

 db.teams.aggregate([
    {" $group ": { "_id": " $position ", "count": { " $sum ": 1 } } },
    {" $match ": {"_id" :{ " $ne " : null } , "count" : {" $gt ": 1} } }, 
    {" $project ": {"name": " $_id ", "_id": 0} }
])

このクエリは次の結果を返します。

 { name: 'Guard' }

これにより、「位置」フィールドに「ガード」が複数回出現することが分かります。

追加リソース

次のチュートリアルでは、MongoDB で他の一般的な操作を実行する方法について説明します。

MongoDB: コレクションに新しいフィールドを追加する方法
MongoDB: グループ化してカウントする方法
MongoDB: 複数のフィールドでグループ化する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です