MongoDB Trova duplicati

MongoDB Trova duplicati
“Hai mai sentito parlare del concetto di duplicazione dei dati mentre lavori nei database? Quando un record, una cosa, una persona o un luogo ha la sua copia esatta, si dice che quella copia sia il duplicato dell'originale. Mentre lavoriamo in database tradizionali, utilizziamo la clausola Where per scoprire i duplicati all'interno dei record della tabella, i.e., SQL, Postgresql. D'altra parte, MongoDB non consente di utilizzare la clausola Where per scoprire i duplicati inseriti all'interno delle raccolte di un database specifico.

Ha trovato la funzione aggregata per scoprire i valori duplicati dalla raccolta. All'interno di questo articolo oggi discuteremo dell'inserimento di record duplicati all'interno delle raccolte Mongo DB e visualizzarli sulla shell MongoDB usando il comando aggregato delle raccolte. Cominciamo con il nostro articolo di oggi mediante l'uso dell'aggiornamento APT e le istruzioni di aggiornamento all'interno della shell del terminale di Ubuntu 20.04 Sistema. Per questo, è necessario accedere prima e aprire la shell mediante l'uso di “Ctrl+Alt+T."Dopodiché, è possibile provare le istruzioni per il petto mostrato sulla shell e aggiungere la password per l'utente per continuare il processo di aggiornamento."

Potrebbe richiedere la conferma di continuare questo processo. Tocca "Y" chiedendo: "Vuoi continuare?". Dopodiché, premi il tasto Invio.

Potrebbe essere necessario più o meno tempo per elaborare in base alla situazione del tuo sistema.

Dopo l'aggiornamento completo, otterrai le ultime righe di elaborazione mostrate.

Dopo l'aggiornamento e l'aggiornamento del sistema di sistema, dobbiamo aprire la shell MongoDB per inserire alcune raccolte e record all'interno del database. Quindi, abbiamo usato la query "Mongo" per farlo, come visualizzato nell'immagine. Il guscio è stato preparato con successo.

Durante l'utilizzo dell'istruzione "DB" nella shell MongoDB, abbiamo scoperto che il database "Test" è disponibile per il nostro utilizzo.

Pertanto, abbiamo utilizzato il database "test" per ulteriori domande e creazione di raccolta al suo interno. Per questo, prova l'istruzione "usa" seguita dal nome di un database, i.e., "test."

Per aggiungere record, abbiamo bisogno di una raccolta nel database di test. Pertanto, dobbiamo creare una nuova collezione. Per questo, dobbiamo provare l'istruzione "db" insieme alla funzione "createcollection ()" di MongoDB, seguita dal nome di una nuova raccolta all'interno della sua parentesi, i.e., Dati. La query ebbe successo e la collezione fu creata con successo secondo lo stato "OK: 1". Inoltre MongoDB, tendiamo a utilizzare la funzione find () preceduta dal nome della raccolta per visualizzare i record di una raccolta specifica. Pertanto, abbiamo provato l'istruzione "db" seguita dal nome della raccolta, i.e., Dati e la funzione trovano () per farlo. La raccolta "dati" è vuota in questo momento. Pertanto, dobbiamo aggiungere alcuni record alla raccolta.

Per inserire i record all'interno della raccolta dei dati di MongoDB, dobbiamo provare la funzione insert () all'interno dell'istruzione "db" insieme ai dati sotto forma di documenti, i.e., formato di elenco. Abbiamo utilizzato un totale di 4 colonne per i dati del documento delle raccolte, i.e., _id, titolo, età e prezzo. Abbiamo aggiunto un totale di 5 record per tutte queste 4 colonne di raccolta dei dati.

Il record è stato aggiunto correttamente secondo l'output sopra mostra il numero di record 5 per l'opzione "Ninserked". Successivamente, utilizzeremo la funzione Find () con la raccolta "Data" per trovare e visualizzare tutti i record di questa raccolta. Non stiamo passando alcun argomento alla parentesi di una funzione find () per non limitare i record di raccolta. Tutti i 5 record per la raccolta dei dati sono stati presentati nella shell Mongo DB.

Dato che abbiamo avuto a che fare con l'argomento di trovare i duplicati nelle collezioni di MongoDB, dobbiamo avere anche alcuni record duplicati nelle collezioni. Pertanto, abbiamo inserito altri tre record all'interno della raccolta dei dati da utilizzare come duplicati di alcuni dei record già inseriti. Dobbiamo aggiornare la colonna "_id" solo poiché l'ID di qualsiasi colonna deve essere univoco in MongoDB come facevamo nei database tradizionali. La stessa funzione di insert è stata utilizzata finora con il nome di raccolta "dati". Tutti e tre i record sono stati aggiunti.

Ora, quando si esegue l'istruzione "DB" con il nome di raccolta "dati" seguiti dalla funzione find () ancora una volta sulla shell Mongodb, il totale di 8 record verrà visualizzato sullo schermo. Possiamo vedere i valori duplicati per colonne diverse da "_id" in questi dati di raccolta.

È tempo di provare il metodo aggregato () per la raccolta "dati" per elencare i valori specifici della colonna che sono duplicati in esso. È necessario utilizzare la sintassi di cima mostrata di un comando aggregato in MongoDB. L'opzione "$ gruppo" viene utilizzata per aggiungere tutti i valori duplicati di una colonna specifica in una, mentre l'opzione $ corrisponderà per scoprire i gruppi con più di 1 documento. D'altra parte, l'opzione "$ Project" verrà utilizzata per specificare il formato di mostrare i record duplicati. Il primo campo dell'opzione "$ gruppo" specificherà il nome della colonna in cui cercheremo i duplicati. Un totale di 3 record sono stati trovati duplicati per la colonna "Titolo" di una raccolta di dati. Dopo questo, la stessa domanda è stata provata per la colonna "Age" e ha ottenuto di nuovo i 3 risultati.

Conclusione

La spiegazione dei record duplicati è stata fornita nel paragrafo introduttivo e abbiamo discusso della differenza tra la scoperta dei duplicati dai database tradizionali e MongoDB. A tale scopo, abbiamo cercato di dare un'illustrazione sulla creazione di una nuova collezione all'interno di MongoDB e sull'inserimento di record al suo interno. Inoltre, abbiamo discusso dell'uso della funzione aggregata per scoprire la colonna specifica contenente il valore duplicato all'interno delle raccolte. Questo articolo ha visualizzato la chiara differenza nel trovare i duplicati per MongoDB come confronto con qualsiasi altro database.