Finn og fjern duplikater i Google Sheets
To enkle metoder for å identifisere duplikater i Google Sheets er ved hjelp av funksjonen COUNTIF og verktøyet for datarensing.
Om Google Sheets
Google Sheets er en gratis, nettbasert regnearkapplikasjon som tilbys av Google som en del av deres kontorpakke, og konkurrerer med Microsoft Office. Google Sheets brukes til å forberede data, utføre beregninger og mye mer.
Programmet brukes til å endre, organisere og lagre data. Det er en del av Googles produktivitetspakke, som også inneholder Google Disk og Google Slides.
En av fordelene med Google Sheets, i motsetning til Excel, er muligheten for sanntidssamarbeid med flere brukere.
Google Sheets har forenklet opprettelsen av databaser ved å tilby et brukervennlig grensesnitt og nyttige verktøy for å organisere data.
Bruken av Google Sheets kan øke produktiviteten og spare tid. Ettersom plattformen er skybasert, trenger ikke brukere lenger å bekymre seg for å miste viktige data eller utilsiktet overskriving av filer.
Google Sheets er et av de mest brukte regneark- og databaseprogrammene, og er tilgjengelig på alle populære operativsystemer for stasjonære og mobile enheter.
Hvordan forenkler Google Sheets opprettelse av databaser?
Tradisjonelt har opprettelse av databaser vært en kompleks og tidkrevende prosess. Men den nylige utviklingen innen teknologi, spesielt med Google Sheets, har forenklet denne prosedyren betydelig. Programmet tilbyr også mange funksjoner, som muligheten til å legge til diagrammer, formler og bilder.
For sanntidsadministrasjon og lagring av data bruker mange bedrifter Google Sheets i stedet for andre kostbare databaser som PostgreSQL, MySQL, SQL Server, osv. Google Sheets er et foretrukket alternativ for de fleste små datasett.
Google Sheets er ikke et fullverdig databasestyringssystem for større bedrifter. Men i motsetning til andre databasestyringssystemer, er det svært nyttig for små bedrifter og prosjekter som trenger å håndtere sine finansielle operasjoner effektivt.
En annen viktig fordel er at Google Sheets har flere avanserte funksjoner tilgjengelig gratis, som Google Sheets API, Apps-skript, skjemautløsere, tidsbestemte utløsere og ImportXML.
Gjennom appskript kan brukere koble seg til ulike databaser, da appskriptet inkluderer en JDBC-tjeneste for tilkobling til MySQL, Microsoft SQL Server og andre databaser.
Bedrifter kan redusere sine utgifter til ulike databehandlingssystemer ved å utnytte alle disse funksjonene.
La oss nå se på virkningen av dupliserte verdier i en database.
Effekten av dupliserte verdier i databasen
Dupliserte verdier i en database kan ha negativ innvirkning på dataene, spesielt hvis de brukes til analyse- eller rapporteringsformål.
I noen tilfeller kan dupliserte verdier forvrenge dataene, noe som kan føre til feilaktige konklusjoner. I andre tilfeller kan duplisering gjøre dataene vanskeligere å bruke og forstå.
Det er viktig å være klar over de potensielle effektene av dupliserte verdier i en database og ta forholdsregler for å forhindre eller redusere slike effekter.
Fremhev duplikater i en enkelt kolonne i Google Sheets
I denne delen skal vi se på hvordan vi kan markere duplikater og fjerne dem i Google Sheets.
Den vanlige formelen for å fremheve duplikater er:
=COUNTIF(område, kriterium)
Her er en trinnvis veiledning for hvordan du bruker denne formelen i Google Sheets:
Naviger til «Format»-alternativet i toppmenyen og velg «Betinget formatering».
De nye alternativene for betinget formatering vises på høyre side av skjermen.
Etter å ha definert celleområdet du vil markere duplikater i, velg «Egendefinert formel er» fra rullegardinmenyen i «Formatregler»-delen.
I dette feltet skriver du inn følgende formel:
=COUNTIF($G$6:$G$14,G6)>1
G-cellen må erstattes med den aktuelle kolonnen der du vil markere duplikater.
Etter at du har klikket «Ferdig», vil duplikatene i kolonnen være uthevet, som vist på bildet over.
Du kan endre uthevingsfargen eller andre formateringsalternativer i formateringsstilinnstillingene, som vist nedenfor:
Vi har nå sett hvordan du fremhever duplikater i en enkelt kolonne. I neste avsnitt ser vi på hvordan du markerer duplikater i flere kolonner.
Uthev duplikater i Google Sheets i flere kolonner
Alle trinnene i denne prosessen er de samme som tidligere nevnt, med unntak av formelen og celleområdet vi definerer for å markere duplikatene.
La oss se på et eksempel for å forstå dette bedre.
Gå til «Betinget formatering» fra «Format»-menyen. Alternativene vises på høyre side.
Et celleområde spesifiseres i «Bruk på område»-delen.
I «Formatregler»-delen er formelen for å fremheve duplikater fra flere kolonner:
=COUNTIF($F$6:$I$8,F6)>1
Dette er en enkel formel. Den inkluderer bare en rekke celler som du vil identifisere duplikater fra.
Når denne formelen er kjørt, blir duplikater fra de fire kolonnene uthevet, som vist i eksemplet nedenfor.
I dette eksemplet har vi også endret uthevingsfargen til blå.
I den neste delen skal vi se hvordan du fremhever dupliserte data fra rader.
Uthev duplikater i Google Sheets i rader
Det er litt annerledes å identifisere dupliserte rader med data i et Google-ark enn å fremheve dupliserte kolonner.
Vi gjentar ikke hvert trinn da de er de samme bortsett fra formelen.
La oss se på et eksempel.
Celleområdet der du vil fremheve duplikatene er oppført i «Bruk på område»-delen av alternativene for betinget formatering.
I «Egendefinert formel er»-delen skrives følgende formel:
=COUNTIF(ARRAYFORMULA($A$3:$A$10&$B$3:$B$10&$C$3:$C$10),$A3&$B3&$C3)>1
Selv om denne formelen kan virke komplisert, inneholder den start- og sluttcellenumrene til radene der du vil markere duplikater.
Resultatet vises som angitt nedenfor etter at formelen er utført.
I dette eksemplet er også uthevingsfargen endret, noe som gjøres i samme del av formateringsstilmenyen som når du uthever dupliserte kolonner.
Fremhev duplikater i Google Sheets for spesifikke kriterier
Hvis du ønsker å fremheve duplikater basert på spesifikke kriterier, må du bruke stjerneoperatoren («*») for å fortelle COUNTIF-funksjonen å koble sammen de definerte områdene og vise resultatet.
Formelsyntaksen for å utføre dette er:
=(COUNTIF(Område,Kriterier)>1) * (Ny Betingelse)
La oss se på et eksempel for å forstå dette.
Kriterier: La oss si at du vil fremheve alle dupliserte rader i databasen, men beholde de første oppføringene av de dupliserte radene.
La oss se hvordan du gjør dette i et Google-ark. Bortsett fra formelendringen er alle trinnene de samme som tidligere, så vi går rett til formelen.
Formelen for å utføre kriteriene over er:
=COUNTIF(ArrayFormula($A$3:$A3&$B$3:$B3&$C$3:$C3),$A3&$B3&$C3)>1
Denne lange formelen involverer starten og slutten av cellenumrene.
Google-arket nedenfor viser at de første oppføringene for Apple og Orange hoppes over, mens de andre er uthevet.
Vi har nå sett hvordan du kan fremheve dupliserte data i rader, kolonner og med spesifikke kriterier. I neste del skal vi se hvordan du raskt kan fjerne dupliserte data.
Snarvei for å fjerne duplikater
Velg databasen eller kolonnen du vil slette duplikater fra. Velg «Data opprydding» fra menyen øverst, velg «Fjern duplikater» og klikk OK, som vist på bildet nedenfor.
Et popup-vindu vises der du kan velge alternativer og godkjenne fjerning av duplikater.
Det finnes et alternativ for «Data som overskriftsrad». Merk av i denne boksen hvis arket ditt har en overskriftsrad, slik at Google Sheets ignorerer den når du sletter duplikater.
Duplikatene slettes når du bekrefter valgene dine og klikker på «Fjern duplikater». Resultatet vises nedenfor.
Hvordan lage en unik liste?
La oss trekke ut en unik liste fra en database med mange duplikater.
Formelen er veldig enkel å forstå og bruke.
La oss bruke et av våre tidligere Google-ark for å illustrere dette.
Syntaksen for å lage en unik liste er:
=unique(startområde: sluttområde)
Som vist på bildet nedenfor, er formelen lagt inn i kolonne D. Området vi ønsker å trekke ut de unike dataene fra er definert, og resultatet vises i kolonne D etter at formelen er utført.
Hvordan slette mellomrom i Google Sheets?
Når du arbeider med et Google-ark med tekst- eller numeriske data, vil du ofte støte på overflødige mellomrom i cellene, noe som kan være irriterende.
I denne delen skal vi se på hvordan du kan bli kvitt disse ekstra mellomrommene.
La oss bruke Google-arket nedenfor for å fjerne de ekstra mellomrommene.
Velg kolonnen eller datasettet som inneholder ekstra mellomrom, gå til «Data»-menyen øverst, velg «Data opprydding» og klikk på «Trim mellomrom», som vist nedenfor.
Når du velger «Trim mellomrom», ser du resultatet som angitt på bildet nedenfor. Kolonnen er nå fri for overflødige mellomrom.
Avslutning
Dupliserte data er ikke bare en unødvendig tidsbruk, men kan også føre til betydelige problemer og kostbare feil.
Hvis du har et lite Google-ark, kan du kanskje finne duplikatene manuelt. Men hvis du har mange ark, vil det ta mye tid og være utsatt for feil. Teknikkene beskrevet over vil hjelpe deg med å identifisere duplikater i Google-dokumentet ditt og fjerne dem alle samtidig.
Du kan også sjekke ut den ultimate FAQ-jukselappen for Google Sheets.