Introduksjon til NumPy: Et grunnleggende verktøy for dataanalyse
NumPy er en hjørnestein i enhver dataforskers arsenal. Dette kraftfulle biblioteket er uunnværlig for effektiv datahåndtering og er en essensiell ferdighet for alle som jobber med data, enten det er dataforskere, analytikere eller ingeniører.
Dersom du ønsker å tilegne deg denne etterspurte kompetansen, er denne artikkelen skrevet for deg. Her vil du bli introdusert til hva NumPy er, hvorfor det er så viktig, og du vil få veiledning til de beste ressursene for å lære det.
Hva er NumPy?
NumPy, som står for Numerical Python, ble utviklet av Travis Oliphant i 2005. Det er et bibliotek som primært brukes for dataanalyse.
Det sentrale elementet i NumPy er matrisen, eller «array» som det kalles på engelsk. En matrise er i bunn og grunn en organisert samling av dataverdier. Denne strukturen er svært praktisk for å representere vektorer. Selv om den har likheter med den innebygde Python-listen, finnes det en vesentlig forskjell.
I motsetning til Python-lister, lagrer NumPy data i sammenhengende minneblokker. Dette betyr at verdiene ligger rett ved siden av hverandre i dataminnet. Denne måten å lagre data på gir raskere tilgang til verdiene. NumPy-matriser kan være opptil 50 ganger raskere enn Python-lister når det gjelder vanlige operasjoner.
Som Python-lister kan matriser lagre andre matriser som elementer. Dette åpner for muligheten til å skape mer komplekse matematiske strukturer, som matriser og matriser av høyere dimensjoner. NumPy tilbyr også nyttige metoder for å utføre statistiske operasjoner, som å beregne gjennomsnitt, median og standardavvik. Du har også muligheten til å manipulere dem gjennom oppdeling, sammenslåing og omforming.
Forutsetninger for å bruke NumPy
- En installert versjon av Python
- Pip installert
- En IDE, for eksempel VSCode, eller fortrinnsvis en notebook-basert IDE som Jupyter
- Grunnleggende kunnskap om Python
Les mer: Introduksjon til Jupyter Notebook for nybegynnere
Anvendelsesområder
- NumPy er mye brukt i datavitenskap på grunn av de effektive matrisene, som tilbyr en fordel over de innebygde Python-listene.
- Den kan brukes til å løse lineære algebraproblemer ved hjelp av de innebygde funksjonene.
- NumPy er essensielt i maskinlæring, takket være rask beregning av vektorer og matriser.
- Biblioteket brukes til å generere tilfeldige datasett ved hjelp av diverse statistiske funksjoner.
Kurs for å lære NumPy
Her er en oversikt over noen av de beste ressursene for å lære NumPy og dataanalyse. De fleste av disse kursene krever en viss forståelse av Python. Hvis du ikke har lært Python ennå, finnes det en rekke ressurser for å lære Python.
Forutsetninger for dyp læring: NumPy-pakken i Python
Dette Udemy-kurset gir en grundig innføring i forberedelsene til dyp læring ved hjelp av Python. Kurset gir deg kunnskap i bruk av NumPy for vektor- og matriseberegninger.
I tillegg introduserer det Pandas, et bibliotek for å håndtere datasett i Python, samt Matplotlib (et verktøy for datavisualisering) og Scipy (et bibliotek for statistisk datahåndtering i Python).
Kurset inneholder seks timer med videoinnhold tilgjengelig on-demand, og når du har kjøpt det har du livslang tilgang. Det inkluderer også en sertifisering. Før du starter dette kurset, bør du ha en grunnleggende forståelse av lineær algebra og Python-programmering.
Dataanalyse med Python: NumPy & Pandas Masterclass
Dette omfattende kurset lærer deg å analysere data ved bruk av Pandas og NumPy. Undervisningsmetoden består av 216 forelesninger, 3 artikler og 2 nedlastbare ressurser, som totalt gir deg over 13 timer med innhold.
Det starter med å introdusere NumPy og konseptet med en matrise, som er det sentrale objektet i NumPy. Deretter vil kurset vise deg hvordan du bruker Pandas, et populært og nyttig bibliotek for å jobbe med datasett. Til slutt vil du lære datavisualisering ved hjelp av Matplotlib-biblioteket.
Det som skiller dette kurset fra mange andre, er at timene gjøres mer praktiske ved at du lærer gjennom rollespill. Du vil innta rollen som dataanalytiker i et stort, multinasjonalt selskap, og du vil analysere data som samles inn fra de ulike avdelingene. Det forventes at du har en viss kjennskap til Python før du starter kurset.
Python med NumPy for absolutt nybegynnere
Dette kurset er en av de mest nybegynnervennlige introduksjonene til NumPy. Selv om det forventes at du kjenner til Python, introduserer kurset NumPy fra bunnen av.
Det starter med å presentere NumPy-matriser. Kurset forklarer hvordan disse skiller seg fra Python-lister, og hvorfor de er raskere og bedre egnet for datavitenskap, ingeniørarbeid og analyse.
Du vil også lære alt du kan gjøre med disse matrisene. Dette inkluderer, men er ikke begrenset til, å lage matriser, få tilgang til dem ved hjelp av indekser, dele opp og slå dem sammen, samt forme og omforme dem.
Dette kurset har to timer med videoinnhold, og fokuserer utelukkende på NumPy. Du kan fullføre dette og få sertifisering i løpet av en uke.
Introduksjon til NumPy
Dette kurset fra DataCamp er en fin introduksjon til NumPy for nybegynnere. Kurset varer i omtrent fire timer og består av 13 godt utformede videoer og 49 øvelser som hjelper deg med å styrke forståelsen av de konseptene du har lært.
Det er en del av «Data Scientist»-sporet, så hvis du fullfører andre kurs i samme spor, vil du motta DataCamp Data Scientist-sertifiseringen din.
Når det gjelder innholdet, introduserer kurset matriser og forklarer fordelene ved å bruke dem fremfor lister i Python. Deretter vil du lære kringkastings- og vektoriseringsteknikker for å gjøre koden din raskere og mer effektiv. Du vil også øve på matriseoperasjoner på Monet-datasettet.
Simplilearn NumPy Opplæring
Denne gratis opplæringen fra Simplilearn dekker det grunnleggende om NumPy. Den er kort og konsis. Artikkelen har minimale forklaringer, noe som gjør den ideell som en referanse eller om du allerede er kjent med NumPy, og hva de ulike funksjonene gjør.
Artikkelen inneholder også kodebiter for å illustrere bruken av forskjellige funksjoner med eksempler. Dette er ideelt om du har det travelt og ønsker å lære NumPy på ti minutter. Siden dette er en artikkel, er det ikke noe sted å øve eller datasett å jobbe med.
Du må selv sette opp et praktisk miljø og finne datasett å øve med. Kaggle er et bra sted å lete etter datasett og lage notatbøker for å øve på dataanalyse.
W3Schools
Denne opplæringen fra W3Schools er en favoritt. Den er gratis og omfattende, og dekker alt det grunnleggende om NumPy, i tillegg til mer avanserte temaer, som generering av tilfeldige statistiske fordelinger og bruk av universelle funksjoner for å implementere vektorisering.
Totalt består opplæringen av 43 nettsider med korte, men tilstrekkelige forklaringer, samt kodebiter for å illustrere med eksempler. I tillegg kommer W3Schools med en editor hvor du kan skrive NumPy-spørsmål og en quiz hvor du kan teste kunnskapen din.
Alle disse er valgfrie, men vil forbedre læringsopplevelsen din. Ved å melde deg på NumPy-kurset mot en avgift, kan du få en sertifisering som du kan legge til på CV-en din.
Skalerkurs
Dette kurset fra Scaler er velorganisert. Det består av seks moduler som dekker en introduksjon til NumPy, flerdimensjonale matriser, datastrukturer, funksjoner, kringkasting og andre ulike konsepter.
Totalt har det 32 leksjoner med 5 timer og 33 minutter med videoinnhold. Det er 26 utfordringer som hjelper deg med å praktisere det du har lært og forsterke de ulike konseptene. Etter at du har fullført kurset, vil du motta et kompetansebevis.
Som forventet må du være kjent med programmeringsspråket Python før du starter kurset. Den andre forutsetningen er en IDE med Python og NumPy installert på datamaskinen.
Guide to NumPy av Travis Oliphant
Denne boken er skrevet av skaperen av NumPy, og er ment å være en referanse for de som allerede kjenner Python, men som ønsker å lære om NumPy og andre verktøy.
I denne boken forklarer ikke Travis Oliphant bare hvordan man bruker NumPy, men også hvordan du utvider det ved hjelp av API. Dette er trolig den mest dyptgående og detaljerte ressursen om NumPy.
Den passer best for avanserte brukere av NumPy som ønsker en høyere forståelse av hvordan NumPy fungerer, og en detaljert veiledning som gjør at de kan bidra til og utvide biblioteket.
NumPy Beginner’s Guide av Ivan Idris
Denne boken om NumPy er ment å være nybegynnervennlig. Den er skrevet for forskere, ingeniører, programmerere og analytikere som allerede er kjent med Python, men som ønsker å utvide sine ferdigheter ved å lære NumPy.
Boken omhandler installasjon av NumPy, Matplotlib, Scipy og IPython på den lokale maskinen. Den dekker deretter matriser og de forskjellige matrisefunksjonene som er tilgjengelige. Videre vil du lære å bruke biblioteket til å utføre matriseoperasjoner og teste koden din med `NumPy.testing`. Alt i alt er denne boken en omfattende guide til NumPy.
NumPy: From Basic to Advanced av Karan Singh Bisht
Tittelen «NumPy fra grunnleggende til avansert» sier det meste. Denne boken tar deg med på en gradvis læringsreise, fra å ikke vite noe om biblioteket til å kunne bruke noen av de mer avanserte funksjonene.
Boken dekker det grunnleggende, for eksempel å forklare hva en matrise er, til å gå over til mer avanserte temaer, som CPU-cache-effekter og livssyklusen til Ndarray. Målet er å gi deg et solid grunnlag for videre maskinlæringsarbeid ved bruk av NumPy-biblioteket.
FreeCodeCamp YouTube Opplæring
FreeCodeCamp har vokst i popularitet som en kilde til høykvalitets opplæringsprogrammer for koding og programvareutvikling. I opplæringskatalogen finnes denne omfattende NumPy-opplæringen. Som alle opplæringsprogrammer, er den tilgjengelig gratis.
Opplæringen varer i omtrent en time, og dekker det grunnleggende om NumPy. Det er en rolig introduksjon til biblioteket, og den er ment å ikke virke overveldende for de som akkurat har begynt. Som forventet antas det at du har Python-kunnskaper før du ser videoen.
Avsluttende ord
NumPy er et utrolig nyttig og allsidig verktøy. Det er et forventet verktøy i de fleste datavitenskaps- og ingeniørstillinger. Denne artikkelen har gitt deg en introduksjon til NumPy, og en overordnet oversikt over de viktigste konseptene.
Videre har artikkelen listet opp ressurser som kan være nyttige i læringsprosessen. Den korte beskrivelsen av hver ressurs, vil kunne hjelpe deg med å ta et informert valg om hvilken du skal velge.
Du kan deretter utforske de beste Python-bibliotekene for dataforskere.