Data er den nye oljen: Lær maskinlæring og få drømmejobben!

Data og maskinlæring: Fremtidens nøkkel

Data har blitt en like verdifull ressurs som olje, og maskinlæring er drivkraften bak den nye æraen. Den aktøren som forstår og kontrollerer disse to elementene, vil ha en betydelig innflytelse på verden.

Dette er ikke bare en fantasifull uttalelse fra en futuristisk historie; det er realiteten i dagens samfunn.

Den nye globale dynamikken handler om å anskaffe store mengder relevant data og transformere den til handlingsrettet innsikt – en evne som menneskeheten ikke har hatt tidligere. Dette er teknologien som kan gi et land en fordel i forhold til andre og potensielt styre utviklingen globalt.

Derfor blir dette tatt svært alvorlig av de fremtidsrettede nasjonene rundt om i verden.

En innbringende karrierevei

Uavhengig av den internasjonale situasjonen, fremstår data- og maskinlæringsfeltet som et svært attraktivt og lovende område. Etterspørselen etter spesialister innenfor dette feltet er enorm, og det er en betydelig mangel på kvalifiserte eksperter, selv på middels nivå.

Det er som om vi plutselig har oppdaget mange nye bebobare planeter, men vi mangler ressurser for å flytte folk dit. Jeg kunne fortsatt å gjenta dette, men denne infografikken illustrerer situasjonen mye bedre:

Kilde: insidebigdata.com

Lønningene starter på over $50 000, og ledere kan tjene langt over $250 000.

I tillegg genererer den gjennomsnittlige personen på planeten 1,7 MB data per sekund. Det tilsvarer mer enn 3500 TB data i løpet av et liv – mer data enn vi vet hvordan vi skal håndtere eller analysere på nåværende tidspunkt. Å si at fremtiden er lys ville være en underdrivelse for dette blomstrende feltet.

Er data- og maskinlæring vanskelig?

Et godt spørsmål!

Fra mitt ståsted er svaret både «ja» og «nei».

Kunstig intelligens (og dermed maskinlæring) er et utfordrende område hvis man er interessert i forskning og utvikling. For slikt arbeid kan selv en doktorgrad i informatikk og matematikk være utilstrekkelig. Men de fleste har verken ambisjonene eller tiden til et slikt prosjekt.

På den andre siden har vi det jeg kaller Anvendt Datavitenskap og Maskinlæring.

Dette innebærer bruk av eksisterende verktøy, teknikker og algoritmer for å løse reelle problemer. Dette krever engasjement, innsikt og kreativ tenkning (samt kjennskap til noen enkle matematiske prinsipper som lett kan læres), men er mindre teknisk krevende enn jobben som programvareutvikler.

Med andre ord, det er ikke en enkel oppgave, men med tanke på forholdet mellom innsats og belønning, er det en av de beste investeringene man kan gjøre.

Nå som du er motivert til å bli dataforsker eller maskinlæringsingeniør, la oss se på noen av de beste ressursene som finnes.

Maskinlæring (Google)

Mange er kanskje ikke klar over det, men Google tilbyr et omfattende og svært praktisk gratis kurs i maskinlæring. Dette er en del av selskapets forpliktelse til å fremme AI/ML-teknologier og dele kunnskap.

Det beste med kurset er at det ikke krever forkunnskaper. Men man bør være forberedt på å bruke litt ekstra tid på å utforske statistiske konsepter på egen hånd.

Selv om det ikke er obligatorisk, kan det være en fordel å ha en viss bakgrunn i statistikk, da forklaringene i kurset kanskje ikke er tilstrekkelige for alle. Kurset introduserer også maskinlæring gjennom TensorFlow, en ML-implementering utviklet av Google. På den måten markedsfører Google sine API-er, men med tanke på verdien av kurset er det ikke noe problem. TensorFlow er dessuten en av de enkleste måtene å starte med maskinlæring og er veldig populært.

Datavitenskap

Navnet Harvard skaper respekt, og det samme gjør dette kurset.

Dette er ikke et raskt innføringskurs hvor man så vidt berører maskinlæring. Det er en grundig opplæring som krever hardt arbeid og mye tid.

Kurset inkluderer gratis videoer, kode (på GitHub) og løsninger på praktiske oppgaver, slik at det i praksis ikke er noen begrensninger dersom man ønsker å ta det.

Hvem er målgruppen?

Alle som ønsker å lære! Det krever litt mattebakgrunn, selv om man ikke lenger er spesielt interessert i matematikk. Evnen til å trekke slutninger og bevis er det viktigste. Men vær advart: dette kurset vil utfordre deg. Oppgavene kan være vanskelige, men det kan være akkurat det du trenger.

Maskinlæring

Spør hvem Andrew Ng er i en gruppe dataforskere, og du vil få mye oppmerksomhet.

Andrew Ng har oppnådd en nesten legendarisk status innen data- og maskinlæring, takket være sitt fremragende kurs på Coursera – Maskinlæring.

Hvis du er usikker på Andrew Ngs troverdighet, bør dette overbevise deg:

Kurset er en del av Courseras betalingsplan, men økonomisk investering er ikke det eneste kravet. Det er et omfattende kurs hvor Andrew går dypt inn i matematikken bak maskinlæring og analyserer populære algoritmer. Men det er også et komplett kurs, og du blir guidet gjennom de vanskeligste delene.

Jeg anbefaler det sterkt, da det å ha fullført dette kurset er en prestasjon i seg selv!

Anvendt datavitenskap

Spesialiseringer på Coursera består av en serie kurs som tar sikte på å lære deg et bestemt konsept fra bunnen av. Hvis du leter etter et komplett, seriøst, men vennlig kurs om datavitenskap og maskinlæring med Python, anbefaler jeg denne spesialiseringen på det sterkeste.

Etter endt kurs får du et sertifikat.

DataCamp

DataCamp tilbyr en rekke datavitenskapskurs, inkludert flere ferdigheter og karriereveier. Fra datamanipulasjon til maskinlæring får du karrierefremmende ferdigheter i Python og R som vil hjelpe deg med å lykkes innen datavitenskap.

DataCamps innhold er lettfordøyelig, slik at du kan lære i ditt eget tempo. Kursene gir deg praktisk erfaring som vil forbedre dine ferdigheter innen datavitenskap.

Du kan starte med gratisversjonen for å vurdere kurset ved å se på det første kapittelet.

edX

Lær fra MITx, Harvardx, IBM, RICEx, UCSanDiegox og GTx på edX-plattformen.

Alle disse tilbyr omfattende læreplaner som vil gi deg de ferdighetene du trenger innen datavitenskap. Disse programmene er best egnet for de med bakgrunn innen statistikk eller informatikk.

Hvis du ikke er ute etter et komplett program, kan du velge enkeltkurs. På edX finner du mer enn 200 kurs relatert til datavitenskap, som dekker Python, R, Excel, sannsynlighet, statistikk, maskinlæring, datavisualisering og mye mer.

Kodeakademiet

Codecademy er en annen plattform som er et av de beste systemene for å lære koding. De fokuserer på «Learning by doing» og tilbyr mange øvelsesprosjekter og tester på plattformen deres.

De datavitenskapskurs som Codecademy tilbyr, inkluderer SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn og mange andre biblioteker.

Hele karriereveien inneholder 26 kurs som er mer enn nok til å hjelpe deg med å bli en dyktig dataforsker.

Dette datakurset:

  • Gir deg grundig kunnskap om datavitenskap.
  • Gir deg en oversiktlig plan du kan følge.
  • Forbereder deg på arbeidslivet ved å gi deg nok praktisk erfaring.

Udemy

Udemy trenger ingen introduksjon.

Python for datavitenskap og maskinlæring Bootcamp på Udemy er et populært kurs med over 85 000 vurderinger på 4,6 og har blitt gjennomført av over 370 000 studenter over hele verden.

Temaene som dekkes i dette kurset:

Kurset tilbyr følgende:

  • 25 timer med videoer
  • Full livstidstilgang
  • 13 artikler og fem nedlastbare ressurser
  • Tilgang på mobil og TV
  • Fullføringsbevis
  • 30 dagers pengene-tilbake-garanti

Dette kurset er et godt valg hvis du ser etter et budsjettvennlig alternativ.

Google AI

Er du interessert i å lære maskinlæring fra ekspertene hos Google?

Da bør du sjekke ut kursene på Google AI.

Denne plattformen tilbyr maskinlærings- og datavitenskapskurs for studenter, programvareutviklere, dataforskere og forskere. Kursene er gratis.

Til å begynne med bør Crash Course in Machine Learning på Google AI være førstevalget ditt. Det er et raskt kurs som gir en praktisk introduksjon ved bruk av TensorFlow API-er. Her er detaljene for kurset:

Plattformen tilbyr også spesifikke kurs om viktige maskinlæringsemner som gruppering, anbefalingssystemer, testing og feilsøking i maskinlæring, dataseparasjon og funksjonsteknikk innen maskinlæring. Hvis du allerede har grunnleggende kunnskaper om maskinlæring, kan disse kursene være svært verdifulle.

Udacity

Udacity er også en populær e-læringsplattform med mange kurs om populære teknologier. De tilbyr flere bransjeledende programmer utviklet og anerkjent av store selskaper som AT&T, AWS, Google og IBM.

Et av programmene på Udacity er for datavitenskap – Skolen for datavitenskap. Dette programmet hjelper deg å kvalifisere deg til jobber som dataanalytiker, dataforsker, dataingeniør og forretningsanalytiker. Kurset om Data Scientist dekker maskinlæring, dyp læring og programvareteknikk. Det er en fordel å ha grunnleggende kunnskap om maskinlæring for å ta dette kurset.

Hvis du kan Python-programmering, men er ny innen maskinlæring, finnes et annet program på Udacity – Skolen for AI. Dette programmet tilbyr kurs som starter med grunnleggende maskinlæring.

Dyp læring

Dette kurset er en fantastisk ressurs og min favorittanbefaling på denne listen hvis du er koder.

Jeg gjentar: hvis du er koder.

Dette er fordi kurset ikke bruker tid på å lære deg det grunnleggende om programmering. Kursbeskrivelsen er klar på dette punktet (vektlegging er original):

Vi forutsetter at alle som tar dette kurset har minst ett års erfaring med koding. Kurset bruker Python som undervisningsspråk, så hvis du ikke kan Python allerede, forventes det at du bruker tid på å lære det – for en erfaren koder bør Python være et relativt enkelt språk å lære.

Så hvis du allerede kan Python (hvis ikke, lær det her) eller kan lære det raskt, er dette det perfekte kurset for pragmatiske personer som ønsker å bygge fungerende systemer uten å bekymre seg for mye om den teoretiske bakgrunnen for algoritmene.

Det passer også for utålmodige personer (som meg!) som misliker formaliteter og rutine.

Og ja, det er 100 % gratis og har et flott fellesskap!

Oppsummering

Puh!

Dette var en vanskelig liste å sette sammen. Ikke fordi det var mangel på gode ressurser, men fordi det var altfor mange!

Maskinlæring er et felt som har eksplodert og som løser komplekse problemer på en elegant måte. Det finnes hundrevis av kurs på nettet, både gratis og betalte, og de fleste er veldig gode. Dette kan imidlertid være overveldende, og derfor har jeg prøvd å begrense listen til elleve ressurser som er relevante for ulike typer studenter og erfaringsnivåer.

Jeg håper det har vært til hjelp!