Forstå språket i ukjente tekster med språkidentifikatorer
Har du noen gang kommet over en tekst hvor du ikke kunne gjenkjenne språket? Selv om du ikke er flerspråklig, kan det være nyttig å ha litt kunnskap om lingvistikk.
Hva er en språkidentifikator?
En språkidentifikator er et verktøy som hjelper deg med å fastslå hvilket språk som brukes i en gitt tekst. Disse verktøyene er svært nyttige for å identifisere tekster på ukjente språk. Noen verktøy kan til og med identifisere flere språk i et enkelt dokument.
Språkidentifikatorer er tilgjengelige som mobilapper, programvare for datamaskiner og nettbaserte verktøy.
Hvordan bruker man et språkidentifikasjonsverktøy?
Det er ganske enkelt å bruke disse verktøyene. De fleste har et brukervennlig grensesnitt. Du skriver inn teksten din, og verktøyet sammenligner den med språkeksempler i databasen. Alle språkidentifikatorer er basert på en algoritme som gjør dem i stand til å oppdage språket.
Noen av disse verktøyene kan også identifisere språket i talte tekster eller bilder. Du kan laste opp bilder eller lydfiler, og de vil ta seg av selve identifiseringen.
La oss se nærmere på noen gode språkidentifikasjonsverktøy du kan bruke.
Translated Labs
Translated Labs er et automatisk, nettbasert språkidentifikasjonsverktøy. Det har en stor tekstboks der du kan skrive inn teksten. Verktøyet identifiserer språket i teksten i løpet av få sekunder.
Med dette verktøyet kan du enkelt finne ut hvilket språk en tekst er skrevet på, selv om du ikke kjenner språket. Translate Labs er ikke bare en tekstspråkidentifikator; den kan også identifisere talespråk. Verktøyet kan altså hjelpe deg med å finne språket i en talt tekst.
Language Identifier-app
Hvis du er på utkikk etter en språkidentifikator-app, kan Language Identifier være et godt alternativ. Du skriver bare inn teksten i det angitte feltet i appen, og den vil identifisere språket. Appen bruker en sannsynlighetsmodell for å finne det naturlige språket i teksten.
Den kan identifisere flere språk enn de fleste apper. For tvetydige tekster viser den også sikkerhetspoeng. Denne applikasjonen fungerer også offline. Foreløpig fungerer appen bare for tekst, og kan ikke transkribere bilder eller tale.
Her er noen av språkene appen kan identifisere. Det er mange flere språk enn de som er listet opp nedenfor:
- Afrikaans
- Kinesisk
- Dansk
- Nederlandsk
- Engelsk
- Hindi
- Indonesisk
- Irsk
- Italiensk
- Japansk
- Maltesisk
- Mongolsk
- Nepalesisk
- Persisk
- Polsk
- Portugisisk
- Punjabi
- Russisk
- Sindhi
- Svensk
- Tadsjikisk
- Tamil
- Telugu
- Thai
- Tyrkisk
- Urdu
Lexicool
Lexicool er et annet nettbasert språkidentifikasjonsverktøy som hjelper deg med å identifisere språket i en tekst. Resultatets pålitelighet henger sammen med lengden på teksten du skriver inn. Jo lengre teksten er, desto mer pålitelige blir resultatene. Du trenger bare å lime inn teksten i inndataboksen.
Verktøyet bruker alfabetene, symbolene og uttrykkene som brukes i teksten for å identifisere språket. Hvis den inntastede teksten ligner på flere språk, kan verktøyet foreslå opptil tre mulige språk.
Tomedes
Tomedes er en språkidentifikator som fungerer online. Du legger inn teksten i tekstboksen, og verktøyet genererer resultatet. Det viser umiddelbart hvilket språk det finner for den innlagte teksten. Verktøyet kan oppdage flere språk hvis det brukes på en samling tekster.
Språkene den kan identifisere inkluderer:
- Arabisk
- Kinesisk
- Nederlandsk
- Fransk
- Tysk
- Italiensk
- Japansk
- Koreansk
- Polsk
- Portugisisk
- Russisk
- Tyrkisk
- Spansk
- Vietnamesisk og mange flere
Cortical.io
Cortical.io er et effektivt online verktøy for språkidentifikasjon som kan identifisere og gjenkjenne over 50 språk. Du kan enten skrive inn teksten eller URL-en til nettsiden du vil analysere.
Hvis teksten er på kinesisk, arabisk, dansk, engelsk, tysk, fransk, spansk eller russisk, vil verktøyet kode teksten numerisk. Resultatet vises som et semantisk fingeravtrykk, presentert som et rutenett grafisk.
CalConT
CalConT er et tekstanalysator- og språkidentifikatorverktøy som bruker algoritmer for naturlig språkbehandling. Basert på disse algoritmene identifiserer den språket i teksten du skriver inn.
Du trenger bare å skrive inn teksten i det angitte feltet, og verktøyet vil umiddelbart vise språket i boksen «Oppdaget språk». Det lar deg også konvertere tekst fra et ukjent språk til engelsk.
Konklusjon
Hvis du trenger hjelp til å identifisere språket i en tekst, kan du prøve et av disse verktøyene. De er raske og gir resultater på få sekunder.
Det kan også være lurt å sjekke ut de beste lydbokappene for Android og iPhone.
Likte du å lese denne artikkelen? Del den gjerne med andre!