Prototyp - Transkribera och bearbeta text helt lokalt på din dator - v2.0
Micke Kring
·
Jag har ju under en längre tid byggt egna verktyg som underlättar min vardag. Innan AI så var det ofta automationer som kunde sköta delar av mitt arbete som inte var så… ska vi säga jättekul. Sedan Claude Code kom in i mitt liv för en 9 månader sedan har det här eskalerat.
Det egenbyggda verktyg som jag i särklass använder mest är “Transkribera”. Den går varm ett par gånger per dag i snitt.
Det är en app till MacOS som transkriberar möten och tankar helt lokalt och säkert på min dator. Dessutom använder den lokala språkmodeller för att sammanfatta transkriberingarna.
Dessutom… i det geopolitiska läge vi är i idag, känns det skönt att kunna hantera både data och AI på ett säkert sätt som inte lämnar min dator om jag inte själv vill det.
Det finns också möjlighet att lägga in en API-nyckel i appen till Berget AI, ett svenskt bolag som tillhandahåller öppna språkmodeller. Då kan man nyttja deras AI-modeller. Det blir då inte lokalt på din dator längre, men ingen data lämnar Sverige och dessutom kan du nyttja deras kraftfullare modeller.
För er som följt mig ett tag, så låter det säkert bekant. Det här är något jag utforskat, bland annat med mina kollegor Carl Heath och Björn Flintberg i olika former, i prototyperna Diane från tidigt 2023 och Ragnar lite senare.
Det som hänt de senaste åren är ju att vi fått riktigt vassa transkriberingsmodeller i form av KB Whisper (från Kungliga Biblioteket) samt mindre språkmodeller som kan köras på vanliga datorer.
KB Whisper-modellerna har jag dessutom konverterat till CoreML för att de ska kunna dra än mer nytta av datorns resurser.
De modellerna hittar du på https://huggingface.co/mickekringai/kb-whisper-coreml
I filmen går jag igenom hur appen fungerar, om några fler är sugna på att testa. Det går att transkribera genom att ladda en ljud/film-fil eller genom att spela in direkt i appen.
Testa appen?
Appen är inte släppt på AppStore då jag inte har tid att supporta en kostnadsfri app, men vill man, så kan man antingen ladda ned hela kodbasen från Github och bygga själv med Xcode. Eller bygga om den.
Appen är släppt som open source med MIT-licens. https://github.com/mickekring/Transcribe-MacOS-App
Där finns även en färdigpaketerad version av appen på https://github.com/mickekring/Transcribe-MacOS-App/blob/main/Transcribe_v2.0(1).zip
Den filen kan man ladda ned, packa upp och dra till “Appar”. Sen är det bara att köra.
OBS! Som vanligt när ni laddar ned saker från internet, se till att scanna för virus och liknande.
Om författaren
Micke Kring
Jag har alltid fascinerats av vad som händer när människa och teknik möts. Med nästan 30 års erfarenhet av utbildning och utveckling ägnar jag dagarna åt att utforska, prototypa och utbilda inom AI, med samma lekfulla nyfikenhet som när jag började.