Under veckan som gått har jag och Carl Heath publikt labbat lite med en prototyp till en form av röstinpelningsapp, som vi kallar Diane. Diane spelar in din röst, eller flera röster och skickar automatiskt detta till tjänsten Whisper för transkribering. Därefter väljer du en mall som instruerar hur GPT3 ska sammanfatta transkriberingen och slutligen så sparas ditt resultat i Obsidian.
Jag har inte hunnit att jobba vidare på denna prototyp, men många har velat testa Diane, så för er som har lite kunskaper i hur du kör python-kod på din dator finns kod och instruktioner på github.com/mickekring/Diane
Om du inte har kunskaper i hur du kör python-kod på din dator men ändå vill testa, så har jag en liten tutorial om hur du gör det (om du kör windows) här mickekring.se/sa-har-kor-du-ett-pythonscript-pa-din-windowsdator/
Värt att veta för att köra scriptet
- Du behöver en API-nyckel från OpenAI
- Du behöver ha Obsidian installerat obsidian.md
- Jag är ingen programmerare, så skäll inte på mig för dålig kod
- Bara testat på Mac. Men ChatGPT säger att koden funkar i Windows också. 🙂
Hur det funkar?
Här kan du se filmen om hur jag byggde appen och även se hur den fungerar.
Historik
Här kan du läsa mer om hur mitt och Carls labbande gick till mickekring.se/diane-en-prototypapp-for-rostanteckningar-bearbetat-av-en-massa-ai/
Frågor?
Som vanligt är det bara att höra av dig i valfritt medie 🙂
Hej! Cool grej! Visst är det så att när man använder Diane så skickas ens data över internet några gånger? Bara så jag inte missförstår något väldigt basic. Dvs om man hanterar forskningsdata, information från skyddade källor och personuppgifter så behöver man ha koll på vilka åtaganden man har där?
Hej Åsa!
Ja, det stämmer. Det här är en prototyp, så använd den inte till känsliga saker som berörs av GDPR / Schrems. Din ljudfil skickas både till Whisper och GPT som drivs av OpenAI. Whisper går att köra lokalt, så det skulle ett företag i Sverige sätta upp, men än så länge så saknar vi samma möjlighet med GPT. Men det kommer.
rimlig begränsning på en prototyp:) tack för snabbt svar!