WEBVTT

1
00:00:00.000 --> 00:00:04.892
Det här är alltså appen Transkribera
där du lokalt och säkert på din

2
00:00:04.892 --> 00:00:10.000
dator kan transkribera och bearbeta
text med hjälp av lokala modeller.

3
00:00:10.000 --> 00:00:13.122
Det första jag tänker göra
är att visa att man bara

4
00:00:13.122 --> 00:00:16.000
kan dra och släppa en
ljudfil direkt på appen.

5
00:00:16.000 --> 00:00:19.000
Så kör transkriberingen igång.

6
00:00:19.000 --> 00:00:22.000
Vad är det den då transkriberar med?

7
00:00:22.000 --> 00:00:26.000
Jo, den använder en modell som
heter KB Whisper i det här fallet.

8
00:00:26.000 --> 00:00:28.000
Det ser ni längst upp till höger här.

9
00:00:28.000 --> 00:00:30.000
Här kan man alltså välja olika typer
av modeller

10
00:00:30.000 --> 00:00:34.000
och nu kör jag en som
heter KB Whisper Small.

11
00:00:34.000 --> 00:00:36.000
Och KB står för Kungliga Biblioteket.

12
00:00:36.000 --> 00:00:39.000
Så Kungliga Biblioteket
har då alltså fintränat

13
00:00:39.000 --> 00:00:42.000
eller finjusterat en
redan existerande modell

14
00:00:42.000 --> 00:00:47.000
och gjort den ännu bättre med
50 000 extra timmar svenskt tal.

15
00:00:47.000 --> 00:00:50.000
Första gången man klickar på en sådan
här modell som inte är nedladdad,

16
00:00:50.000 --> 00:00:53.000
och även första gången du startar
appen så kommer den att ladda ner.

17
00:00:53.000 --> 00:00:57.000
Och det tar allting ifrån 5
minuter upp till 15 minuter.

18
00:00:57.000 --> 00:01:00.000
Men om man klickar här så kommer ni se

19
00:01:00.000 --> 00:01:02.000
Hur det börjar snurra här uppe.

20
00:01:02.000 --> 00:01:07.000
Så när det har slutat snurra och
själva datorsymbolen syns här igen.

21
00:01:07.000 --> 00:01:09.000
Så är det bara att köra.

22
00:01:09.000 --> 00:01:13.000
Man kan också titta hur långt
den har kommit i sin nedladdning.

23
00:01:13.000 --> 00:01:16.000
Men annars är det bara
att vänta och ta en kaffe.

24
00:01:16.000 --> 00:01:19.000
Vi kan också välja hur vi
vill visa vår transkribering.

25
00:01:19.000 --> 00:01:23.000
Antingen då som segment
eller i ett enda sjok här.

26
00:01:23.000 --> 00:01:26.000
Och givetvis så kan vi
spara vår transkribering.

27
00:01:26.000 --> 00:01:28.000
Ni ser att det står transkribering.

28
00:01:28.000 --> 00:01:30.000
Och spara den som en textfil
eller som en markdown-fil.

29
00:01:30.000 --> 00:01:33.000
Vi kan också välja att kopiera texten.

30
00:01:33.000 --> 00:01:36.000
Och då kan vi egentligen öppna vilken
app som helst och bara klistra in den.

31
00:01:36.000 --> 00:01:39.000
Sen har vi givetvis
textstorlek och liknande.

32
00:01:39.000 --> 00:01:42.000
Och om vi skulle ha stött på något
problem så kan vi klicka här

33
00:01:42.000 --> 00:01:45.000
så kommer den att transkribera igen.

34
00:01:45.000 --> 00:01:49.000
Om vi nu har lokala språkmodeller
installerade på vår dator

35
00:01:49.000 --> 00:01:51.000
genom programvaran Ollama

36
00:01:51.000 --> 00:01:55.000
så kan vi också då välja att
bearbeta den här transkriberingen.

37
00:01:55.000 --> 00:01:57.000
Så att vi klickar på prompt här.

38
00:01:57.000 --> 00:02:00.000
Då kan vi välja en av de här tre.

39
00:02:00.000 --> 00:02:03.000
Som redan finns när man installerar appen.

40
00:02:03.000 --> 00:02:07.000
De här kan man redigera och man kan
lägga till helt egna prompter också.

41
00:02:07.000 --> 00:02:09.000
Sen har vi valt sammanfattning.

42
00:02:09.000 --> 00:02:11.000
Vill man lägga till mer
information till den

43
00:02:11.000 --> 00:02:13.000
här prompten så kan
man också göra det här.

44
00:02:13.000 --> 00:02:18.000
Så jag kan till exempel skriva
att Micke från RISE pratar.

45
00:02:18.000 --> 00:02:21.000
Och trycka på spara.

46
00:02:21.000 --> 00:02:23.000
Och sen då kan jag välja språkmodell här.

47
00:02:23.000 --> 00:02:25.000
Och nu står det Olama här.

48
00:02:25.000 --> 00:02:29.000
Och jag har de här modellerna
installerade lokalt på min dator.

49
00:02:29.000 --> 00:02:30.000
Så jag tänker att jag använder egna.

50
00:02:30.000 --> 00:02:33.000
Gemma 3, 27B.

51
00:02:33.000 --> 00:02:36.000
Vilket är en bra modell ifrån Google.

52
00:02:36.000 --> 00:02:39.000
Och den körs då som sagt var
helt lokalt på min dator.

53
00:02:39.000 --> 00:02:42.000
Har man en API-nyckel till Berget,

54
00:02:42.000 --> 00:02:47.000
och Berget är ju då också ett företag
som kör språkmodeller i Sverige.

55
00:02:49.000 --> 00:02:52.000
Är vi klar så klickar vi på bearbeta.

56
00:02:52.000 --> 00:02:54.000
Och nu ser ni hur fönstret delas upp

57
00:02:54.000 --> 00:02:56.000
så vi ser våran transkribering här.

58
00:02:56.000 --> 00:03:00.000
Och nu börjar då den här
sammanfattningen skapas.

59
00:03:00.000 --> 00:03:03.000
Och då ser ni här hur den
fick med Micke från RISE

60
00:03:03.000 --> 00:03:05.000
beskriver två centrala utmaningar.

61
00:03:05.000 --> 00:03:09.000
Vilket var det jag då lade till
i lite extra information här.

62
00:03:09.000 --> 00:03:12.000
Så här är våran bearbetade text.

63
00:03:12.000 --> 00:03:16.000
Och vill jag nu spara det här så ser
ni att det dykt upp bearbetad text.

64
00:03:16.000 --> 00:03:20.000
Som jag kan då spara som en
textfil eller som markdown-fil.

65
00:03:20.000 --> 00:03:22.000
Vi går tillbaka.

66
00:03:22.000 --> 00:03:25.000
Och då väljer jag gå
tillbaka utan att spara.

67
00:03:25.000 --> 00:03:28.000
Tittar vi längst upp till höger
så har vi våra inställningar.

68
00:03:28.000 --> 00:03:30.000
Och vi har också

69
00:03:30.000 --> 00:03:34.000
att man kan switcha mellan
light mode och dark mode.

70
00:03:34.000 --> 00:03:38.000
Så att man kan välja det man tycker
är bekvämast själv för sitt öga.

71
00:03:38.000 --> 00:03:42.000
Tittar vi på inställningar här
så kan vi gå upp till allmänt.

72
00:03:42.000 --> 00:03:46.000
Så kan vi välja om vi vill ha
appen på engelska eller svenska.

73
00:03:46.000 --> 00:03:49.000
Vi har API-nycklar.

74
00:03:49.000 --> 00:03:53.000
Och då handlar det om man då
har en API-nyckel till Berget.

75
00:03:53.000 --> 00:03:56.351
Så kan man då spara den
här och då kan man då

76
00:03:56.351 --> 00:04:00.000
skicka sin ljud och text
till deras AI-modeller.

77
00:04:00.000 --> 00:04:04.000
Och om man då har Ollama
installerat på sin dator

78
00:04:04.000 --> 00:04:07.000
så ser man de modeller
som man har till hands

79
00:04:07.000 --> 00:04:10.000
som är helt lokalt på sin egen dator.

80
00:04:10.000 --> 00:04:12.343
Tittar vi på nedladdade
modeller så ser vi de

81
00:04:12.343 --> 00:04:15.000
modellerna som vi faktiskt
har installerat lokalt.

82
00:04:15.000 --> 00:04:18.000
Och här kan vi också
välja att ta bort dem.

83
00:04:18.000 --> 00:04:21.909
Och om vi då har lagt
in licensstycken till

84
00:04:21.909 --> 00:04:26.000
Berget så ser vi vad
vi har för molnmodeller.

85
00:04:26.000 --> 00:04:30.000
Just när det gäller transkribering och
då har vi KB Whisper Large här på Berget.

86
00:04:30.000 --> 00:04:33.000
Samma saker då med språkmodeller.

87
00:04:33.000 --> 00:04:35.000
Det här är då från Ollama.

88
00:04:35.000 --> 00:04:38.000
Och de här modellerna finns från Berget.

89
00:04:38.000 --> 00:04:41.000
Och sen längst ner så har vi då prompter.

90
00:04:41.000 --> 00:04:45.000
Det vill säga att vi kan välja då
att sammanfatta text på olika sätt.

91
00:04:45.000 --> 00:04:49.000
Och antingen då kan man
redigera de här som redan finns.

92
00:04:49.000 --> 00:04:52.000
Eller så kan man välja att
lägga till en prompt till.

93
00:04:52.000 --> 00:04:54.000
Så att vi skapar testprompten.

94
00:04:54.000 --> 00:04:58.000
Och sen så kan man då skriva sin
prompt där och trycka på spara.

95
00:04:58.000 --> 00:05:00.000
Och nu finns den

96
00:05:00.000 --> 00:05:02.000
tillgänglig i appen.

97
00:05:02.000 --> 00:05:06.000
En annan sak man kan göra det är
också att klicka på ny inspelning.

98
00:05:06.000 --> 00:05:08.000
Och sen så kan man då
välja sin ljudingång.

99
00:05:08.000 --> 00:05:11.000
Jag använder då Macbook Pro mikrofonen.

100
00:05:11.000 --> 00:05:14.000
Och sen är det egentligen
bara att trycka på spela in.

101
00:05:14.000 --> 00:05:18.000
Hej hej, jag heter Micke,
hoppas allting är bra, hejdå.

102
00:05:18.000 --> 00:05:22.000
Och så trycker vi på stopp
och klickar på transkribera.

103
00:05:22.000 --> 00:05:25.756
Och första gången när man
har laddat ner en ny sån här

104
00:05:25.756 --> 00:05:30.000
Whisper-modell till sin dator
så tar det ett par minuter för appen

105
00:05:30.000 --> 00:05:34.000
när den håller på att förbereda
sig för att kunna användas.

106
00:05:34.000 --> 00:05:40.000
Så bli inte orolig utan ta en kopp kaffe eller läs mail eller gör någonting emellan.

107
00:05:42.000 --> 00:05:46.000
Och där fick vi fram texten
som jag precis pratade in.

108
00:05:46.000 --> 00:05:50.000
Om ni har några frågor så är det
som vanligt bara att höra av sig.

109
00:05:50.000 --> 00:05:52.000
Ha det så gött!
