Alla kommentarer om inställningar avser programmet BatSound

Hur spektrogram skapas

Ett spektrogram innehåller väldigt mycket information, men är egentligen en representation av ljudpulsen som saknar en hel del av den ursprungliga informationen i ljudupptagningen. Det går alltså inte att återskapa inspelningen från spektrogrammet.
Här syns den andra pulsen i spektrogrammet överst på flansfladdermussidan. Pulsen är riktigt kort och  energimaximum ligger ungefär vid 73 ms. Det syns också tydligt att pulsen startar ungefär vid 150 kHz. Där finns också en brantare puls som ser ut att ligga bakom den starka pulsen. Det är 1:a övertonen. Övertoner finns överallt. Det är dom som ger ens röst dess speciella karaktär. Och gör att man kan höra skillnad på om en ton kommer från en fiol, tvärflöjt eller oboe. Olika fladdermöss har olika starka övertoner i sina ljudpulser.
I spektrogrammet syns också lite av det eko som studsar tillbaka till fladdermusens öron.
Mer om det kommer längre ner.

MnatM00019zooom

Spektrogrammet ovan är skapat ur den information som finns i motsvarande oscillogram som ses här nedanför.
Oscillogrammet är en verklig bild av det som är inspelat genom mikrofonen. Här finns vartenda värde som lagrats på minneskortet i vår detektor.

M00019osc

Om man bara zoomar in tillräckligt mycket så ser man dessa värden som punkter.M00019osc730

Här är området kring 73 ms; det ställe där markören (det lodrätta strecket) är placerad i spektrogrammet. Detta ställe ligger ganska nära den plats där Emax ligger; svängningarna är som starkast här.
Men det är helt omöjligt att se vilka frekvenser som finns i signalen här. Jo, grundtonen kan man se: Det är ungefär 10 punkter i varje hel våg. Detektorn spelar in med en hastighet av 500 tusen ggr i sekunden, 500 kHz. Då blir frekvensen  50 kHz. Det stämmer bra med spektrogrammet. Men övertonen är inte lätt att hitta i oscillogrammet.

Högst upp i spektrogrammet finns texten ”Spectrogram, FFT size 512, Hanning window”. Detta talar om på vilket sätt spektrogrammet har skapats.

  • FFT betyder ”Fast Fourier Transform” och är en matematisk metod att beräkna vilka frekvenser som finns gömda i en signal.
  • size 512 betyder att 512 värden kring en viss tidpunkt har använts för att beräkna vilka frekvenser som finns vid denna tidpunkt
  • Hanning window talar om att en speciell viktning används när man beräknar frekvenser. Mindre inverkan får de värden som ligger i utkanten.

De frekvenser som beräknas för punkten 73 ms utgår i det här fallet från alla 512 värden mellan 72,5 ms och 73,5 ms. Och de som ligger i utkanten har alltså liten inverkan. Den här viktningen gör man för att i någon mening få ett ”sannare” spektrogram. Eftersom man vill ha reda på frekvenserna vid en viss tidpunkt (vilket egentligen är omöjligt) så får man ta till detta knep.
Bilden visar hur viktningen ser ut i ett ”Hanningfönster”

Varför ska man känna till detta?

Jo, genom att välja antalet sampel i Fouriertransformen, så kan man påverka vilka detaljer man får fram.
Väljer man ett litet tal (som här 512) får man ett spektrogram som är noggrant i tiden och mindre noggrant i frekvens.
Ett högre värde (t.ex. 2048) innebär en noggrann frekvensberäkning men pulsen blir utsmetad i tiden.

Det är också bra att hålla i minnet att ett spektrogram aldrig är en verklig bild av ljudpulsen; det är en approximation av verkligheten. Man kan också säga att snäckan i vårt inneröra fungerar som en fourieranalysator – när den får in ett ljud så delar den upp ljudet i dess komponenter, och små nervhår som sitter på olika ställen längs snäckans spiral signalerar upp till hjärnan vilka frekvenser som finns.

Om man skulle välja 2048 sampel i det här fallet, så får man detta spektrogram. MnatM00019z2048Samma skalor som i bilden högst upp. Fransfladdermusen är särskilt olämplig att presentera med ett så brett Hanningfönster. Bättre är att använda 1024 eller 512. En bra tips är att ställa in programmet BatSound på ”Automatic”.
Eftersom sonaren blir mer eller mindre utsmetad i tidled så är det alltid bättre att använda oscillogrammet för att mäta pulsens längd.

EnilM00148z2048b

2048 sampel

EnilM00148z1024b

1024 sampel

EnilM00148z512b

512 sampel



Vad innehåller spektrogrammet?

Ur spektrogrammet för en inspelning kan en mängd detaljer utläsas. Det kan vara bra att känna till vilka som är användbara vid artbestämning och vilka man får överse med.

  1. Direkta ljud
    1. Grundton
    2. Övertoner
    3. Intervall
  2. Reflexer
    1. Interferenser
    2. Ytreflexer
    3. Ekomoln – som fladdermusen själv har användning av
  3. Störningar
    1. Överstyrning
    2. Ljud från detektorn
    3. Oönskade ljud från omgivningen
    4. Artefakter från Fourier-transformeringen
  1. Direkta ljud från fladdermusens mun eller nos.

    1.  Grundton
      • Ljudstyrka. Man bör vara försiktig med att ge sig på svaga inspelningar, speciellt när det gäller släktet Myotis. Dels är det svårt att avgöra frekvensen hos Emax (se nedan) om inspelningen är för svag. Dels blir det problem att bestämma start- och slutfrekvens på ett säkert sätt. Nymffladdermusen kännetecknas t.ex. av att dess ljudpuls inte går under 40 kHz. Har man en svag inspelning av någon annan art, så kan det förstås se ut som om ljudpulsen slutar ovanför 40 kHz. En god regel är att när det gäller sådana arter, se till att utstyrningen på inspelningen är åtminstone 30-40 %. Här är en bra utstyrd inspelning av vattenfladdermus. Det är lätt att hitta Emax och därefter ta reda på vilken frekvens som är förhärskande där.
        551so
          • Emax, Peak frequency, FME (frequency of maximum energy), den frekvens i ljudpulsen som framträder starkast. Till denna frekvens är alltså ljudpulsens energi koncentrerad. Ibland går den inte att avläsa (t.ex. Myotis) men ofta kan den avläsas både med hörsel och ur spektrogrammet.
            Ett mycket användbart knep att bestämma Emax är att se efter vilken frekvens ekot har när det ebbar ut.
            Man kan också mäta det med funktionen ”Power Spectrum” i BatSound men man får då vara försiktig.
            Man bör leta upp Emax och därefter se efter vilken frekvens som finns på det stället. Se exemplet ovan.
            M01156hela1024M01156tmax256Man bör känna till att maxamplitud inte alltid ligger vid samma frekvens som toppen i ett FFT ”power spectrum”. Det beror på att FFT summerar energin över tiden för alla delar av frekvensskalan så att ett långt utdraget parti i ett svagt läte kan ge en hög topp medan en kortvarig stark del inte behöver avsätta sig i någon topp. Därför bör man ha oscillogram där man lägger markeringslinje över den punkt på ljudkurvan som svänger upp högst. Därefter går man ner och i sonogrammet och mäter var linjen skär genom pulsen. Att se på ekona ger en snabb ganska riktig bild av var denna maxamplitud ligger. Det finns dock några fallgropar som kan bero på överstyrning eller interferens, dvs den riktiga toppen är utsläckt av interferens mellan originalljudet och ett reflekterat som når mikrofonen med tidsförskjutning. Då kan ekona vara en hjälp.
          • Varaktighet, duration, pulsens längd. Ibland är man intresserad av pulsens varaktighet. Den är intressant om man t.ex. vill skilja den lilla och stor brunfladdermusen åt.NleiM00187twotxt Här är ett spektrogram och oscillogram med de båda arternas lokaliseringsljud när de flyger fritt, långt från växter och snår. En mätning i spektrogrammet är svår att göra; däremot kan man ofta se tydligt i oscillogrammet var pulsen börjar och slutar. Här visas bara en puls för varje art men man ska förstås kontrollera att dessa pulser är representativa för respektive inspelning.
            En funktion i BatSound som kan användas för att göra den mätningen enklare: Pulse Length Analysis. Inspelningar som ovanstående är svåra för den funktionen att hantera; det är för mycket ekon. Men har man mycket rena sonogram så kan det vara användbart.
          • Start- och slutfrekvens. Ofta mycket svårt att avgöra om man inte har ordentligt utstyrda inspelningar.MnatM00019
            I regel brukar fladdermusens slutfrekvens vara mer karakteristisk än startfrekvensen eftersom många arter kan höja tonläget vid intensiv jakt. Här är ett fall då slutfrekvensen kan konstateras någonstans vid 15 kHz. Detta är typiskt för fransfladdermusens lågfrekvanta sonar. I Sverige känner vi ingen Myotis-art som går så långt ner i frekvens.
    2. Övertoner.

      Alla lokaliseringsljud från fladdermöss innehåller övertoner. Men de kan vara starka eller svaga. Det är ju

      PaurM00159zövertonerna som ger ljudet dess karaktär. En fladdermus som är känd för sina övertoner är det tystlåtna långörat. Hos andra fladdermöss kan man ofta se en svag kopia av den starkaste delen av ljudpulsen. Men övertonerna behöver inte vara rena kopior av grundtonen; vissa delar av grundtonen kan ha mer övertoner än andra.
      Man får inte glömma att alla fladdermöss producerar övertoner. När de dyker upp, beror det ofta på att fladdermusen kommit nära och man har en bra inspelning.EnilM00020zoom

    3. Intervall mellan pulser.

      intervallAvstånden mellan ljudpulserna kan vara en viktig parameter när det gäller artbestämning.
      Här visas intervallstatistik för några av de stora arterna. Observera att det gäller fritt flygande individer. Om man t.ex. upptäcker att de man tror är nordfladdermöss mycket ofta ger ifrån sig runt sju pulser i sekunden, så bör man nog titta närmare på fladdermössen. Det kan röra sig om sydfladdermöss.
      I BatSound finns en funktion, Pulse Interval Analysis, som kan ge fina stapeldiagram med statistik över intervallens längd om man har klara och fina inspelningar.

      Avståndet mellan ljudpulserna varierar från art till art och även inom arter beroende på vad fladdermusen har för sig. En stilla förflyttning kan ha långt avstånd mellan pulserna. Vissa fladdermöss har en oregelbunden rytm och vissa har en mycket jämn rytm. Den gråskimliga fladdermusens rytm är t.ex. mycket jämn och regelbunden. Man bör se till att man har tillräckligt långa inspelningar för att se detta, gärna 4 s. Man ser ibland komprimerade spektrogram där pauserna mellan ljudpulserna är borttagna. Då får man plats med många pulser men viktig information döljs, såsom pulsernas rytm och intervall. Det är viktigt vad som händer mellan pulserna!

  2. Olika typer av reflexer

    1. Reflexer som interfererar (näraliggande ytor)

      Från en fladdermus som flyger nära en jämn yta kan man ofta få märkliga inspelningar.
      MdauM00588spekMdauM00588osc
      Här är spektrogrammet och oscillogrammet för en enskild ljudpuls som den uppfattas av mikrofonen. Det här mönstret uppkommer när det reflekterade ljudet (från vattenytan i det här fallet) och det direkta ljudet växelvis utsläcker och förstärker varandra. Vid de frekvenser där signalen saknas har den reflekterande ljudvågen kommit i ofas med den direkta. Man kan lista ut ur spektrogrammet att vid 50 kHz har den reflekerade vågen fått färdas 8-10 våglängder längre dvs ungefär 6 cm längre. Om man vet avståndet till fladdermusen och mikrofonens höjd över vattnet, skulle man kunna räkna ut hur högt över ytan fladdermusen flyger. Inspelningar av den här typen får man ofta från vattenfladdermöss, men vilken annan fladdermus som helst kan ge upphov till liknande spektrogram. I det här fallet finns det fler egenskaper hos sonogrammet som pekar på vattenfladdermus.

    2. Reflexer från ytor (avlägsna ytor)

      Ibland händer det att man får en kopia av ljudpulsen strax efter den första. Det kan se ut som om två individer har ropat ut sina ljud snabbt efter varandra, eller att samma individ skickat ut två ljud i tät följd.
      REC00004zMen om pulserna är bara några ms (under 10) ifrån varandra så beror detta på en ytreflex. Det här beror ofta på att man placerat mikrofonen på ett sätt så att ljudet kan studsa riktigt bra. Den här inspelningen gjordes på en balkong med tegelväggar på tre sidor. Här är tidsavståndet mellan pulserna ungefär 7 ms vilket betyder över 2 meter. Ljudet kan alltså ha studsat mot en vägg minst en meter bort och tillbaka till mikrofonen. Det stämmer rätt bra med hur det såg ut på balkongen. Detta påverkar inte en framgångsrik artbestämning men man ska komma ihåg vad det beror på. Vanliga fladdermussonarer kommer aldrig så tätt som var tionde millisekund, däremot hittar man i fångstsurret typiska intervall på 6 ms.

    3. Ekomoln: reflexer från terräng, vegetation och byte

      De här reflexerna syns som ett lite suddigt moln efter ljudpulsen.
      Detta ekomoln kan man utläsa mycket ur och det är ju detta som hos fladdermusen skapar en upplevelse av omgivningen.

        • Om molnet hänger ihop med pulsen betyder det att det finns föremål mycket nära fladdermusen som reflekterar ljudet. Exemplet här med en nordfladdermus säger att den flyger nära växtligheten och att det även finns växtlighet längre bort som ger ett långt utdraget ekomoln. De allra svagaste ekona som fångas upp på den här bilden har färdats ett 20-tal meter längre.
          EnilM00148z
        • Om det är ett mellanrum mellan pulsen och dess eko så betyder det att det inte finns någonting i fladdermusens omedelbara närhet som kan reflektera ljudet. Det här exemplet är hämtat från spektrogrammet med pipistrellen som troligen är en dvärgpipistrell. Det första ekot dyker upp efter 10 ms; det innebär att det ljudet har färdats 3,4 m längre än huvudpulsen. Den flyger alltså fritt och långt från växtligheten. När en fladdermus på detta sätt flyger relativt fritt, tenderar Emax att ligga nära fladdermusens lägsta frekvens. När det gäller just detta exempel så kan det tyda på att pulsen kommer från en dvärgpipistrell.
          M00146zoom
        • Ekomolnets läge på frekvensskalan ger också ett bra grepp om var energimaximum ligger. De ”raka” strecken i det här spektrogrammet (en myotis-art) ger inte så mycket information. Men däremot ser man att molnet är som tjockast eller längst vid ungefär 40 kHz. Om man zoomar in så går det ofta att se Emax i spektrogrammet men detta är ett snabbt och behändigt sätt att få ett begrepp om var Emax ligger.

          MdauM01527a
  3. Störningar

    1. Ljud från detektorn

      REC23a

      En detektor med egen högtalare eller grannens detektor kan ofta störa ljudupptagningen så man får ett missljud för varje puls. Ofta är det då ljudet från en heterodyndetektor som man får en tidsexpanderad version av längst ner i sonogrammet. Här är exempel på hur trollpipistrellens sonogram kan låta och se ut. Pulserna blir ofta förstörda eftersom störningens övertoner blandas in i ljudpulsen.

    2. Oönskade ljud från omgivningen

      M00252a

      Det bästa sättet att få bra inspelningar är att låta detektorn sitta ifred och t.ex. inte gå omkring med den. Det kan förstås ibland vara ofrånkomligt, men man får vara beredd på att ljud mycket lätt tas upp och stör inspelningarna.
      Man får heller inte glömma att fladdermössen inte är de enda djur som producerar ultraljud.

      M00849a

      Här är en gräshoppa av okänd art från augusti 2015. Fladdermusens sonarer drunknar lätt i detta. Alldeles
      i slutet hörs faktiskt en nordfladdermus svagt!

      Regn och blåst kan också störa inspelningarna. Man kan då få en massa automatiska inspelningar kontinuerligt under den tid detektorn är igång. Bild?

    3. Överstyrning

      När man spelar in fladdermusljud så vill man gärna att fladdermusen kommer tillräckligt nära så man får en ordentligt stark signal. Men om den kommer för nära och skriker in i mikrofonen får man så kallad överstyrning. Ljudets svängningar blir för stora för att kunna tas om hand rätt av mikrofon eller förstärkare i detektorn. Här är ett exempel på en stor brunfladdermus som kommit lite för nära. I oscillogrammet syns tydligt hur svängningarna går i taket. Och spektrogrammet blir nedskräpat med störningar.M00022ztwo

    4. Störningar p.g.a. Fouriertransformeringen

      När en signal startar eller slutar abrupt (eller allmänt har tvära hopp i amplituden) så kommer det momentant att ske en breddning av spektrat just där. Detta syns som ett vertikalt ”streck” i spektrogrammet. Det har alltså ingen motsvarighet i verkligheten. Här är en ljudupptagning av en fritt flygande trollpipistrell.
      M00133z

      Här är starten på en ljudpuls från en stor brunfladdermus. Överst är oscillogrammet som innehåller den ursprungliga inspelningen. Hela det visade området är bara 2 ms så ljudstyrkan går från noll till nästan 50 %-ig utstyrning på en ms. Ett typiskt fall där man får denna effekt. Detta illustrerar också det faktum att det som syns i spektrogrammet inte alltid är det man kan höra. Omvänt så kan man höra detaljer som inte syns i spektrogrammet.

      M00151z
      Man får förstås vara uppmärksam på om dessa ”svansar” är äkta eller uppkomna ur signalbehandlingen.