3D-LYD

3D-lyd i lokaler for scenekunst

Publisert

4 år siden

den

22. januar 2020

Per Mork

De siste årene har 3D-lyd, eller «immersive sound», blitt møtt med stor interesse innen kinobransjen, virtuell virkelighet og scenekunst.

TEKST: LEEVI TORATTI, ARTIFON AB. OVERSATT AV KATRINE WANG SVENDSEN

Begrepet «immersive sound» refererer til teknikker som håndterer tredimensjonale lydbilder. Det kan handle om innspilling av lydmiljøet i omgivelser, avspilling av virtuelle lydmiljøer via hodetelefoner, eller å skape et virituelt lydfelt med en gruppe høyttalere. Et kjent eksempel er Dolby Atmos, som nå rundt 40 norske kinoer har installert. Her er det 64 høyttalere – eller flere – i bruk. Det som alle disse teknikkene har felles er at lydbildet håndteres som ett komplett omsluttende lydfelt istedenfor høyttalerbundne lydstrømmer.
En komplett omgivelseslyd med bruk av disse teknikkene har vært en naturlig del innen den økende interessen for 3D-opplevelser, da disse krever at lydbildet spiller sammen med det visuelle inntrykket. Innen scenekunst gir «immersive sound» blant annet muligheten til å plassere virtuelle lydkanaler fritt i rommet og skape atmosfærisk lyd som omgir tilskuerne, uten at lydbildet blir utydelig og ulike lydkilder maskerer hverandre. Teknikken for denne type lyd gir også muligheten for vokalforsterkning der lyden følger talerens posisjon på scenen, som bidrar til en forbedret oppfattelse av tale, dialog eller sang.
3D-lydbildet kan enten skapes gjennom et par hodetelefoner eller en gruppe høyttalere. Ved avspilling via hodetelefoner er det viktig at man simulerer menneskekroppens, og fremfor alt hodet og ørenes påvirkning av lydfeltet for en realistisk opplevelse av lyden. Dette kalles for binaural lyd. Når såkalt «romlig lyd» derimot skapes via en gruppe høyttalere behøver man ikke simulere hodets påvirkning, men derimot er det viktig at lydbildet gjenskapes korrekt i en tilstrekkelig stor sone. Formålet er å unngå en såkalt «sweet spot» og få posisjonering av lydkilder og atmosfærisk lyd til å fungere for samtlige sitteplasser.
Objektbaserte lydteknikker håndterer lydstrømmer som virtuelle lydkilder, eller lydobjekter, som har en tildelt posisjon i rommet. Når en komplett objektbasert lydscene, med samtlige lydobjekter er spesifisert, behandles signalene i en prosessor slik at utgangssignalene til hodetelefonene eller en høyttalergruppe skaper det tiltenkte lydbildet. Istedenfor vanlig kanalbasert lyd, der man håndterer lydstrømmer for individuelle høyttalere i en spesifikk høyttaler-layout (for eksempel 5.1 og 7.1 surround), er en objektbasert lydscene eller -miks ikke bundet til et visst lydsystem, men kan brukes fleksibelt og i ulike høyttalerlayouter, samt med hodetelefoner.
Her gis en oversikt over ulike metoder for «immersive sound»
Objektbasert lyd
Etter oppfinnelsen av stereo har lydsystemer utviklet seg mot større og mer avanserte surroundsystem der fokuset har vært på å skape realistiske og omsluttende lydopplevelser. Denne utviklingen har resultert i et behov for lydsystemer med et stort antall høyttalere for å få det detaljerte omsluttende lydbildet. Tradisjonelt har disse systemene vært kanalbaserte, hvor lydteknikeren kontrollerer hvert eneste høyttalersignal og skaper en lydmiks for å skape et lydbilde i lytteposisjonen for et bestemt høyttaleroppsett. For system med et stort antall høyttalere (i noen tilfeller flere hundre) er en kanalbasert metode ikke lenger håndterbar. Det ville krevd manuell lagring og håndtering av et enormt antall spesifikke lydkanaler. Et annet problem er at store høyttaleroppsett ikke er standardisert, noe som gjør at lydteknikeren må skape en spesifikk miks for hvert høyt-
talersystem, en stor jobb når også antallet høyttalere er stort.
For å effektivt kunne bruke store surroundsystemer har metoden for objektasert lyd blitt hentet frem der lyddesigneren jobber med lydobjektet i stedet for høyttalerkanaler. Disse lydobjektene består av en lydstrøm, sammen med informasjon om lydobjektets posisjon i rommet og lydstyrke. Selve lydstrømmen kan for eksempel være et monosignal fra miksutgangen. Med lydobjekter i sine tildelte posisjoner kan en lydprosessor automatisk regne ut utgangssignalene i sanntid til hver enkelt høyttaler for å skape det ønskede lydbildet. Lydteknikerens jobb med objektbasert lyd er således ikke å kontrollere individuelle høyttalersignaler, men å
produsere et «kart» med lydobjekter plassert i rommet (se figur 1). Kartet kan inneholde både statiske og bevegelige lydobjekter. Utover lydobjekt kan lydscenen bestå av andre typer lyd som atmosfærisk lyd som ikke har en posisjon, men som omgir lytteren fra flere retninger.
Objektbasert lyd gjør det enklere å håndtere lydbildet i to eller tre dimensjoner, og passer spesielt bra for «romlig lyd» (spatial sound) som oftest krever et stort antall høyttalere. Objektbasert lyd er nemlig ikke bundet til et bestemt høyttaleroppsett, men kan brukes fleksibelt til både store og små oppsett med ulike plasseringer og antall høyttalere. Den øvre grensen for antallet høyttalere avgjøres av hva lydprosessoren klarer å håndtere, men kompleksiteten til høyttaleroppsettet påvirker ikke lydteknikerens jobb.

Figur 1: Kart hvor lydobjektene er plassert i forskjellige posisjoner i et horisontalt plan rundt mottakeren i midten. Høyttalerne er plassert i en sirkel rundt mottakeren. Bildet er et skjermbilde fra den gratis programvaren SoundScape Renderer.

Teknikker for «romlig lyd»
Ulike teknikker for avspilling av romlig lyd har utviklet seg med fokus på å skape en korrekt representasjon av et lydfelt over en tilstrekkelig stor overflate, men med et begrenset antall høyttalere. For lydavspilling i sanntid kreves også at algoritmene er enkle nok til at en lydprosessor kan behandle signalene med minimal forsinkelse.
Teknikker for romlig lyd kan deles inn i fire ulike metoder:
Teknologi som bruker HAAS-effekten
Panorering
Ambisonics
Bølgefeltssyntese Wave Field
Synthesis (WFS)
Teknikker som utnytter HAAS-effekten
HAAS-effekten (også kalt loven om den første bølgefronten) er et psykoaukustisk fenomen som innebærer at lokaliseringen av lyder hos mennesker styres av lyden som når oss først. Hvis man for eksempel befinner seg i et klangfullt rom der lyden reflekteres mellom flatene, hjelper HAAS-effekten oss å lokalisere lydkilden, selv om vår hørsel utsettes for en mengde reflekser fra flere retninger.
Ved lydgjengivelse og spesielt taleforsterkning kan HAAS-effekten brukes til å manipulere opplevd retning av lyd. Denne teknikken kalles til og med for kildeorientert forsterkning (Source-Oriented Reinforcement, SOR). Ved å forsinke lyden mellom ca.
10-30 ms etter direktelyden, kan den forsinkede lyden forsterkes opp til 10 dB uten å endre lokaliseringen. Med andre ord kan lokaliseringen av lyd aktiveres med en første lydfront og deretter kan denne forsterkes med forsinket lyd fra andre retninger. For eksempel kan stemmen fra en skuespiller på scenen forsterkes med forsinket lyd fra høyttalerne i rommet, uten å påvirke opplevd retning. I tilfelle skuespillerens stemme er svak, kan denne forsterkes med høyttalere plassert ved scenekanten for å aktivere opplevd retning hos publikum og deretter kan stemmen forsterkes forsinket fra høyttalere i andre posisjoner.
Det som er viktig å vurdere i et lydanlegg som benytter HAAS-effekten, er at høyttalerne skal dekke veldefinerte områder eller soner i publikum der avstanden fra høyttaleren til publikum i en sone er relativt jevn. Dette er en forutsetning for å kunne kontrollere forsinkelsestidene for lyden til forskjellige deler av publikum. Se figur 2 for eksempler på lydgjengivelse i en teatersal.

Figur 2: Den første lyden som aktiverer lokaliseringen kommer fra skuespilleren på scenen. Om den naturlige lyden er svak kan denne forsterkes med høytalere 1 for aktivering av lokalisering hos publikum. Etter dette forsterkes lyden forsinket fra høytalerne 2,3 og 4. Disse høyttalerene dekker avgrensede deler av publikum slik at Lmax-Lmin <7 m (20ms skille i forsinkelsestiden). Om høytalerenes dekningsområde er for stort, blir forsinkelsen av lyden til ytterste sitteplass for lang.

Panorering
Prinsippene for panoreringsbaserte metoder ligger i stereofoni der det skapes et fantombilde mellom to høyttalere ved å panorere nivået på signaler som sendes inn i høyttalerne. Teorien bak amplitudepanorering ligger i «interaural level difference» (ILD), som innebærer at lokalisering av lyd er basert på forskjellig lydnivå mellom høyre og venstre øre. Forskjellen i nivået er hovedsaklig forårsaket av skyggeeffekten av hodet på hendelseslyder fra forskjellige vinkler (se figur 3). ILD-fenomenet øker med økende frekvens, det vil si desto kortere bølgelengde sammenlignet med menneskehodets dimensjoner. Ved lave frekvenser er hodets skyggende effekt svak da lange bølgelengder høyer seg rundt hodet (diffraksjon). Lokalisering av lyd hos mennesker er så klart mer komplekst enn dette, men ILD-teorien har vist seg å stemme bra ved lokalisering av lyd, spesielt ved mellom- og høyfrekvensområdet. Dette er antageligvis en grunn til hvorfor amplitudepanorering er en så populær teknikk for stereolyd innen musikkproduksjon.

Figur 3: ILD – Hodets skyggende effekt på hendelseslyder. Panoreringsbasert metode for romlig lyd kan sees som en utvidet versjon av stereo der en stor gruppe høyttalere distribueres rundt lytterflaten, for eksempel i en halvkule/halvsirkel. Fantombilde kan da skapes tredimensjonalt gjennom å amplitudpanorere signalene til de ulike høyttalerne. En av disse metodene er Vector Base Amplitude Panning, VBAP, hvor fantombildet skapes i et triangel av tre høyttalere (se figur 4).

Figur 4: Tredimensjonell amplitudepanorering der fantombildet av en lyd skapes gjennom en triangel av høyttalere (Pulkki, 1997).

Ambisonics
Ambisonics er en teknikk for å håndtere og skape tredimensjonale lydfelt. Lydfeltet lagres på såkalte Ambisonics-kanaler, som inneholder lydfeltets ulike komponenter og er en slags dissekering av et sfærisk lydfelt. Sammen beskriver kanalene et komplett lydfelt. For å reprodusere lydfeltet dekodes Ambisonics-kanaler til et distribuert høyttalersystem eller til hodetelefoner for binaural avspilling. Ved binaural avspilling filtreres lydsignalet til høyre og venstre øre med såkalte HRTF-er (Head-related transfer function), som kompenserer for hodets og ørenes påvirkning på lydfeltet. Dette skaper en realistisk avspilling av 3D-lyd via hodetelefoner.
Med Ambisonics grunninnstiling blir lydfeltet lagret på fire Ambisonics-kanaler, også kalt for B-format. I figur 5 vises de ulike kanalene X, Y, Z og W, som sammen beskriver et sfærisk lydfelt. Man kan også øke antallet kanaler (9, 16 osv.) og dermed oppnås en mer detaljert beskrivelse av lydfeltet. Ambisonics tar ikke hensyn til individuelle lydobjekter i rommet, men beskriver i stedet i sin helhet. En objektbasert lydmiks kan enkelt konverteres til en Ambisonics-
representasjon for avspilling via høyttalere eller binauralt via hodetelefoner.

Figur 5: Ambisonics basisformat har fire kanaler (X,Y,Z,W). Denne gruppen kanaler er også kalt B-format.

Bølgefeltssyntese
Bølgefeltssyntese, eller Wave Field Synthesis WFS, skaper lydbølgefronter som etterligner lydbølger fra en virituell lydkilde som er fritt plassert i rommet. Lydbølgene skapes av en gruppe høyttalere hvor utgangssignalene til hver høyttaler er tilpasset slik at de til sammen skaper en enhetlig bølgefront (se Figur 6). Teorien bak WFS ligger i Huygens prinsipp, som konstanterer at en bølgefront kan produseres med et antall sekundære kilder (i dette tilfellet høyttalere).
Styrken hos WFS er at lydfeltet på overflaten som dekkes av høyttalerne blir korrekt uansett plassering, det vil si at korrekt opplevelse av lydretning ikke er bundet til en bestemt posisjon innen lytterområdet. Utenom korrekt retning av lyd gir WFS muligheten til å styre opplevd distanse til lydkilden. En rundtstrålende lydkilde nær tilskuerflaten skaper en bøyd sfærisk lydfront, mens en identisk lydkilde langt borte skaper en plan lydfront. Bølgefeltsyntesen gir muligheten til å etterligne disse egenskaper ved lydfronter og skaper dermed en realistisk opplevelse av distanse for virituelle lydkilder. For en korrekt representasjon av et lydfelt, kreves et stort antall høyttalere. Bølgefronten skapes av en gruppe individuelle høyttalere, noe som resulterer i en forvrengning i lydfronten (spatial distortion) hvor antallet høyttalere og hvor tett de sitter gir en øvre grense for hvilke frekvenser bølgefronten kan skapes korrekt. Jo tettere høyttalerne sitter, desto høyere opp i frekvens kan det skapes et bølgefelt uten forvrengning. Dette skaper utfordringer da høyere frekvens krever et stort antall høyttalere, men plasseringsmulighetene er alltid begrenset og økonomien setter sine grenser for lydsystemet. For å løse problemet pleier kommersielle system med WFS å være hybridsystem som også tar i bruk andre metoder som VBAP.

Figur 6: Bølgefeltssyntese, der en gruppe høyttalere skaper bølgefronter som etterligner bølgefelt for en virituell lydkilde bak høytalerne.

Romlig lyd i lokaler for scenekunst
Å kunne skape et romlig lydbilde gir nye muligheter for scenekunst hvor lyd sammen med lys understøtter dramaet og skaper en forhøyet omsluttende totalopplevelse. Lydbildet kan etterligne et realistisk lydmiljø for en virtuell virkelighet eller manipulere denne for en fiktiv virkelighet. Punktlignende lydobjekter kan posisjoneres og flyttes rundt rommet og den overgripende stemningen for aktuelle hendelsesforløp på scenen kan styres ved hjelp av omgivende atmosfærisk lyd som regn og vind, eller bakgrunsstøy og svak musikk i en restaurant. Utover dette kan lydsystemet brukes for posisjonsorientert taleforsterkning hvor lyden følger artisten lik en følgespot. Sammenligendet med tradisjonell taleforsterkning hvor lyden spilles ut fra en senter-høyttaler, gir posisjonsorienteret taleforsterkning:

Bedre klarhet og tekstforståelse
Bedre separasjon av forskjellige stemmer / skuespillere under en dialog
Bedre fokus på hendelsesforløpet på scenen når plasseringen av lyden er relatert til det visuelle

For at lyden smidig skal kunne følge artistens bevegelser på scenen kan lydsystemet styres med et lokaliseringssystem der skuespillerens posisjon følgesautomatisk med en RF-sender. Da kan lydteknikeren fokusere på lydnivå og det generelle lydbildet uten å behøve å tenke på retning for den forsterkede lyden.
Lydsystemet kan også brukes til å endre på rommets akustikk og etterklang, slik at et vanligvis dempet teaterlokale forandres aukustisk til en konsertsal eller kirke. Når lydsystemet med et stort antall høyttalere spredt i rommet kombineres med nøye plasserte mikrofoner på podiet og i salen, kan rommets naturlige akustikk manipuleres. Dette gjøres enten gjennom å kjøre lyden fra mikrofoner som dekker scenen gjennom en Reverb-effekt, for så å spilles ut i salen (s.k. In-line system) eller gjennom å bruke «høyttaler-rom-mikrofon»-tilbakekobling for å øke sen lydenergi og dermed romklangen (s.k. Regenerative system). Mange kommersielle lydsystem for romlig lyd har muligheten til manipulering av rommets akustikk og da er det ofte et hybridsystem som bruker både In-line og Regenerativ teknikk. Selv om etterklangen i salen kan forlenges drastisk så kan store endringer i naturlig akustikk virke noe urealistisk da salens visuelle utforming og overflater ikke stemmer overens med lydbildet. Disse systemene benyttes gjerne for små justeringer i etterklang for å få et mer luftig lydmiljø med bedre respons fra rommet, samt for å øke følelsen av klang og omhylning gjennom å øke energien av tidligere lydreflekser.
Å installere et romlig lydsystem i et teater eller en operasal er så klart en stor investering da det krever et stort antall høyttalere. Fordelen med disse systemene er at de kan benytte seg av eksisterende høyttalere (ofte med en viss komplementering) som allerede er installert i rommet. Om en sal allerede har et stort lydsystem eller et elektroakustisk etterklangssystem med spredte høyttalere, kan et romlig lydsystem skapes relativt enkelt gjennom å plassere lydprosessoren for romlig lyd i signalkjeden.
Et fullt 3D-lydbilde som dekker horisontalt og vertikalt i alle retninger er ikke alltid det man behøver for å skape en romlig lydopplevelse. Selv en nedskalert versjon som dekker det horisontale planet eller bare fronten av salen forbedrer separasjon og lokalisering av ulike lydkilder og utvider området dekket av riktig «stereobilde» sammenlignet med det vanlige Left-Center-Right-system. Det går altså å ha romlig lyd med bare høyttalere rundt det horisontale planet for 180 graders surround eller bare fronten av auditoriet for å dekke lydlokalisering fra sceneområdet.
Surround-høyttalere som brukes ved romlige lydsystemer behøver ikke være «full range»-høyttalere som klarer å gjengi hele frekvensspekteret. Oftest er det tilstrekkelig med høyttalere som gjengir mellomtone og høye frekvenser, mens lavfrekvensområdet gjengis av et fåtall basshøyttalere. I mange tilfeller kan tilstrekkelig nivå ved lave frekvenser oppnås med relativt små høyttalere på grunn av det store antallet som vanligvis behøver å bli installert.
Lokalisering av lyd ved lave frekvenser er dårligere da bølgelengdene er store og hodets innvirkning på innfallende lyder er liten (det tidligere nevnte ILD fenomenet fungerer dårligere). Dette medfører at man kan tillate en viss feiljustering av lyd ved lave frekvenser uten å påvirke lokaliseringen. For eksempel er det vanlig med delefrekvens rundt 100 Hz mellom surround- og basshøyttalere i Dolby Atmos surround-system, men forskning viser at i visse tilfeller kan enda høyere delefrekvens brukes uten å påvirke lokalisering.
Teater med 3D-lyd
Helsingin Kaupunginteatteri i Finland er et av de teatrene som nylig har oppgradert sitt lydsystem til ett 3D-lydsystem. Byteaterets store scene bruker Meyer Sounds lydsystem med D-Mitri lydprosessor og120 stk. distribuerte høyttalere i salen for å forsyne de 950 sitteplassene på parkett og balkong med romlig lydbilde. Anlegget styres med et Spacemap grensesnitt hvor lydobjekter kan plasseres og flyttes visuelt på kart over høyttalerene i salen. Ifølge lydteknikeren Janne Brelih gir systemet en stor kunstnerisk frihet i opprettelsen av lydscener. Samtidig påpeker Janne at man skal passe seg for å overbruke systemet da et livlig lydbilde tar publikums fokus bort fra selve skuespillet på scenen. For et fungerende samspill skal lyden integreres i produksjonen fra starten av. Dette muliggjør en gjennomtenkt helhet hvor alle elementene bidrar til en opplevelse av atmosfære.

Figur 7: Storscenen på Helsingin Kaupunginteatteri. I rommet er det120 stk. høyttalere for å skape et romlig lydbilde på samtlige sitteplasser. Foto: Miika Storm.

System på markedet og andre verktøy
Mange kommersielle løsninger for å reprodusere romlig lyd har dukket opp i markedet de siste årene, inkludert fra en del kjente høyttalerprodusenter. Noen eksempler på disse er Astro Spatial Audio, L-Acoustics L-ISA, d&b Soundscape, IOSONO og TiMax. I disse systemene inngår lydprosessor samt programvare for kontroll av lydbildet og oftest har systemet mulighet til posisjonsorienteret forsterkning hvor stemmen følger skuespilleren på scenen.
Som motvekt til de kommersielle systemene har det også blitt lansert flere gratis verktøy for skapelsen av romlig lyd sammen med grensesnitt for å skape objektbaserte lydscener.
Det finnes for eksempel ambiX programvare som håndterer Ambisonics med mulighet for å skape objektbasert lyd og avspilling via høyttalere eller binauralt via hodetelefoner. SoundScape Renderer er et annet verktøy som håndterer de fleste algoritmer som VBAP, WFS og Ambisonics. Begge disse programvarene kan lastes ned gratis fra deres respektive hjemmeside.
Fremtiden
Selv om gjengivelse av romlig lyd lenge har blitt studert i den akademiske verden, er det en ny moderne del av teknikken i lokaler for scenekunst.
Et slikt system kan brukes blant annet for romlige lydeffekter, lydobjekter plassert i rommet og posisjonsorientert taleforsterkning.
Det samme systemet kan også utvides for å manipulere rommets naturlige akustikk.
Flere teatre og operahus som Staatsoper i Berlin, Helsingin Kaupunginteatteri og Opernhaus Zürich har i nyere tid valgt å oppgradere lydsystemet sitt til et som støtter gjengivelse av romlig lyd.
Når det gjelder gamle lokaler med antikvarisk verdi, bør et romlig lydanlegg bygges usynlig slik at høyttalerne integreres i strukturene og dekkes med akustisk gjennomsiktig materiale.
Et godt eksempel på dette er Staatsoper i Berlin der høyttalere og mikrofoner er installert helt usynlige i salen for å bevare det historiske utseendet.
Romlig lyd (spatial sound) har sikret sin plass i virtual reality- og hodetelefonapplikasjoner, men hvorvidt flere arenaer for scenekunst vil investere i disse store lydsystemene i fremtiden, gjenstår å se.
Vil du lese de store, grundige artiklene først av alle? Abonner på den trykte utgaven av magasinet:

Denne artikkelen sto opprinnelig på trykk i nr. 6-2019 av SCENEMAGASINET. Den blir lagt som plussartikkel ila. kort tid. For å kunne lese denne, og andre unike bransjesaker, må du heretter ha gyldig abonnement. Det gir deg digitale fordeler og det trykte bladet først av alle tilsendt via Posten.

Bestill abonnement her og få glede av en rekke fordeler når vi snart lanserer vår nye plusstjeneste!
TIPS OSS! Vil du at vi skal skrive om deg, ditt firma, dine produkter, dine ansatte, dine prosjekter? Vi er avhengig av tips. Send oss et tips her!

Relaterte tema:3D-lyd