Härledning av Bernoullis ekvation

(Note: at the top of the page you can choose translation of this article to other languages, but don't expect the translation to be perfect — "Välj språk" means "Choose language")

Nedan ges ett enkelt bevis för Bernoullis sats. Förutsättningarna för att förstå beviset är att man läst grundläggande analys på universitetsnivå. En duktig gymnasist på Naturvetenskapsprogrammet bör hjälpligt kunna följa resonemanget (som jag skall försöka göra så tydligt och lättfattligt som möjligt). Jag utgår från de förutsättningar som redovisas i texten under bild 1 nedan:

Bild 1. Vi betraktar en homogen vätska/gas med densitet ρ, som rör sig åt höger i figuren, med hastigheten v (gemen, dvs liten bokstav) längs strömningslinjerna. Strömningen förutsätts vara stationär (dvs förändras inte med tiden, vilket innebär att hastigheten är konstant i tiden men kan däremot variera mellan olika punkter i rummet, dvs i olika punkter i det strömmande systemet), laminär (utan turbulens) och horisontell (så att gravitationen kan försummas) och vätskan/gasen antas vara inkompressibel och med försumbar viskositet (gaser är normalt kompressibla men vid låga machtal kan vi bortse från detta). Strömningen betraktas som endimensionell, dvs vi har bara en x-koordinat, varför riktningar kan anges med plus- och minustecken (det finns ju bara två möjliga riktningar). Vi förutsätter också att systemet är slutet, dvs ingen gas/vätska (massa) eller energi tillkommer eller försvinner.
Vi kan t ex tänka oss att vätskan/gasen strömmar i ett rör. Rörets diameter är inte konstant och strömningshastighet och tryck varierar (stationärt flöde innebär ju enligt ovan att flödet är konstant i tiden men kan vara olika i olika punkter i röret). Det behöver givetvis inte alls vara ett rör, men rent pedagogiskt underlättar det kanske att föreställa sig ett sådant. Fortsättningsvis skriver jag i allmänhet, för enkelhets skull, vätska när jag menar vätska eller gas. När det i den följande texten hänvisas till höger eller vänster etc, är detta relaterat till figuren ovan (höger anges fortsättningsvis med plustecken och vänster med minustecken).

Vi studerar nu en vätske-/gasmängd (ett vätske-/gaspaket) instängd mellan två tänkta begränsningsytor med arean A (de streckade cirkelskivorna i bild 1 — de behöver inte vara cirklar utan kan ha vilken form som helst) som befinner sig på avståndet dx från varandra (d:et framför x:et antyder att vi studerar infinitesimala storheter, dvs avståndet dx är mycket litet). Eftersom cirkelskivorna befinner sig mycket nära varandra har begränsningsytorna i stort sett samma area (A) även fast rörets diameter kanske varierar (vi skall på slutet av vår härledning låta dx gå mot noll, dvs komma oändligt nära noll, varvid de båda begränsningsytorna blir identiskt lika). Vätskepaketets volym betecknar vi V (versal, dvs stor bokstav). Den kraft som driver vätskepaketet är riktad åt höger och betecknas dF (nedan framgår varför jag valt att kalla kraften för dF och inte F).

Det spelar ingen roll åt vilket håll vi antar att kraften är riktad. Även om kraften är riktad åt andra hållet (mot vad vi antagit) kommer vi att få rätt resultat. Om vi t ex i en beräkning antar att en sökt hastighet är riktad åt fel håll så kommer vi att få ett minustecken framför resultatet (i det endimensionella fallet), vilket anger att den sökta hastigheten är motriktad vad vi antagit. Matematiken och fysikens konsistens tar hand om allt sådant. Våra antaganden och hur vi löser ett problem kommer inte att påverka resultatet så länge våra antaganden är rimliga och så länge vi följer matematikens och fysikens lagar. Beräkningsresultat kan ju inte påverkas av våra gissningar (eller huruvida vi i morse tog på oss vänster strumpa före höger strumpa eller tvärtom), då vore fysiken och matematiken inte mycket att ha.

Vätskepaketet är enligt förutsättningarna ovan en cylinder med bottenarea A och höjd dx och eftersom volymen av en cylinder är lika med bottenarea gånger höjd, blir volymen V = A·dx.

Eftersom vätskan inte är kompressibel har den samma densitet överallt. Densitet betecknas oftast med den grekiska bokstaven ρ (rho — uttalas ungefär "råå"). Massan (om densiteten är samma överallt, dvs vätskan är homogen) är lika med densitet gånger volym (densitet definieras ju som massa per volymsenhet) varför vätskepaketets massa blir:

Det som driver en vätske- eller gasströmning är tryckskillnader (tryckdifferenser). Vätskan eller gasen strömmar från högre till lägre tryck. I bild 1 måste vi således ha en tryckskillnad på vätskepaketet så att trycket bakom paketet är högre än trycket framför paketet (relativt rörelseriktningen). Tryck betecknas normalt med p och vi betecknar därför tryckskillnaden med dp (d står här för differens). Nettotrycket måste vara riktat åt höger (eftersom vätskan strömmar åt höger).

Tryck definieras som kraft delat med area (dvs den area som kraften verkar på). Det gäller generellt att:

Här måste man skilja mellan tryck (p) och tryckkraft (F_p). Tryck i sig är ingen vektor (eftersom trycket i en vätska eller gas är riktat åt alla håll) medan tryckkraft (när trycket verkar på en viss area) är en vektor (se min artikel om klassisk fysik, avsnittet om statistisk fysik och termodynamik, för närmare förklaring).

Tryckskillnaden dp (som också kan betraktas som tryckets förändring per längdenhet längs vätskeströmmen) på vätskepaketet ger upphov till den nettokraft som driver fram vätskepaketet. På den bakre (vänstra) begränsningsytan är trycket riktat åt höger och på den främre (högra) begränsningsytan är trycket riktat åt vänster (vi talar således om omgivningens tryck på vätskepaketet). Eftersom trycket bakom paketet är större än framför paketet kommer den högerriktade kraften på paketets baksida att vara större än den vänsterriktade kraften på framsidan (enligt F = pA). Detta medför att vi har en nettokraft (lika med skillnaden mellan dessa två krafter) riktad åt höger. Skillnaden mellan krafterna kan vi kalla dF. Det är således nettokraften dF som driver vätskeströmningen. Vi skriver därför om det högra sambandet ovan som:

(2) säger att kraftskillnaden (som utgör den drivande kraften) är lika med tryckskillnaden gånger tvärsnittsarean. I själva verket borde uttrycket skrivas dF_p=dpA, där ytan A är en vektor. I fallet plan yta är vektorn A:s riktning vinkelrät mot ytan och dess belopp är lika med storleken på ytan (dvs lika med arean). Tryckkraften är alltid vinkelrät mot ytan vid isotropa gas- och vätskeflöden (de statistiska egenskaperna hos gasen/vätskan är här oberoende av riktning, vilket antas vara fallet i föreliggande framställning).

Ett av mekanikens grundläggande samband är Newtons andra lag. På gymnasienivån skrivs denna lag ofta som F=am, dvs kraft är lika med acceleration (a) gånger massa (m). Detta gäller endast om massan är konstant, vilket den är i föreliggande härledning, enligt de förutsättningar som angetts i texten under bild 1. Acceleration är lika med hastighetens förändring per tidsenhet (sekund), dvs a = dv/dt (dv/dt är derivatan av hastigheten med avseende på tiden (t), dvs förändringen av hastigheten per tidsenhet). Newtons andra lag kan således skrivas:

Normalt skriver man F och inte dF i Newtons andra lag, men just i vårt fall är det lämpligare att använda dF enligt diskussionen ovan (den drivande kraften utgörs av skillnaden mellan två krafter). Nettokraften (se bild 1) symboliseras av en vektorpil riktad åt höger (kraft är en vektor, eftersom den har både storlek och riktning, till skillnad från exempelvis energi och massa, vilka bara har storlek).

Vätskepaketets rörelse beskrivs av Newtons andra lag, dvs (3). Vi sätter nu in sambanden (1) och (2) i (3) och får då:

Uttrycket ovan (4a) är emellertid inte helt korrekt, vilket vi nu skall titta lite närmare på.

Som nämnts ovan är variablerna hastighet (v) och kraft (F) vektorer, dvs de har både storlek och riktning medan tryck (p) är en skalär. Formlerna ovan är enbart relaterade till dessa variablers storlek. Vektorernas riktningar (höger/vänster) har vi hållit reda på vid sidan av (genom att resonera oss fram till riktningen och sedan uttrycka detta i ord). Så arbetar man på högstadiets fysiklektioner, eftersom vektorkalkyl inte ingår i detta stadiums läroplan.

Eftersom det strömningssystem vi studerar i föreliggande artikel, enligt förutsättningarna givna i bild 1, är endimensionellt (med enbart x-koordinat), är det mycket enkelt att också baka in riktningarna i formlerna. Vid en enda dimension finns bara två möjliga riktningar, som vi ovan kallat höger och vänster. Matematiskt kan vi ange detta med plus- och minustecken, där plustecken innebär att en vektor pekar åt samma håll som x-axeln och minustecken att den pekar åt motsatta hållet, dvs i negativ x-led. Om t ex hastigheten v = -4 m/s, så innebär detta att hastighetens storlek (ofta kallad fart) är 4 m/s och att den är riktad åt vänster (minus). Betrakta nu följande figur:

Bild 2. Figuren visar x-axeln (pekande åt höger) med två x-värden utsatta (x₁ och x₂, där x₁< x₂). Trycken i punkterna x₁ och x₂ betecknar vi p(x₁) respektive p(x₂) — uttalas "p av x ett" etc. Vi betraktar här trycket i systemet som en funktion av x, dvs p = p(x) är således lika med trycket i punkten x (i varje x-koordinat så har ju trycket ett visst värde). Trycket p är således olika i olika punkter (för olika x) men i en viss punkt (för en viss x-koordinat) är trycket konstant (dvs samma hela tiden). Men när ett gas-/vätskepaket förflyttar sig i systemet kommer dessa tryck att variera (beroende på att x-värdet ändras).

Tidigare har vi definierat dp som tryckskillnad (på vätskepaketets begränsningsytor — enligt bild 1). För att få ett konsistent system, där även tryckskillnadens riktning finns inbakad, låter vi fortsättningsvis dp definieras som tryckets förändring i x-led, dvs dp = p(x₂) - p(x₁). Antag exempelvis att p(x₁) = 8 och p(x₂) = 3 (uttryckt i någon tryckenhet), dvs p minskar när x ökar (x₁< x₂). Detta innebär att dp = p(x₂) - p(x₁) = 3 - 8 = -5, dvs dp < 0. Vi ser alltså att tryckförändringen dp blir negativ om trycket minskar med växande x-värde, enligt den givna definitionen av dp. Vid ökande tryck blir dp i stället positiv. Med andra ord; om dp är positiv (dp > 0) innebär detta att trycket ökar när man rör sig i positiv x-led (dvs mot större x-värden). Är dp negativ (dp < 0) så minskar trycket i stället (i positiv x-led).

Newtons andra lag uttryckt i (4a) ger sambandet mellan tryckets förändring (dp) längs x-axeln (längs vilken vätskepaketet rör sig) och hastighetsförändringen per tidsenhet (dv/dt = tidsderivatan av hastigheten). Nu måste man hålla tungan rätt i mun och tänka efter ordentligt, eftersom det är lätt att tänka fel. Det som driver vätskepaketet är tryckskillnaden (större tryck bakom än framför). Om vätskepaketet kommer in i ett område med lägre tryck, kommer nettotrycket (nettokraften) att öka och farten v därmed att öka. Dvs, minskande tryck ger ökande fart och tvärtom. Om trycket minskar i röret (det tänkta röret) är dp (= förändringen av trycket) negativ (enligt föregående stycke). Men minskande tryck ger ökande fart, dvs om dp är negativ så blir dv/dt positiv (derivatan av en växande/ökande funktion är positiv och vice versa). Vänsterledet i (4a) blir således i detta fall negativt och högerledet positivt (A, dx och ρ är alla positiva och påverkar inte resonemanget). Om trycket i stället ökar blir det precis tvärtom (dp positivt och dv/dt negativt). Om vänster led i (4a) är negativt blir med andra ord höger led positivt och tvärtom. Vänster och höger led kommer således alltid att ha motsatta tecken. Är det ena positivt är det andra negativt. För att kunna sätta uttrycken i vänster och höger led i (4a) lika, dvs för att få ett samband mellan dem, måste man således sätta in ett minustecken, och får (det spelar givetvis ingen roll om man sätter in minustecknet i vänster eller höger led):

Analysen ovan visar att (4a) inte stämmer, utan att den korrekta relationen är (4).

Låt oss nu förenkla samband (4) så långt det går. Vi börjar med att förkorta med arean A, vilket innebär att vi dividerar alla termer i uttrycket med A (eftersom A≠0 och förkommer i alla termer i sambandet, kommer A att försvinna). Vi kan också flytta över dx till vänsterledet, varvid dx hamnar i nämnaren (vi kan även se detta som att vi förkortar med dx, vilken också är skild från noll). Detta kallas differentialräkning och används ofta inom fysiken. Sådant är dock inte tillåtet att göra för en gymnasist. Då blir det smisk på fingrarna. Resultatet, oavsett om vi fått smisk på fingrarna eller ej, blir:

Och så är det dags för ett litet algebraiskt/analytiskt trick. dv/dt i (5) kan skrivas om på följande sätt:

Efter första likhetstecknet (i (6)) har vi förlängt med dx (dvs multiplicerat täljare och nämnare med dx). dx/dt är lika med hastigheten v (det är ju definitionen av hastighet — lägesförändring per tidsenhet), vilket utnyttjas efter andra likhetstecknet (dv/dt etc är än så länge inte en derivata utan en differenskvot, varför uttrycket kan behandlas som ett bråk — vi återkommer till detta efter formel (8) nedan). Det sista steget bygger på ett analytiskt trick som ofta används (bygger på utnyttjande av deriveringsreglerna). Enklast är att gå bakvägen för att visa att det stämmer (matematiker kan massor av sådana här trick som man ofta har användning för — matematik är till stora delar ett hantverk precis som att vara snickare eller golvläggare). Vi skall alltså derivera funktionen v²/2 med avseende på x för att visa sista steget i (6) baklänges. Resultatet blir:

Ovanstående följer av att uttrycket inom parentesen är en funktion av v, och att v i sin tur är en funktion av x (hastigheten v är olika på olika ställen i röret, dvs varierar för olika x-värden). Vi har således en sammansatt funktion och en sådan funktions derivata är lika med den yttre funktionens (v²/2) derivata (med avseende på v) gånger den inre funktionens (v) derivata (med avseende på x). Derivatan med avseende på v, av v², är lika med 2v (åk 2 i gymnasiet). Eftersom vi har siffran 2 i nämnaren, kan vi förkorta bort tvåorna i täljare och nämnare (mellersta ledet ovan). Inre derivatan, dvs derivatan av v med avseende på x, skrivs som dv/dx. Vi kan inte uttrycka den inre derivatan mer exakt än så, eftersom vi inte vet hur v explicit beror på x. Det explicita sambandet varierar givetvis mellan olika strömningssystem, men spelar ingen roll när man härleder Bernoullis ekvation, eftersom denna är en allmän ekvation, vilken gäller generellt (för de strömningssystem som uppfyller villkoren i bild 1). Vi har därmed visat sista steget i (6).

Samband (5) kan nu skrivas som:

(7) kan omformas ytterligare genom att vi flyttar över högra ledet till vänstra ledet (kvar på höger sida blir noll). Minustecknet framför ρ blir ett plustecken (årskurs 7 i grundskolan) och vi får:

Derivering är en linjär operation, vilket för det första innebär att konstanten ρ framför deriveringsoperatorn d/dx (andra termen i vänsterledet ovan) kan flyttas in innanför operatorn:

dvs:

Eftersom derivering är en linjär operation, så gäller för det andra att summan av två derivator (med avseende på samma variabel) är lika med derivatan av summan av de två funktioner som d/dx verkar på (dvs i vårt fall p respektive ρv²/2):

Låt oss nu stanna till ett ögonblick för att fundera lite över vad vi hittills gjort. Sättet ovan att resonera kanske för t ex en gymnasist kan tyckes ha stora brister och sakna stringens. För en gymnasieelev är derivata en operator, där man inte kan behandla dy och dx som separata enheter (dy/dx utgör här en symbol för en operation och är inte ett bråk med täljare och nämnare). I härledningen ovan har vi utgått från att dx (se bild 1) är litet, dvs vätskepaketets begränsningsytor ligger nära varandra. Detta gör att man kan approximera vätskepaketet med en cylinder. Läsaren kanske undrar varför jag inte använder ≈ (ungefär lika med) i stället för =. Svaret är att man utan att ändra någonting (efter att vi gjort kalkylen ovan) kan låta dx gå mot noll (dx blir ett infinitesimalt litet tal, oändligt litet men inte noll). Vätskepaketets begränsningsytor kommer då att ligga oändligt nära varandra varvid cylinderapproximationen upphör att vara en approximation och blir exakt. Men skulle en gymnasist göra som jag gjort ovan, skulle det bli underkänt, eftersom gymnasisten inte kan tillräckligt för att veta att man kan göra så. När man befinner sig på en viss matematisk nivå, har man bara rätt att använda de samband och tekniker som man bevisat vara korrekta. Matematik innebär ju att enbart göra det man bevisat, dvs det man vet att man kan och har rätt att göra.

Fram till (7) har vi behandlat dp/dx som en differenskvot med dp som täljare och dx som nämnare. Uttrycket är ungefärligt, eftersom vi antagit att den vätskevolym vi betraktar är en exakt cylinder, vilket den inte är (om dx är litet ligger dock formen nära en perfekt cylinder). Dvs dp/dx är inte lika med derivatan utan utgör en kvot mellan två differentialer och kan behandlas som ett bråk (vilket vi gjort ovan). I (7) låter vi nu dx gå mot noll, varvid också dp går mot noll. Vid denna s k gränsövergång övergår differenskvoterna dp/dx etc till derivatan dp/dx etc och därmed är uttrycket (7) exakt (bl a beroende på att vätskevolymen nu blir en exakt cylinder). Efter (7) har vi enbart använt derivatans egenskaper. Härledningen ovan är således helt stringent.

Samband (8) innebär att derivatan (d/dx) av funktionen inom parentesen i (8) (p +ρv²/2) är lika med noll för varje punkt av denna funktions definitionsområde. Matematiskt säger man då att derivatan är identiskt lika med noll, vilket betecknas med ett likhetstecken med tre parallella streck (≡ 0). Men om derivatan av en funktion är identiskt lika med noll, måste funktionen vara lika med en konstant (derivatan är ett mått på en funktions förändring, och om derivatan är lika med noll inom hela funktionens definitionsområde har vi ingen förändring, vilket innebär att funktionen är konstant). Funktionen innanför parentesen i (8) (p +ρv²/2) måste således vara konstant (derivatan av en konstant är per definition lika med noll — ett annat sätt att uttrycka det på är att säga att den primitiva funktionen till 0 är en konstant). Dvs:

Och härmed har vi kommit fram till Bernoullis ekvation. Konstanten C kallas ibland Bernoullis konstant. Denna är inte en universell konstant utan gäller för ett visst flödessystem. Trycket kan betraktas som det strömmande systemets potentiella energi per volymsenhet medan andra termen innebär systemets kinetiska energi (rörelseenergi) per volymsenhet (detta diskuteras i huvudartikeln — se länk nedan). Konstanten C är således lika med systemets totala energi per volymsenhet och är en direkt följd av energiprincipen (totala energin i ett slutet system bevaras). Bernoullis ekvation kan bevisas på många sätt. Ovan har jag utgått från de grundläggande rörelselagarna i Newtons mekanik. Man kan också ganska enkelt bevisa ekvationen med hjälp av energiprincipen (vilket är tämligen självklart med tanke på vad Bernoullis ekvation innebär).

När jag skriver "ganska enkelt" så menar jag verkligen det. Åtminstone är det ganska enkelt för en fysiker. Energiprincipen säger ju att summan av alla energiformer i ett slutet system är konstant. Utifrån de förutsättningar som ges i texten till bild 1 ovan (horisontellt, icke kompressibelt, stationärt flöde utan turbulens och ett slutet system) finns bara två energiformer; potentiell energi relaterad till trycket och kinetisk energi relaterad till gasens rörelse. Vi räknar här per volymsenhet. Som vi sett ovan så ges den potentiella, tryckrelaterade energin per volymsenhet av flödets tryck (p) medan den kinetiska energin per volymsenhet, relaterad till gasens rörelse, ges av term två i ekvationen ovan (ρv²/2). För mer komplicerade flöden (kompressibla, med turbulens etc) så finns ytterligare former av potentiell och kinetisk energi och då blir det hela mycket mer mer komplicerat. Men om förutsättningarna som getts ovan är uppfyllda, följer Bernoullis lag (formeln ovan) direkt. Det behövs inga komplicerade matematiska operationer utan det är bara att skriva ned sambandet rakt av. Potentiell energi relaterad till trycket plus kinetisk energi relaterad till rörelsen är lika med en konstant. Punkt slut! Varför valde jag då att göra den komplicerade härledningen ovan? Jo, för att visa läsaren att Bernoullis lag följer både av Newtons mekanik (utgående från krafter och rörelsemängder) och direkt av energiprincipen (se diskussionen i avsnittet "Olika perspektiv på detta med lyftkraft" i huvudartikeln). Att härleda ett fysikaliskt samband på flera olika sätt och varje gång få samma resultat utgör en test på att fysiken är konsistent, dvs hänger ihop.

En av förutsättningarna i härledningen ovan (givna i bildtexten till bild 1) är att systemet är stationärt, dvs konstant i tiden. Någon läsare kanske då tycker att i så fall accelerationen (dv/dt) måste vara noll. Annars förändras ju hastigheten. Men detta är inte vad stationär strömning innebär. Vid sådan strömning kan vi ha olika hastigheter i olika delar av systemet (t ex i ett avsmalnande rör så ökar hastigheten), men i en viss punkt i systemet är hastigheten konstant i tiden. Observera att det vätskepaket vi studerat ovan rör sig, dvs befinner sig inte i samma punkt hela tiden. Eftersom paketet möter olika tryck under sin förflyttning, kommer dess fart (och därmed kinetiska energin) att variera, dvs ett visst vätskepaket kommer att accelereras och retarderas under sin rörelse. Motsvarande gäller paketets tryck, som anger potentiella energin. Men i en viss given punkt är fart och tryck samma för varje vätskepaket som passerar. Det är detta som kallas stationärt flöde.

Den härledda formeln gäller under de begränsningar som angetts ovan. För vätskor, där vi i stort sett kan bortse från komprimeringseffekten (under normala förutsättningar kan man betrakta t ex vatten som icke komprimerbart — på 5000 m djup i världshavet komprimeras dock vatten mätbart på grund av det enorma trycket — men då talar vi om extrema specialfall). Kravet på laminär strömning, dvs strömning utan virvelbildning, är ganska självklart. Strömvirvlar innehåller mycket energi och existensen av sådana gör att härledningen ovan blir ogiltig. Beträffande gaser så gäller att dessa är komprimerbara. Vid låga machtal (låga procent av ljudhastigheten) upp till ungefär mach 0.3 (ca 366 km/h på havsytans nivå vid normalt lufttryck och +15°C) blir luftens kompressionseffekter relativt små och härledningen ovan gäller. Återigen förutsätts laminärt och horisontellt flöde.

I fallet att flödet inte är horisontellt tillkommer en ytterligare term i Bernoullis ekvation, varvid resultatet blir:

De två första termerna och ρ i term två och tre är samma som tidigare. z är den vertikala koordinaten i förhållande till ett givet nollplan och g är tyngdaccelerationen (ca 9,8 m/s² — g varierar något med latituden). Den tredje termen, som en fysiker skulle skriva dit utan att ens tänka, är helt enkelt vätskans/gasens gravitationella, potentiella energi per volymsenhet. Även i detta fall blir C lika med den totala energin per volymsenhet. Tar man så hänsyn till kompressionseffekter blir formeln ännu mer komplicerad. Och inkluderar man turbulens, ja då blir det riktigt svårt och det börjar bli dags att boka tid på ett superdatorcenter för 20 000-30 000 kr/tim. Skall man vara riktigt noggrann måste man t ex ta hänsyn till corioliskraften i turbulensvortexen (jag har en god vän som doktorerade på just detta), men då har vi definitivt kommit långt, långt bort från ämnet, som ju var att ge en grundläggande, för en lekman begriplig, förklaring till varför flygplan flyger. Redan den här lilla artikeln kan väl ses som överkurs.

Tillbaka till huvudartikeln "Varför flyger flygplan?"
Tillbaka till Kristers Flygsida