"Godhet utan vishet och utan
gränser är bara en annan
form av ondska."
(John Paterson)
"Det är synd att 99% av
journalisterna skall fördärva
förtroendet för en hel yrkeskår"
(Okänd)
"Ormar äro älskliga varelser,
om man råkar tillhöra samma
giftgrupp"
(Artur Lundkvist)
"När försiktigheten finns överallt,
finns modet ingenstans."
(den belgiske kardinalen Mercier)
"Den som gifter sig med
tidsandan blir snabbt änka."
(Goethe)
"Civiliserade är de kulturer
och individer som respekterar
andra."
(Hört på Axesskanalen)
"Det tragiska med vanligt
sunt förnuft är att det
inte är så vanligt."
(Albert Einstein)
"Halv kristendom tolereras
men föraktas.
Hel kristendom respekteras
men förföljs."
(Okänd)
(Note: at the top of the page you can choose translation of this article to other languages, but don't expect the translation to be perfect "Välj språk" means "Choose language")
En funktion, som vi kan kalla f(x) (uttalas "f av x"), utgör ett samband mellan storheter (tal, vektorer etc), vilka genom detta samband är relaterade till (beror av) varandra. T ex f(x)=x3 (f(x) sägs i detta fall vara en funktion av x). Genom att sätta in olika värden på x antar funktionen f(x) olika värden (x=2 ger f(x)=f(2)=23=2⋅2⋅2=8, och x=(-4) ger f(x)=f(-4)=(-4)3=(-4)⋅(-4)⋅(-4)=-64 etc).
Ofta skriver man y=f(x), där x kallas den oberoende variabeln och y den beroende variabeln (y beror av x, dvs när man sätter in ett visst x-värde i funktionen får man ett y-värde som resultat).
Vilken variabel som är oberoende respektive beroende är i princip godtyckligt. Om y=2x gäller, enligt algebrans regler, att x=y/2, dvs man kan lika gärna säga att x beror av y som att y beror av x. Av rent praktiska eller matematiska eller pedagogiska eller andra skäl kan det dock vara mer naturligt att välja ett av alternativen när det gäller vad som beror av vad.
Man kan använda vilka bokstäver eller symboler man vill för att beteckna en viss funktion, men när man rent allmänt talar om funktioner (och inte avser någon speciell funktion) används ofta "f" (som generisk beteckning). I det allmänna fallet kallar man ofta den oberoende variablen för "x" och den beroende variabeln för "y" (detta faller sig naturligt, eftersom axlarna i ett allmänt, tvådimensionellt koordinatsystem ofta betecknas x respektive y). I praktiken använder man ofta bokstäver eller symboler som direkt är relaterade till det problem som studeras. Om t ex en partikels rörelseenergi (även kallad kinetisk energi) Ek är en funktion av dess hastighet (v) skriver man Ek=Ek(v), vilket helt enkelt säger att rörelseenergin är en funktion av hastigheten (beror av hastigheten), men inte anger exakt hur detta beroende ser ut matematiskt (i ett praktiskt fall kan den explicita formen vara Ek=mv2/2, där m är partikelns massa). Eller om en partikels x-koordinat (x) är en funktion av tiden (t), skriver man x=x(t) (i ett verkligt fall kan denna funktion vara x=at2/2, där a är accelerationen se nedan).
Funktionsvariablerna x och y (eller vad vi nu kallar dem) kan vara vanliga, reella tal (0, 5, 27, 892, 3/8, -2 etc). Detta område av matematiken kallas "reell analys". Men variablerna kan även vara s k komplexa tal (klicka här för förklaring av reella och komplexa tal). I detta fall talar vi om "komplex analys". Variablerna kan också vara vektorer eller andra matematiska objekt (vektoranalys etc). Detta diskuteras nedan. Fortsättningsvis, om inget annat sägs, antas våra variabler vara reella tal.
Enkla funktioner (av en variabel) kan illustreras genom grafer i ett tvådimensionellt koordinatsystem (xy-system, se bilden nedan). Varje punkt i ett sådant system definieras av två koordinater, ett x- och ett y-värde (ungefär som latitud och longitud på jordklotet).
Position på jordyten ges av latitud och longitud, vilka anges i grader (läs på Wikipedia varför man i detta fall använder grader). Latitud innebär hur långt norrut/söderut man befinner sig. Latitud noll (grader) ges av ekvatorn, dvs alla orter på ekvatorn har latituden noll grader. Vid polerna är latituden 90° syd respektive 90° nord. Alla orter med samma latitud befinner sig på samma s k parallellcirkel (en cirkel parallell med ekvatorn vars radie avtar när latituden växer vid 0° latitud är parallellcirkeln lika med ekvatorn och vid 90° latitud har den krympt till en punkt, dvs respektive pol). Longitud innebär hur långt österut/västerut man befinner sig. Alla orter med samma longitud befinner sig på samma meridian (meridianer går från pol till pol). Longitud noll ges av Greenwichmeridianen, vilken går genom Greenwichobservatoriet i London (var man lägger nollmeridianen är givetvis till skillnad från ekvatorn godtyckligt och dess läge har varierat under historiens gång). Från nollmeridianen kan man gå väster- eller österut 180° longitud 180° Väst respektive 180° Ost är samma meridian och den linje (i Stilla Havet) där detta inträffar kallas datumlinjen. Vid passage av denna linje ställer man inte om timvisaren på klockan utan datumet.
De flesta svenskar uttalar Greenwich helt fel. Ordet uttalas inte som "green witch", vilket betyder "grön häxa", utan uttalas med ett kort e-ljud, ungefär som i "henne"! Dessutom är w:et stumt. Uttalet blir således Grennitsch (med mitt hemsnickrade fonetiska alfabet).
För exempelvis flygplan i luften krävs uppenbarligen en tredje koordinat för att ange exakt position, nämligen flygplanets höjd. Som nollpunkt väljer man oftast havsytans nivå. På motsvarande sätt krävs inom vetenskapen för att ange positioner i det tredimensionella rummet (som vi lever i), tre koordinater; x, y och z. Den senare, dvs z-axeln, är normalt den vertikala axeln medan x- och y-axlarna är horisontella.
När det gäller funktioner av en variabel anger den horisontella axeln (i papperets eller whiteboardens plan) i allmänhet x-värdet medan den vertikala axeln anger y-värdet (axlarna kallas därför x- respektive y-axel). Se figuren nedan! Grafen för en funktion utgör helt enkelt de punkter i koordinatsystemet som uppfyller funktionens matematiska uttryck (det matematiska sambandet mellan x och y). I den tidigare diskuterade funktionen f(x)=x3, blir y-värdet kuben av x-värdet. Sambandet kan således skrivas y=x3 och grafen visar alla punkter (x,y) som uppfyller detta samband (0,0), (1,1), (2,8), (3,27), (-4,-64), (1/2, 1/8) etc. Variabeln x genomlöper alla tal från -∞ till +∞, dvs sammanlagt oändligt många punkter. Binder man samman dessa får man grafen (kurvan) för funktionen y=x3. Läsaren kan själv roa sig med att rita upp ett koordinatsystem på ett rutat A4-papper och sedan lägga ut ett antal punkter för x3-funktionen i detta och så sammanbinda dessa. Ju fler punkter man har desto tydligare ser man grafen.
Exemplet ovan är ett exempel på en funktion som endast beror av en enda variabel. Denna del av matematiken kallas envariabelanalys. En funktion kan också vara en funktion av flera variabler. Fysikens funktioner beror ofta på fyra variabler, eftersom många fysikaliska storheter varierar både i det tredimensionella rummet (x,y,z) och tiden (t). Kraften F på en partikel skrivs därför ofta F=F(x,y,z,t), dvs kraften varierar både i rummet och i tiden. Studiet av funktioner som beror av flera variabler kallas flervariabelanalys. Jag minns med viss nostalgi när jag på 1980-talet undervisade i matematik på KTH att eleverna kallade denna kurs för "flervarre".
I själva verket är det mer komplicerat än så. En funktion kan betraktas som en avbildning, dvs man avbildar en talmängd på en talmängd. De tal eller objekt som kan sättas in i funktionen (väljas som oberoende variabel) kallas funktionens definitionsmängd (det kan exempelvis existera tal som inte går att sätta in i funktionen, eftersom detta leder till division med noll och därmed oändligheter). De tal som kan komma ut ur funktionen (den beroende variabeln) genom att man sätter in alla tal i definitionsmängden, kallas funktionens värdemängd.
För den enkla andragradsfunktionen y=x2 gäller att definitionsmängden är lika med mängden av de reella talen, eftersom alla reella tal kan sättas in i funktionen utan att det uppstår problem (alla reella tal kan kvadreras). Värdemängden blir de positiva, reella talen plus talet noll, eftersom kvadraten av ett reellt tal (även när talet är negativt) alltid är ett positivt tal, t ex (-2)2=4. Eftersom (0)2=0, ingår också talet 0 i värdemängden (dvs denna mängd innefattar alla y för vilka gäller att y≥0). Den trigonometriska funktionen y=sin(x) har de reella talen som definitionsmängd (alla reella tal kan sättas in i denna funktion). Eftersom sinusfunktionen svänger mellan +1 och -1, ges sinusfunktionens värdemängd av intervallet -1≤ sin(x) ≤+1. Etc.
I en funktion kan flera olika x-värden avbildas på ett och samma y-värde. Detta gäller andragradsfunktionen ovan. T ex så är (-3)2=9 och 32=9, dvs både x=(-3) och x=3 avbildas på y=9. Däremot gäller inte motsatsen, dvs ett x-värde kan inte avbildas på flera olika y-värden (det skulle ju bli schizofrent). Det förekommer matematiska relationer där detta förekommer men sådana relationer uppfyller inte definitionerna för en funktion.
För många funktioner av en variabel gäller att både definitions- och värdemängd är lika med mängden av de reella talen (ofta betecknat R). Avbildningen sker således från R till R, dvs från en dimension (de reella talen) till en dimension (de reella talen). Värdemängden för y=x2 uppfyller inte detta men kan skrivas som R+, vilket representerar mängden av de positiva, reella talen (se föregående stycke).
En funktion kan också avbilda ett endimensionellt rum på ett flerdimensionellt rum eller ett flerdimensionellt rum på ett annat flerdimensionellt rum. Detta innebär att funktionen själv i dessa fall har flera dimensioner.
Exempel: Antag att en kraft ges av funktionen F=F(x,y,z). Kraften är således en funktion av x, y och z, dvs varierar från punkt till punkt i det tredimensionella rummet (vilket är normalt). Eftersom tiden t inte finns med bland variablerna, är kraften (i just detta fall det gäller givetvis inte generellt) oberoende av tiden, dvs konstant. Som läsaren antagligen känner till så är kraft en vektor, eftersom den både har storlek och riktning. Kraften kan därför inte representeras av ett endimensionellt tal utan ges av tre tal, vektorns tre komposanter, Fx, Fy, Fz. Den har således en komposant i varje dimension (i x-axelns respektive y-axelns resepektive z-axelns riktning). Vektorsumman av dessa komposanter är lika med kraften själv. Funktionen skrivs då:
Fx=Fx(x,y,z)
Fy=Fy(x,y,z)
Fz=Fz(x,y,z)
"Funktionen" består i detta fall således av tre delfunktioner, vilka ger kraftvektorns tre komposanter. Den matematiska strukturen hos dessa tre delfunktioner är normalt olika.
Funktionsbegreppet är således mer generellt än vad man kan ana när man läser om funktioner på gymnaiset. Ovanstående utgör en kort presentation av funktionsbegreppet för att ge läsaren en känsla för vad det handlar om. Den läsare som vill friska upp minnet eller fördjupa sig i ämnet kan alltid ta fram sina gamla matteböcker från gymnaiset eller läsa på Wikipedia.
Derivatan av en funktion utgör ett mått på hur en funktion (f(x)) förändras när x förändras. Om en funktion är konstant är således dess derivata noll (förändringen av något som inte förändras är givetvis lika med noll). Vi återkommer strax till derivatabegreppet.
Ordet ekvation betyder likhet och en vanlig ekvation innebär ett samband mellan tal eller symboler som representerar tal. I differentialekvationer har vi i stället samband mellan funktioner och deras derivator. Lösningen till en vanlig ekvation utgörs av tal eller symboler som representerar tal. När det gäller differentialekvationer utgörs lösningarna av funktioner.
Observera att en ekvation är inte samma sak som en funktion!
En ekvation innebär en likhet som endast är uppfylld för ett eller flera tal, vilka kallas ekvationens lösningar. T ex så har ekvationen 2x+2=10 en enda lösning, x=4 (4 är det enda tal som uppfyller sambandet). Många ekvationer har flera lösningar (se exempel nedan). Det kan också hända att en ekvation saknar lösningar, dvs det existerar inte något tal som uppfyller ekvationen.
En funktion har ingen lösning utan är helt enkelt ett matematiskt samband mellan två (eller flera) storheter/variabler (t ex mellan sträcka och tid eller mellan kraft och acceleration). När man sätter in ett x-värde får man reda på vilket y-värde som svarar mot detta x-värde (t ex när man sätter in lufttrycket i en viss funktion får man kanske reda på höjden över havsytans nivå). En funktion är således en slags formel, där man sätter in olika värden på variabeln/variablerna.
Om man sätter en funktion av x lika med noll (dvs f(x)=0), övergår funktionen till en ekvation. Man söker då de x-värden för vilka funktionen är lika med noll. Dessa utgör ekvationens lösningar. Eftersom y=f(x) representeras av en graf (kurva) i ett xy-system, är lösningarna till ekvationen f(x)=0 helt enkelt de punkter (x-värden) där grafen skär x-axlen (funktionens nollställen). Se figur nedan.
I en vanlig ekvation används bokstäver eller symboler för att representera tal. Ofta används bokstaven x för den s k "okända" eller "obekanta", dvs den sökta lösningen (den storhet som skall lösas ut). En ekvation kan ha en eller flera eller eventuellt oändligt många lösningar. Vi går inte här in på hur man rent praktiskt går till väga för att lösa ekvationer.
Några exempel:
x+5 = 7 med lösning x=2
x2-3x-10=0 med lösningar x=5 och x=-2
Lösningarna kan enkelt testas genom att man sätter in dem i motsvarande ekvation (för de två ekvationerna ovan gäller: 2+5=7 respektive 52-3⋅5-10=25-15-10=0 och (-2)2-3⋅(-2)-10=4+6-10=0).
Ovan har getts exempel på s k algebraiska ekvationer, dvs ekvationer som innehåller heltalspotenser av x, eller vad vi nu kallar den obekanta (x, x2, x3, x4 etc). Det finns mängder av ytterligare typer av ekvationer och de kan innehålla kvadratrötter, trigonometriska funktioner som sinus etc eller logaritmer etc, etc.
Den trigonometriska ekvationen cos(x)=0,5 har t ex lösningen x=±60°+n⋅360°, där n=0, ±1, ±2, ±3... (dvs n innefattar alla positiva och negativa heltal, inkluderande 0) Denna ekvation har således oändligt många lösningar (60°, 60°+360°=420°, 60°-360°=-300°... samt -60°, -60°+360°=300°, -60°-360°=-420°...).
En ekvation kan innehålla flera obekanta; x, y, z.... Har vi väldigt många obekanta kallar vi dem t ex för x1, x2, x3... eller liknande (bokstäverna räcker inte till om vi har väldigt många obekanta). Man kan också ha ekvationssystem, vilka består av flera ekvationer, med flera obekanta, som tillsammans beskriver ett problem som skall lösas. För att få entydiga lösningar måste man i allmänhet ha lika många ekvationer som man har obekanta. Lösningarna till ett sådant ekvationssystem måste uppfylla alla de ingående ekvationerna. Man kan således inte lösa en ekvation i taget, utan måste "bolla med" samtliga ekvationer samtidigt!
I en differentialekvation används bokstäver eller symboler för att representera funktioner och sådana ekvationer anger samband mellan funktioner och funktioners derivator. Differentialekvationer innehåller termer av typ f(x), f'(x), y, y', dy/dx etc (se förklaring nedan). Precis som vanliga ekvationer så kan en differentialekvation ha en eller flera (eventuellt oändligt många) funktioner som lösning. Eller också har den ingen lösning alls.
Och precis som när det gäller vanliga ekvationer kan man vid komplicerade problem, få system av differentialekvationer (kallade differentialekvationssystem). Lösningarna måste uppfylla alla differentialekvationer som ingår i systemet. Sådana system är i allmänhet mycket svåra att lösa exakt och man är ofta hänvisad till numeriska lösningsmetoder (se huvudtexten). En del numeriska metoder går ut på att omvandla differentialekvationssystemet till ett vanligt linjärt ekvationssystem, där de obekanta utgörs av tal. Normalt är ju, som förklarats ovan, lösningen till en differentialekvation en funktion, men vid numerisk lösning av sådana ekvationer får man svaret i form av funktionvärden (dvs tal) för olika rums- och tidpunkter.
För att återgå till vanliga funktioner av en variabel, dvs y=f(x), så gäller att dessa kan representeras av en graf/kurva (ofta kallad funktionsgraf) i ett tvådimensionellt koordinatsystem (x/y). Funktionens värde anges här av y-värdet (som nämnts ovan säger man att y är en funktion av x där x och y kallas variabler, av vilka x kallas den oberoende och y den beroende variabeln, eftersom y beror av x). Grafens form beror på vilken typ av funktion det handlar om (dvs funktionens matematiska uttryck).
Figuren ovan visar grafen för funktionen y=x3-5x2+5,08x+1,224. Funktionen är en tredjegradsfunktion, eftersom den har x upphöjt till tre (x3) som högsta potens. Varje punkt på grafen/kurvan uppfyller funktionens matematiska samband (mellan x och y). En funktion sägs ha nollställen i de punkter där y=0 (dvs där funktionsgrafen skär x-axeln). Funktionen ovan skär x-axeln tre gånger (vid de tre pilarna) och har således 3 nollställen (i x=-0,2, x=1,8 och x=3,4). Dessa tre nollställen utgör lösningarna till motsvarande ekvation, dvs till ekvationen x3-5x2+5,08x+1,224=0.
En tredegradsekvation har alltid tre lösningar. Enligt algebrans fundamentalsats har en algebraisk ekvation (som enbart har heltalspotenser av x, dvs x, x2 etc) alltid exakt lika många lösningar som dess gradtal, dvs en förstagradsekvation (med x som högsta potens) har en lösning, en andragradsekvation (med x2 som högsta potens) har två lösningar etc.
Om vi lyfter upp eller sänker ned funktionsgrafen ovan (genom att addera eller subtrahera funktionen med ett tillräckligt stort tal), så att "S-kurvan" i grafen hamnar helt ovanför eller under x-axeln, kommer grafen bara att ha en enda skärning med x-axeln. Betyder det att vi bara har ett nollställe? Och hur stämmer det med att en tredjegradsekvation alltid har tre lösningar (ekvationen kommer fortfarande att vara en tredjegradsekvation, eftersom x3-termen finns kvar)? Svaret är att i detta fall så är två av lösningarna icke-reella (komplexa) tal. När algebrans fundamentalsats säger att en ekvation har lika många lösningar som dess gradtal, inkluderar detta således både reella och icke-reella lösningar. De icke-reella lösningarna syns inte i ett vanligt, tvådimensionellt xy-system.
Definitionsmängden för funktionen ovan är lika med R (mängden av de reella talen), eftersom alla tal mellan -∞ och +∞ kan sättas in i funktionen. Också värdemängden ges av R, eftersom funktionen går från -∞ och sedan efter några "svängar" kring x-axeln (se figuren ovan) fortsätter mot +∞.
En funktions derivata är ett mått på funktionsgrafens lutning för olika x-värden (dvs i olika punkter). Om funktionen växer (uppförsbacke) när man går i positiv x-led (åt höger) är derivatan positiv (mellan A och B respektive C och D ovan). Avtar funktionen i positiv x-led (nedförsbacke) är derivatan negativ (mellan B och C). Ju brantare funktionen växer/avtar, desto större är derivatans absolutbelopp (vid negativ derivata är absolutbeloppet siffran efter minustecknet, dvs absolutbeloppet av -82 är lika med 82). Om grafen är vertikal är derivatan oändlig. Om derivatan är noll överallt, är funktionen konstant (förändras inte) och dess graf är då en horisontell, rät linje (samma y-värde oavsett vilke x-värde man sätter in i funktionen). I punkterna B och C ovan, vilka utgör s k maximi- respektive minimipunkter, är derivatan noll (i just dessa punkter).
Till vänster om B är derivatan positiv (större än noll), eftersom funktionen växer. Till höger om B är derivatan negativ (mindre än noll), eftersom funktionen avtar. För att gå från positiva tal till negativa tal måste man passera noll. Det finns ingen annan möjlighet. Således måste derivatan i punkten B vara lika med noll. Motsvarande gäller för punkt C. Derivatans nollställen används för att hitta en funktions lokala maxima och minima (funktionen ovan saknar globala/absoluta maxima och minima, eftersom den både kan bli oändligt liten och oändligt stor).
Man kan också säga att derivatan i en punkt är lika med tangentens riktning i punkten. En tangent är en rät linje som "skär" en kurva och i denna skärningspunkt (kallad tangeringspunkten) är exakt parallell med kurvan, dvs tangerar (snuddar vid) kurvan i tangeringspunkten. Den svarta räta linjen i figuren ovan tangerar den blå kurvan i E och har negativ riktning (dvs derivatan i E är negativ). Skulle man rita ut tangenterna i B och C så skulle dessa vara horisontella, eftersom derivatan i dessa punkter är noll. En rät linje (som ju också är en graf) har givetvis samma derivata i varje punkt (eftersom den har samma lutning överallt).
Derivatan av en funktion (kallas också förstaderivatan) är själv en funktion och anger hur funktionen förändras (dvs anger funktionsgrafens lutning i varje punkt). Eftersom derivatan är en funktion kan denna i sin tur deriveras och man får då andraderivatan (som anger hur derivatan förändras), etc. En differentialekvation innebär ett samband mellan funktioner och funktioners derivator (första-, andra-, tredjederivator etc) och lösningarna utgörs av funktioner som uppfyller detta samband (här är lösningarna således funktioner och inte tal). Förstaderivatan av funktionen f(x) betecknas med f '(x) uttalas "f-prim av x" eller "f-prim x", andraderivatan med f ''(x) uttalas "f-bis av x" etc. f '(x) kan också skrivas som df/dx och f ''(x) som d2f/dx2.
Exempel: Om en partikels läge har x-koordinaten x och detta läge är en funktion av tiden t, kan vi skriva x=x(t). Förstaderivatan av x är då partikelns hastighet v (förändringen av läget per tidsenhet), dvs v=x'(t). Förstaderivatan av hastigheten är då förändringen av partikelns hastighet per tidsenhet (lika med andraderivatan av läget) dvs är lika med partikelns acceleration a. Eller för att sammanfatta; a=v'(t)=x''(t).
En funktion överför ett tal till ett (i allmänhet annat) tal. Alternativt kan man säga att en funktion avbildar ett tal på ett (i allmänhet annat) tal. Funktioner kan också överföra andra matematiska entiteter t ex vektor till vektor eller vektor till tal, etc. Förutom funktioner finns något man kallar operator. En operator överför (avbildar) en funktion till (på) en (i allmänhet annan) funktion. Derivering är ett exempel på en operator. T ex ges derivatan av funktionen y=x3 av funktionen y'=3x2. Om vi betecknar deriveringsoperatorn med D kan detta skrivas som D(x3)=3x2. Detta kan uttalas som "D verkande på x3 ger resultatet/är lika med 3x2".
Ett exempel på en differentialekvation: f'(x)=f(x). Denna ekvation säger att f '(x), dvs (första)derivaten av funktionen f(x), är lika med funktionen själv (f(x)). Vi söker således en funktion som är lika med sin egen derivata (dvs sin egen förändring). Mer generellt gäller att f'(x)=k⋅f(x), där k är en konstant, dvs derivatan är i detta fall proportionell mot funktionen själv. Detta och liknande samband dyker ofta upp i fysikaliska problem och i problem som rör tillväxt och sönderfall.
Vi kan ta befolkningstillväxt som exempel. Den oberoende variabeln är här tiden som vi betecknar med t. Invånarantalet vid tiden t betecknar vi med f(t). Befolkningstillväxten (förändringen per år av antalet invånare i populationen), dvs derivatan = f'(t), är oftast (om vi bortser från speciella situationer som hungersnöd, krig och liknande) proportionell mot befolkningens storlek (dvs f(t)). Detta avspeglas i begreppen nativitet och mortalitet (antal födda respektiva döda per 100 000 invånare per år). Om befolkningen fördubblas kommer dubbelt så många barn att födas och dubbelt så många människor att dö per år (om förhållandena är likvärda). Dvs förändringen (derivatan) av invånarantalet kommer att vara proportionell mot antalet invånare. Motsvarande gäller vid radioaktivt sönderfall. Finns dubbelt så många kol-14-atomer i ett preparat, kommer dubbelt så många atomer att sönderfalla per tidsenhet, dvs förändringen är även här proportionell mot antalet/mängden. Etc. Därför gäller ofta för den här typen av system att förändringen (derivatan av funktionen) är proportionell mot mängden (funktionen). I praktiken är det ofta mer komplicerat och då tillkommer ytterligare termer och faktorer i differentialekvationen (t ex 3f'(x)=4f(x)+5). Men principen kvarstår, varför ovanstående differentialekvation är mycket viktig och grundläggande.
Lösningen till differentialekvationen f'(x)=f(x) är f(x)=ex+C (sätter man in denna funktion i differentialekvationen uppfylls likheten derivatan av funktionen ex är nämligen lika med funktionen ex, dvs funktionen ex har den unika egenskapen att vara sin egen derivata), För talet e gälller e=2,71828... (talet e utgör tillsammans med π (pi) två av matematikens viktigaste konstanter och dyker upp överallt i fysikaliska samband klicka här och läs inledningen till den länkade artikeln). Storheten C i lösningen är en godtycklig konstant och finns med, eftersom derivatan av en konstant är noll (förändringen av en konstant är ju lika med noll). Lösningen till en allmän differentialekvation är således alltid obestämd på en eller flera konstanter när.
Differentialekvationer är det normala inom fysiken. T ex så är det som brukar kallas Newtons andra lag, dvs F=ma (kraft lika med massa gånger acceleration, vilket gäller om massan är konstant) i själva verket en differentialekvation. Acceleration är, som diskuterats ovan, derivatan av hastigheten (dvs förändringen av hastigheten v med avseende på tiden t, dvs hur mycket hastigheten förändras per tidsenhet, t ex per sekund). Hastigheten är i sin tur derivatan av läget (dvs förändringen av läget x med avseende på tiden t, eller med andra ord förflyttning per tidsenhet). Acceleration är således andraderivatan (derivatan av derivatan) av läget. Läget x är i sin tur en funktion av tiden t (om objektet är i rörelse), dvs x=x(t), eftersom läget beror på (förändras med) tiden. Vi antar i detta exempel att rörelsen är endimensionell, dvs att objektet rör sig längs en rät linje (annars måste vi också ta hänsyn till rörelsen i y- och z-led).
I det endimensionella fallet kan F=ma därför skrivas som mx''(t)=F. Vi söker här en funktion, x=x(t), som uppfyller att massan gånger andraderivatan av läget (x) med avseende på tiden (t) är lika med kraften (F). Den sistnämnda kan vara konstant eller bero på x och t (F=F(x,t)). Lösningen till denna differentialekvation är x=x(t) (x är således en funktion av tiden t) och beror på hur kraften varierar med x och t. Lösningen x(t) anger hur x förändras med tiden t när massan m påverkas av kraften F (x(t) anger var objektet befinner sig vid tidpunkten t). I fallet att kraften är konstant (dvs inte förändras med t eller x, vilket är liktydligt med att kraften är densamma i varje tids- och rumspunkt) blir accelerationen konstant och lösningen x(t) blir i detta fall x(t)=at2/2 (om objektet befinner sig i x=0 vid t=0 vi bestämmer ju själva var vi lägger x=0 och när vi startar vårt tidtagarur). Om kraften varierar får vi mer komplicerade uttryck.
Differentialekvationer ger normalt lösningar som innehåller obestämda uttryck med en eller flera godtyckliga konstanter. Ofta har man förutom själva differentialekvationen kunskap om systemets läge, hastighet, temperatur etc vid en viss tidpunkt (för en sådan tidpunkt kan man, för enkelhetens skull, sätta t=0 man bestämmer ju som sagt själv när man startar sin tidtagning). Detta kallas initial- eller begynnelsevillkor. Eller också kanske man känner till temperaturen, eller vad man nu studerar, i punkter på randen till det område som undersöks (kallas randvillkor). På så sätt vet man den sökta funktionens och/eller dess derivators värden i vissa tids- och rumspunkter, och kan sätta in dessa värden i den allmänna lösning (innehållande godtyckliga konstanter) man fått fram. På så sätt antar de obestämda konstanterna numeriska värden och man får en exakt, explicit lösning, som kan användas för att förutsäga och förklara det aktuella systemet.
Exempel: Antag att lösningen till en differentialekvation är f(x)=Ae2x+Be-x, där A och B är godtyckliga, reella konstanter. Funktionen ger en allmän uppfattning om hur systemet beter sig men kan inte användas för explicita beräkningar, eftersom den innehåller obestämda konstanter. Genom att sätta in två stycken rand- eller initialvillkor får man ett ekvationssystem med vars hjälp man kan ta fram A och B och därmed få en lösning som exakt kan förutsäga det system som studeras.
Derivatan av ovanstående funktion blir f'(x)=2Ae2x - Be-x. Antag nu att vi vet värdet av f(x) och f'(x) för x=0, t ex f(0)=1 och f'(0)=5. Vi får då ekvationssystemet
f(0)=Ae2⋅0+Be-0=1
f'(0)=2Ae2⋅0-Be-0=5
A+B=1
2A-B=5
Observera att e0=1
Löser vi detta system får vi A=2 och B=-1 (läsaren kan själv sätta in dessa värden i systemet för att kontrollera att det stämmer utrymmet tillåter inte att jag går in på hur man deriverar funktioner eller löser vanliga ekvationssystem).
Den explicita lösningen till differentialekvationen blir således f(x)=2e2x-e-x. T ex så är f(2,5)=2e2⋅2,5-e-2,5=296,8263...
Differentialekvationer är ett notoriskt svårt och dessutom bökigt område inom matematiken och många matematiker ägnar eller har ägnat hela sina yrkesliv åt att hitta lösningar på olika typer av differentialekvationer. Eller att bevisa att det finns ytterligare lösningar till en viss ekvation förutom de man redan känner till, eller att bevisa att de saknar analytiska lösningar (dvs lösningar som kan uttryckas explicit). Eller att de överhuvudtaget saknar lösningar.
När man arbetar i flera dimensioner får man s k partiella differentialekvationer, vilka kan vara extremt komplicerade. Partialderivator betecknas med symbolen "∂". ∂f/∂x anger t ex hur funktionen f(x,y,z,t) varierar när man förflyttar systemet som beskrivs av funktionen f i x-led. ∂f/∂y anger förändringen vid förflyttning i y-led och ∂f/∂t hur systemet förändras som funktion av tiden. Etc. Låt oss ta ett exempel på detta hämtat från verkligheten:
För system på atomär skala (elementarpartiklar, atomer etc) gäller inte klassisk mekanik (Newtons mekanik) utan för att beskriva sådana system krävs kvantmekanik. Kvantmekanikens grundekvation är den s k Schrödingerekvationen (ungefär som att F=am ovan är den klassiska mekanikens grundekvation). Schrödingerekvationen för en partikel, som rör sig i tre dimensioner i kraftfältet V, kan skrivas som:
ψ (grekiska bokstaven psi) kallas systemets (partikelns) vågfunktion och innehåller information om det kvantmekaniska systemets dynamiska variabler (läge, hastighet, rörelsemängd, eventuella rotationer, energi etc). ψ är normalt en funktion både av de tre rumskoordinaterna x,y,z och tiden t, dvs ψ=ψ(x,y,z,t). Termerna med ∂2 är andraderivator (∂2ψ/∂x2 är andraderivatan av ψ med avseende på x etc). Ekvationen ovan är en andra ordningens (innehåller andraderivator som högsta derivata), partiell (de inblandade funktionerna är funktioner av flera variabler) differentialekvation. ∂ψ/∂t är partialderivatan av funktionen ψ med avseende på tiden t.
Derivatan i x-led, ∂ψ/∂x, anger hur ψ förändras när systemet förflyttas i x-led (motsvarande gäller för derivatorna i y- och z-led). Andraderivatan ∂2ψ/∂x2 anger hur derivatan av ψ förändras vid förflyttning i x-led. Denna derivata innebär således förändringen av förändringen (derivatan av derivatan) av ψ vid förflyttning i x-led. Derivatan med avseende på tiden, ∂ψ/∂t, anger hur ψ förändras som funktion av tiden.
I formlen är h lika med Plancks konstant och m är partikelns massa och i är den s k imaginära enheten, vilken uppfyller sambandet i2=-1. Detta innebär att i inte kan vara ett reellt tal, eftersom alla reella tal i kvadrat (även negativa sådana) blir positiva tal (se länk ovan till en artikel där jag förklara komplexa tal). Talet i ligger således inte på tallinjen. Sådana tal kalla imaginära. Vi ser också att talet pi (π) finns med på två ställen (pi brukar poppa upp både här och där i fysikaliska formler).
Lite förenklat kan man säga att högerledet representerar systemets (partikelns) totala energi, dvs summan av kinetisk (rörelse-) och potentiell (läges-) energi. Den potentiella energin är kopplad till V, vilken anger en s k potential (t ex ett elektriskt fält) som systemet eventuellt befinner sig i (och som påverkar systemet). Vänsterledet anger hur vågfunktionen förändras i tiden, dvs anger denna funktions tidsutveckling. Känner vi systemets vågfunktion i ett visst ögonblick kan vi således beräkna denna funktion vid varje framtida (och tidigare) tidpunkt. Schrödingerekvationen visar således att vågfunktionens tidutveckling är deterministisk, dvs är exakt förutsägbar. Den deterministiska vågfunktionen innehåller all information om systemets dynamik (läge, energi, rörelsemängd etc) och de dynamiska storheternas värden får man fram genom att operera med operatorer på vågfunktionen. Det visar sig att de dynamiska storheterna endast kan förutsägas statistiskt, dvs man kan i allmänhet endast förutsäga sannolikhter för t ex systemets möjliga energier. Att själva vågfunktionen är deterministisk tolkas av många fysiker som att vågfunktionen har en mer reell existens än systemets dynamiska variabler.
Schrödingerekvationen ger oss, förutom ovanstående, en ytterligare djup insikt, nämligen att det finns en koppling mellan energi och tid (högerledet representerar systemets totala energi och vänsterledet systemets tidsutveckling/tidsderivata). Det som grundläggande förändras i fysikaliska system, under det att tiden tickar fram, är systemets energi (en av fysikens mest fundamentala storheter). Schrödingerekvationen utgör ett bra exempel på hur differentialekvationer kan ge oss fundamentala insikter i hur saker och ting hänger ihop.
Att lösa ovanstående ekvation, som ju handlar om ett mycket enkelt fall (en partikel) är inte helt lätt. Tar vi sedan Schrödingerekvationen för ett något mer komplicerat system, en väteatom (den enklaste av alla atomer som består av en proton och en elektron), blir allt betydligt mer komplicerat. Och när det gäller ännu mer komplicerade atomer eller molekyler så ökar svårighetsgraden snabbt. Ofta är man här hänvisad till approximativa eller numeriska lösningar.
Differentialekvationssystem utgörs, som nämnts ovan, av flera differentialekvationer som är relaterade/kopplade till varandra. Man kan i detta fall inte lösa varje ekvation för sig utan måste hitta funktioner som uppfyller alla de differentialekvationer som ingår i systemet. Problemen blir i mer avancerade fall formidabla och kräver numeriska lösningar. Och det är den typen av problem man har att lösa i klimatsammanhang (där det dessutom är osäkert hur väl de använda differentialekvationssystemen avspeglar verkligheten, plus att lösningarna dessutom är kaotiska, dvs extremt känsliga för variationer i indata). Låt mig avsluta med att visa hur oceanografins grundläggande differentialekvationssystem ser ut (vilket har stora likheter med meteorologins och klimatologins ekvationer):
Ekvationerna ovan gäller för ett mycket enkelt specialfall. Vid mer realistiska tillämpningar tillkommer ett antal termer. Rent generellt gäller följande:
De tre första ekvationerna är systemets rörelseekvationer, vilka beskriver hur ett vatten"paket" (en vattenvolym) rör sig under påverkan av olika krafter (gravitation, i vilken tidvattenkrafter ingår, och vindstress, dvs vindens påverkan på vattnet, friktion etc) och pseudokrafter orsakade av jordens och vattnets rotation (coriolis- och centrifugalkrafter). Ekvation ett beskriver vattenpaketets rörelse i ost-västlig riktning (x-led). Ekvation två beskriver rörelsen i nord-sydlig riktning (y-led) och den tredje ekvationen beskriver rörelsen vertikalt (z-led). u är vattenpaketets fart i x-led och v farten i y-led och w farten i z-led.
Den fjärde ekvationen är en kontinuitetsekvation som "håller reda på" mängden vatten i vattenpaketet (ungefär som en slags bokföring). Allt vatten som går in i ett vattenpaket måste antingen komma ut och/eller lagras därinne. Inget vatten kan försvinna eller uppstå.
Den näst sista ekvationen (den femte) håller reda på temperaturerna (T, dvs temperaturen angiven i kelvin, vars nollpunkt är lika med absoluta nollpunkten, ca -273,15°C) om två vattenmassor med olika temperaturer möts, får den blandning som uppstår en viss temperatur (ekvationen är en slags kontinuitetsekvation för värmeenergi, dvs den håller reda på mängden värme i vattenpaketet).
Den sista ekvationen (den sjätte), slutligen, är motsvarande ekvation för saltet (S) i vattenpaketet (inom oceanografin kallas vattnets salthalt för salinitet). Inget salt kan uppstå eller försvinna utan kan bara omfördelas (genom strömmar och blandning av olika vattenmassor), vilket således beskrivs av denna ekvation. De tre sista ekvationerna handlar helt enkelt om bokföring, dvs debet och kredit på olika konton eller i olika valutor (massa, värmeenergi och salt).
Här kanske man kommer att tänka på studenten, som efter att ha läst en svår kurs i kvantmekanik, uppgivet suckade, "Innan kursen var jag helt förvirrad när det gäller kvantmekanik. Efter kursen är jag ännu mer förvirrad, men på en högre nivå."
Tillbaka till artikeln "Allt är inte glamour när det gäller ekvationslösning och simulering."