道具としての数学1:微分
   ━━ 接線の傾き


x2 の微分は 2x sin x の微分は cos xうん、知ってる、知ってる。だが少し複雑な問題に出くわして、延々と計算と続けるうち、「あれ、オレ、今何やってたんだっけ?」と愕然とした覚えがあるのは自分だけではないと思う。 数式の海に溺れたというか、気がつけば数式の砂漠でポツンと一人、道に迷ってしまったというか、迷宮に迷い込んだようなあの気分。微分するということの、幾何学的なイメージを持てるように順をおって説明します。
直線の傾き
直観では直線の傾きとは、 x 軸とのなす角度 𝜃 の大小だが、数学では底辺と高さの比 tan𝜃 を「傾き 」として定義する。そのほうが後々、関数の増分を考える際に便利だから。x の増分 𝛥x に対し、y の増分を 𝛥y として、直線の場合、比は𝛥y
𝛥x
=𝛥y1
𝛥x1
=𝛥y2
𝛥x2
=a
1
=tan𝜃
で一定となる。
そのメリットは、与えられた任意の x の増分 𝛥xi に対し、y の増分は 𝛥yi=a𝛥xi と、ダイレクトにわかることにある。その点、 𝜃 よりも便利。 日常生活においても、道路標識の勾配は、%で表示されているのを見たことがあると思う。これも、tan𝜃 を使って、勾配を表している。10%なら、「ああ、地図で100m進むと10m高さが上がる訳ね」、と直観的に想像できるが、これが、「坂の角度は5.7度です」、と言われてもなかなかピンと来ないだろう。
曲線(関数)の接線
直線の傾きは x の増分 𝛥x によらず一定だったが、曲線の場合は事情が異なってくる。関数 f(x) 上の、2点 (x0,f(x0)) (x0+𝛥x,f(x0+𝛥x)) を結ぶ直線を考えると、𝛥x の大きさにより、直線も、従って傾き 𝛥f/𝛥x も変化する。では 𝛥x をいくつにとってやればいいだろうか? 1 でも、0.01 でも有限の値をとる限り、その大きさ固有の傾きになってしまう。そこで、𝛥x→0 の極限をとってやることにする。そのとき、直線は関数 f(x) の、点 x0 における接線となる。
x0 における接線の傾きを、 𝛥f
𝛥x
df
dx
(x0)
と定義する。 任意の点 x において、その点における接線の傾きを与える関数を、df
dx
(x)
と定義して、関数 f(x) の微分、もくしくは導関数と呼ぶ。
「微分は曲線(関数)の接線の傾きである」。
一次近似:有限幅 𝛥x に対し、直線で近似すること
逆に x0~x0+𝛥x での f の増分 𝛥f を、x0 での導関数を係数として一次近似( 𝛥x の一次関数で近似)することができる。𝛥f = df
dx
(x0)𝛥x +O((𝛥x)2)
df
dx
(x0)𝛥x
グラフ的には関数を、x0 における接線で直線近似したことに相当する。見ての通り、𝛥x が大きいと、誤差も大きい。 O((𝛥x)2) は、(𝛥x)2と同程度の大きさ(というか、小ささ)であることを表す記号。そのため、ここでは使わないが、仮に左辺に移項しても符号は変らず + のままとする。なぜこう書けるかは「余談: Taylor 展開」で簡単に説明する。 図では 𝛥f と一次近似との差が大きいが、𝛥x 1 より十分に小さくすれば、差は任意の精度で小さくなる。 𝛥f を書き直すと、f(x0+𝛥x)=f(x0)+df
dx
(x0)𝛥x +O((𝛥x)2)
f(x0)+df
dx
(x0)𝛥x
f(x0+𝛥x) の値を x0 での f, df
dx
から推測できることになる。
余談: Taylor展開
このセクションは、一次近似の誤差 O((𝛥x)2) を説明するためだけに必要で、この先の内容を理解するには必要ありません。とりあえず、誤差はこう書けると受け入れて先に進むのもありです。 𝛥f と一次近似との差は、𝛥x の二次以上の項まで考慮してやると、もっと小さくなるのではなかろうか? 𝛥x < 1 で考えると、𝛥x>(𝛥x)2>(𝛥x)3>... だから、各べき( 𝛥x の何乗という形で表されるもの)の係数が同程度の大きさとして、その補正の効果は、一次近似に比べ、べきが大きくなればなるほど小さくなりそうである。 関数 f を、f(x)=a0+a1𝛥x+a2𝛥x2+a3𝛥x3++an𝛥xn+とべき級数で展開できるとしてみると、その係数は 𝛥xn(x-x0)n で置き換えて、両辺を n 回微分して係数を比べることにより、an=1
n!
dnf
dxn
(x0)
で与えられることが分かる。 n=0,1,2 の場合を確認すると、両辺を順次微分して x=x0 を代入することにより、 n=0:f(x0)=a0+a1(x-x0)|x=x0+⋯=a0n=1:a
df
dx
(x0)
=a1+2a2(x-x0)|x=x0+⋯=a1
n=2:a
d2f
dx2
(x0)
=2a2+3! a3(x-x0)|x=x0+⋯=2a2
となる。 この展開は、左辺が発散しない範囲で成立する。これを Taylor 展開という。改めて書き直すと、
f(x0+𝛥x)=f(x0)+df
dx
(x0)𝛥x+1
2
d2f
d2x
(x0)𝛥x2+
=f(x0)+df
dx
(x0)𝛥x +O((𝛥x)2)
となり、df
dx
(x0)𝛥x
より先の項は、(𝛥x)2のオーダー O((𝛥x)2) と表せること、また、𝛥x の係数は直観通り、接線の傾きでよいことが分かった。
本来は n 次で近似を打ち切った場合の誤差を検討するべきだが、Taylor 展開については高校の範囲を超えるので、例として、y=sinxx=0 において展開したグラフを示すことでイメージをつかんでもらおうと思う。 a
dsinx
dx
|x=0
=cosx|x=0
, a
d2sinx
dx2
|x=0
=-sinx|x=0
,a
d3sinx
dx3
|x=0
=-cosx|x=0
,
から、sinx=x-1
3!
x3+1
5!
x5-1
7!
x7+1
9!
x9-
y=sinx と、 x=0での Taylor 展開をそれぞれ、n=1,3,5,7,9 で打ち切った場合のグラフは、以下のようになる。
n を大きくとるにつれ、だんだんと、元の関数 y=sinx に近づいていくのが分かる。 再び高校の数学の範疇に戻って、この先に道具として使う微分の定理を二つほど。
関数の積の微分:ライプニッツ則
x𝛥x だけ変化すると、関数の積 f(x)g(x) はどれだけ変化するか? を考える。f(x)、g(x) をそれぞれ一次の項まで展開すると、f(x+𝛥x)=f(x)+df
dx
(x)𝛥x +O(𝛥x2)
g(x+𝛥x)=g(x)+dg
dx
(x)𝛥x +O(𝛥x2)
微分の定義に従って、
df(x)g(x)
dx
=f(x+𝛥x)g(x+𝛥x)-f(x)g(x)
𝛥x
=1
𝛥x
a(f(x)+df
dx
(x)𝛥x +O(𝛥x2))(g(x)+dg
dx
(x)𝛥x +O(𝛥x2))
-f(x)g(x) a
=1
𝛥x
{(df
dx
(x)g(x)+f(x)dg
dx
(x))𝛥x+O(𝛥x2)(f(x)+g(x)+...)}
=df
dx
(x)g(x)+f(x)dg
dx
(x)
O(𝛥x2)(f(x)+g(x)+...) をかけたものも、やはり 𝛥x に比較して小さいので、O(𝛥x2) とでき、分母 𝛥x より小さいため、𝛥x0 の極限でこの項は落ちる。 ex) xsinx の微分
dxsinx
dx
=dx
dx
sinx+xdsinx
dx
=sinx+xcosx
このように、全体の微分を知らなくても、積に分解し、各部分の微分が分かれば全体の微分を求めることができる、ということ。 関数の積に関するこの性質をライプニッツ( Leibniz )則といい、微分に本質的な特徴である。 余談だが、数学には空間を抽象化した多様体という分野がある。各点において、接ベクトルを導入するが(イメージとしては、二次元曲面を多様体とみて、各点に接する平面を置き、その平面内のベクトルを接ベクトルと考えればよい)、その定義として、任意の関数の積についてライプニッツ則が成り立つことを採用するほど。 数式で表すと、f,g を関数、v をある写像として、v(fg)=v(f)g+fv(g)が成り立つとき、v を接ベクトルである、という。 最初はとっつきにくいが、スマートな定義だと思う。 以上、余談でした。
合成関数の微分 Chain rule
今度は、x 𝛥x だけ変化すると、合成関数 z=g(f(x)) はどれだけ変化するか?を考える。写像 f:XY 、写像 g:YZ として、y=f(x)
z=g(y)=g(f(x))
x に対する、z の変化率は、dz
dx
= 𝛥z
𝛥y
𝛥y
𝛥x
=dz
dy
dy
dx
で与えられる。微小量 𝛥x, 𝛥y 等の比で、分子と分母の約分されて消えていた項を復元してやるようなイメージ。これを、Chain rule という。 ex) バネにつながれた重りのように、一次元上を移動する物体の位置と速度を x(t), v(t), a(t) とする。dx(t)2
dt
=dx2
dx
dx
dt
=2xdx
dt
=2x(t)v(t)
dv(t)2
dt
=dv2
dv
dv
dt
=2vdv
dt
=2v(t)a(t)
後々、エネルギー積分で使う予定。 ある関数 F(x) に「微分」という操作を加えると、 dF
dx
が得られた。
dF
dx
に「微分」と逆の操作を施して F(x) を求めるような写像がありそうである。
それを「積分」と呼ぶのだが、こちらは章を改めて説明しよう。

< previous |
| next >