2017年12月10日日曜日

西川式微分方程式1章

問題提起

西川式微分方程式では、微分方程式の学習で生じる次の3つの疑問を考察します。
(疑問1)一般解というのはどういう理由で導入されるのか?
(疑問2)一般解以外の解は存在しないのか?
(疑問3)一般解をどのように選択すればよいのか?
これらの疑問を解消しない限り、解法を暗記するという学習法から脱却できません。きちんとした理解に達しない限り、シュレディンガーが水素原子の電子軌導の計算に球面調和関数やルジャンドル陪関数を用いた理由は永遠に理解できないでしょう。それは20世紀半ばの科学技術に僕たちは追いつけないというみじめな敗北を意味します。それでよいわけないですよね。

簡単な例からスタートし、僕らが微分方程式に対して抱いている漠然とした疑問を、具体的に検証したいと思います。このテキストの目的は、微分方程式の解法の意味を理解するものであって、微分方程式の解法をノウハウとして学ぶためのものではありません。僕たちが落ちこぼれた原因を解消するのが目的です。ですので、まずは、落ちこぼれた原因を整理し、問題点を共有したいと思います。そのために、普通は検討しないような別解を繰り返し紹介します。


例題1

\begin{equation}
\frac{d^2}{dx^2}  f(x)=-a^2 f(x)
\end{equation}

解法1-1(通常の教科書的な解法)

一般解 を$f(x)=C \sin⁡{\omega x}$として、代入すると、
\begin{equation}
\frac{d^2}{dx^2}  f(x)=C \frac{d^2}{dx^2} \sin{\omega x} =-C \omega^2  \sin{\omega⁡ x}=-a^2 C \sin{\omega⁡ x}
\end{equation}
$-\omega^2=-a^2$となり、
$\omega =\pm a$。よって、
\begin{equation}
f(x)=\pm C \sin{⁡ax}
\end{equation}

あとは境界条件によって係数$C$を決定します。係数$C$だけを残した形まで決定された解を基本解 と呼びます。$C$の前に$\pm$がありますが、$C$の符号の選択の問題ととらえれば、$\pm$は無視して構いません。
ま、これでも良いんですが、最初に$f(x)=C \sin{⁡\omega x}$と置く理由が全くわかりません。
例えば$f(x)=C \cos{⁡\omega x}$でも良いんじゃないか、と思うわけです。というわけで、次は、$f(x)=C \cos{⁡\omega x}$を一般解として採用してみましょう。

解法1-2(cosineを使った解法)

一般解を$f(x)=C \cos{⁡\omega x}$として、代入すると、
\begin{equation}
\frac{d^2}{dx^2} f(x)=C \frac{d^2}{dx^2} \cos{\omega ⁡x}=-C \omega^2  \cos{\omega ⁡x}=-a^2 C \cos{\omega ⁡x}
\end{equation}
$-\omega^2=-a^2$となり、
$\omega=\pm a$。よって、
\begin{equation}
f(x)=\pm C \cos{ax}
\end{equation}

で、同じように解けました。この解法は、普通の教科書でも紹介されているかもしれません。解法1-1とは、明らかに解が違います。どちらが解として正しいのでしょう?

結論を言えば、どちらも解である、ということです。通常は境界条件が設定されていて、Cを決めたり、sineかcosineかを選択します。例えば、境界条件として、$f(x)=0$というのがあれば、$f(x)=\pm C \cos{ax}$は解になることができず、$f(x)=\pm C \sin{ax}$と定まります。このような結果オーライ的な説明は、数学としては違和感があります。ただ、この2つの解で万事うまくゆくなら、それでよいのかもしれません。しかしながら、解法はこれだけではありません。

解法1-3

一般解を$f(x)=Ce^{i\omega x}$として、代入すると 、
\begin{equation}
\frac{d^2}{dx^2}  f(x)=C \frac{d^2}{dx^2} e^{i\omega x}=-\omega^2 C e^{i\omega x}=-a^2 C e^{i\omega x}
\end{equation}

$-\omega^2=-a^2$となり、
$\omega=\pm a$
よって、
\begin{equation}
f(x)=C e^{\pm iax}
\end{equation}

またまた別の解が出てきてしまいました。しかも今度は、$\pm$という記号があって、この$\pm$は係数の符号として片付けることができません。ですので、解が2つ出てきたことになります。先ほどと同様に$f(0)=1$が境界条件の場合を検討すると、$f(0)=C , C=1$となります。ただし、$f(x)=C e^{- iax}$か、$f(x)=C e^{ iax}$か決まりませんね。どちらも解として採用して良さそうですが、解法1-2の$f(x)=\cos{⁡ax}$とは違いますね。

解法1-1、1-2、1-3を総括すると、異なる一般解を用いて、同じ方程式を解くと、異なる解が得られるということになります。ですから、一般解はきちんと選択されなければならないし、天下り式に一般解を受け入れてうまく解けたとしても、他の一般解における別の解の存在を検討しなければ、ちゃんと解けたことにならない、ということがわかります。まさしく、(疑問2:般解以外の解は存在しないのか?)は当然であり、天下り式の一般解には納得いくはずもなく、他の解の可能性を排除できていないという気持ち悪さを感じないとおかしい、ということです。後でもう少し紹介しますが、この例題1に対して利用できる一般解はまだまだ存在します。その話をする前に、別パターンの例題を紹介します。

例題2

\begin{equation}
\frac{d^2}{dx^2}  f(x)=a^2 f(x)
\end{equation}


例題1と似ていますが、右辺のマイナスが取れています。それが故に、ちょっと解法が異なってきます。

解法2-1(教科書的な解法)

一般解を$f(x)=C e^{-\tau x}$として、代入すると、
\begin{equation}
\frac{d^2}{dx^2}  f(x)=C \frac{d^2}{dx^2}  e^{-\tau x}=\tau^2 C e^{-\tau x}=a^2 C e^{-\tau x}
\end{equation}
$\tau^2=a^2$となり、
$\tau=\pm a$なので、
\begin{equation}
f(x)=C e^{\pm ax}
\end{equation}

今度は指数関数を代入することで、指数関数の解が得られました。よくある境界条件は、$f(0)=1$かつ$f(\infty)=0$で、$f(x)=e^{-ax}$と決定されます。
普通の教科書では、これで終わりですが、例によって、別の一般解を使ってみます。

解法2-2

一般解を$f(x)=Ce^{i \omega x}$として、代入すると、
\begin{equation}
\frac{d^2}{dx^2}  f(x)=C \frac{d^2}{dx^2}  e^{i\omega x}=-\omega ^2 Ce^{i\omega x}=a^2 Ce^{i\omega x}
\end{equation}
 $-\omega ^2=a^2$となり、
$\omega =\pm ia$なので、
\begin{equation}
f(x)=Ce^{\mp ax}
\end{equation}

解法1-3と同じ一般解を用いました。普通は、こんな一般解は使いませんが、それでもこのようにきちんと解けます。しかも今度は、解法2-1と同じ解が得られました。(疑問3:一般解をどのように選択すればよいのか?)は結構適当で良い、という可能性が出てきました。これができるなら、逆も可能かもしれません。ということで、解法1-1と同じ一般解でトライしてみます。

解法2-3

一般解を$f(x)=C \sin{\omega x}$として、代入すると、
\begin{equation}
\frac{d^2}{dx^2}   f(x)=C \frac{d^2}{dx^2}  \sin{\omega⁡ x}=-C\omega⁡^2  \sin⁡{\omega⁡ x}=a^2 C \sin{\omega⁡ x}
\end{equation}

$-\omega⁡ ^2=a^2$となり、
$\omega⁡ =\pm ia$。よって、
\begin{equation}
f(x)=\pm C \sin{⁡iax}
\end{equation}

sineの中に、虚数単位があるというわけのわからない関数が出てきました。この関数は計算できないことはないのですが、使っているのを見たことありません。ひらめきによって、$\cos{⁡iax}$を考えて、オイラーの公式を適用してみます。
\begin{equation}
\cos{⁡iax}+i \sin{⁡iax}=e^{ax}\label{Euler}
\end{equation}

となり、$\sin{⁡iax}$は通常の指数関数をオイラーの公式でむりやり展開したときの虚数成分であることがわかります 。さらに、$\cos{⁡iax}-i \sin{⁡iax}=e^{-ax}$なので、これとの差を考えると、$\sin{⁡iax}=\frac{1}{i}\frac{e^{ax}-e^{-1x}}{2}$であり、これはすなわち、$-i\sinh{ax}$であるとわかります。
($\ref{Euler}$)式の係数に純虚数を考えれば、解法2-1にあるような指数関数と整合していないことはない、ということです。

では逆に、解法2-1で用いた一般解で例題1を解いてみましょう。

解法1-4

一般解を$f(x)=Ce^{-\tau x}$として、代入すると、
\begin{equation}
\frac{d^2}{dx^2} f(x)=C \frac{d^2}{dx^2} e^{-\tau x}= C \tau^2 e^{-\tau x}=-a^2 Ce^{-\tau x}
\end{equation}
$\tau^2=-a^2$となり、
$\tau=\pm a$。
よって、
\begin{equation}
f(x)=Ce^{\pm ax}
\end{equation}

となり、解法1-3と同じ解がでてきました。

ここから、一般解というのは、かなり緩い制約しかない、ということがわかります。ただ、使用する一般解によって、解に違いが出てきていますので、どの一般解を使うのか、ということが問題になってきます。
次は、例題1についてこれまで出てきた解を統一的に理解するということを試みますが、その前に、もう一つだけ別の解法を考えます。

解法1-5

一般解を$f(x)=C \sinh⁡{bx}$とする。$\sinh{⁡bx}=\frac{e^{bx}-e^{-bx}}{2}$なので、
\begin{equation}
\frac{d^2}{dx^2} f(x)=C \frac{d^2}{dx^2} \frac{e^{bx}-e^{-bx}}{2}=b^2 C \frac{e^{bx}-e^{-bx}}{2}=-a^2 C \frac{e^{bx}-e^{-bx}}{2}
\end{equation}
$b^2=-a^2$となり、
$b=\pm ia$。
よって、
\begin{equation}
f(x)=C \frac{e^{\pm iax}-e^{\mp iax}}{2}=-Ci \sin{⁡\pm ax}
\end{equation}
最後は、オイラーの公式を使って、sineに書き直しました。Cに純虚数を考えれば、解法1-1と同じです。一般解として$f(x)=C \cosh{⁡bx}$から出発すると、$f(x)=C \cos{⁡ax}$が得られます。

こうしてみると、一般解にはいろんなものが使えるということがわかります。でも、どんなものでOKかというとそういうわけではありません。例えば、$C\tan{\omega x}$とか$ C\log{\tau x}$を一般解として使ってみましょう。

解法1-6

例題1において、一般解を$f(x)=C\tan{\omega x}$とする。
\begin{equation}
\frac{d}{dx}f(x)=C\frac{d}{dx}\tan{\omega x}=C\omega\frac{1}{\cos^2{\omega x}}
\end{equation}
\begin{equation}
\frac{d^2}{{dx}^2}f(x)=C\omega\frac{d}{dx}\frac{1}{\cos^2{\omega x}}=C\omega^2\frac{-2\sin{\omega x}}{\cos^3{\omega x}}=-a^2C\frac{\sin{\omega x}}{\cos{\omega x}}
\end{equation}
なので、$\omega^2\frac{2}{\cos^2{\omega x}}=a^2$。
左辺に$x$が残っているので、微分方程式を常に満たす関数は、$f(x)=C\tan{\omega x}$の形式では表せない。

解法1-7

例題1において、一般解を$f(x)=\ C\log{\tau x}$とする。
\begin{equation}
\frac{d}{dx}f(x)=C\frac{d}{dx}\ \log{\tau x}=C\tau\frac{1}{\tau x}
\end{equation}
\begin{equation}
\frac{d^2}{{dx}^2}f(x)=C\tau\frac{d}{dx}\frac{1}{\tau x}=C\frac{-1}{x^2}=-a^2C\log{\tau x}
\end{equation}
なので、$\frac{1}{x^2\log{\tau x}}=a^2$。
左辺に$x$が残っているので、微分方程式を常に満たす関数は、$f(x)=\ C\log{\tau x}$の形式では表せない。

このように、多くの関数が一般解として使える一方、一般解に使えない関数があることが確認できました。一般解として使える関数にはどのような条件があるのでしょう。また、微分方程式の解として様々なものが得られました。実用上は与えられた境界条件を満たす解を選択するわけですが、結果オーライ・ご都合主義な感じがします。本当に解けているのか不安になります。

解をまとめる

さて、解法1-1~5において、$C \sin{⁡ax}$、$C \cos⁡{ax}$、$Ce^{\pm iax}$という解が得られました。さらに、$C \sin{⁡ax}=\frac{C}{i}  \frac{e^{iax}-e^{-iax}}{2}$であることがわかっています。つまり、例題1-5の解は例題1-3の解($Ce^{\pm iax}$)の和であって、係数Cが虚数であるということです。
同様にこれまでに得られたすべての解が$Ce^{±iax}$の和として表すことができることに気づくかもしません。これらから、係数Cとして複素数を許し、$C_1 e^{iax}+C_2 e^{-iax}$とすれば、これまで出てきた解をすべて包括するような気がします。しかしながら、$C_1 e^{iax}$と$C_2 e^{-iax}$の足し算が許されるかどうか、は自明ではないような気がします。また、係数$C$が複素数でも大丈夫かというのは確かめておかないといけない気がします。まず、簡単な後者からやっつけておきましょう。

$C=c+id$とすると、$Ce^iax=ce^iax+id e^iax$です。これを元々の微分方程式に代入します。
\begin{equation}
\frac{d^2}{dx^2}  f(x)=\frac{d^2}{dx^2}  \{ce^iax+id e^iax \}\\
=-ca^2 e^iax-ida^2 e^iax=-a^2 (ce^iax+id e^iax )=-a^2 f(x)
\end{equation}
となり、例題1の微分方程式を自動的に満たします。

次に、個別の解の和が解になれるかどうかを調べます。

$f(x)=C_1 e^iax+C_2 e^{-iax}$とすれば、
\begin{equation}
\frac{d^2}{dx^2}  f(x)=\frac{d^2}{dx^2} \{C_1 e^iax+C_2  e^{-iax} \}=-C_1 a^2 e^iax-C_2 a^2 e^(-iax)=-a^2 (C_1 e^iax+C_2  e^{-iax} )=-a^2 f(x)
\end{equation}
となり、例題1の微分方程式を自動的に満たします。ですから、$f(x)=C_1 e^{iax}+C_2 e^{-iax}$とすれば、これまで出てきた解をすべて包括することができます。だから一般解としては、$f(x)=C_1 e^{i\omega x}+C_2 e^{-i\omega x}$を使うべきかもしれないという予想がたちます。
ここに至り、(疑問2:一般解以外の解は存在しないのか?)はますます深刻です。調べれば調べるほど、似ているけれどちょっと違う解が見つかるということは、例題1を$f(x)=C \sin{\omega x}$として解くのでは不足であると結論されます。そして、すべての解を調べつくしているのかどうか疑わしくなります。さらに、(疑問3:一般解をどのように選択すればよいのか?)に対する演繹的な答えは絶望的に見えてきます。

一次結合と線形微分方程式の説明

例題1-3や例題1-4では、$f\left(x\right)Ce^{\pm i a x}$が解として得られており、$f\left(x\right)=C_1e^{iax}+C_2e^{-iax}$に近いですが、得られた二つの解の和が解として成立するかどうかについて、明示的な指針はありません。しかしながら、線形の微分方程式の場合、すべての基本解の一次結合も解として有効である、というのが常識とされています。

こういう言い方は因果関係がおかしくて、正しくは、基本解の一次結合が解として有効であるような微分方程式を線形微分方程式と呼ぶのです 。一次結合というのは、線形和とも呼ばれ、二つ以上の数式やベクトルに対して定義されます。例えば、数式$f_1\left(x\right)とf_2\left(x\right)$があったとして、一次結合というのは、係数$C_1$と$C_2$を使って、$C_1f_1\left(x\right)+C_2f_2\left(x\right)$のようにあらわされた数式のことを言います。

今、基本解として、$f_1\left(x\right)とf_2\left(x\right)$があったとして、例題1の微分方程式$\frac{d^2}{{dx}^2}f\left(x\right)=-a^2f\left(x\right)$をどちらも満たすとします。であるなら、
\begin{equation}
\frac{d^2}{{dx}^2}f_1\left(x\right)=-a^2f_1\left(x\right)かつ\frac{d^2}{{dx}^2}f_2\left(x\right)=-a^2f_2\left(x\right)
\end{equation}
が成立します。それぞれ係数$C_1$と$C_2$をかけてやって、
\begin{equation}\frac{d^2}{{dx}^2}C_1f_1\left(x\right)=-a^2C_1f_1\left(x\right)\end{equation}
\begin{equation}
\frac{d^2}{{dx}^2}C_2f_2\left(x\right)=-a^2{C_2f}_2\left(x\right)
\end{equation}
が成立するのは、当たり前だし、二つの式を足してやって、
\begin{equation}
\frac{d^2}{{dx}^2}C_1f_1\left(x\right)+\frac{d^2}{{dx}^2}C_2f_2\left(x\right)=-a^2C_1f_1\left(x\right)-a^2{C_2f}_2\left(x\right)
\end{equation}
が成立するのも当たり前です。少し式を整理すれば、
\begin{equation}
\frac{d^2}{{dx}^2}\left\{C_1f_1\left(x\right)+C_2f_2\left(x\right)\right\}=-a^2\left\{C_1f_1\left(x\right)+{C_2f}_2\left(x\right)\right\}
\end{equation}
つまり、$C_1 f_1\left(x\right)+C_2 f_2\left(x\right)が\frac{d^2}{{dx}^2}f\left(x\right)=-a^2f\left(x\right)$を満たしているという式になります。すべての微分方程式において、このように基本解の一次結合(線形和)が解となるわけではありません。線形和が解になるかどうかは、その性質は元の微分方程式の形で決まっており、基本解の一次結合が自動的に解となるような微分方程式を線形微分方程式と呼びます。
逆に、微分方程式が線形かどうかは、2つの基本解を仮定してやって、微分方程式に代入し、和を計算してやればわかります。例えば、$\frac{d}{dx}f\left(x\right)={f\left(x\right)}^2$を考えてやると、
\begin{equation}
\frac{d}{dx}f_1\left(x\right)={f_1\left(x\right)}^2
\end{equation}
\begin{equation}
\frac{d}{dx}f_2\left(x\right)={f_2\left(x\right)}^2
\end{equation}
が成り立っているとして、両辺の和を取ります。
\begin{equation}
\frac{d}{dx}f_1\left(x\right)+\frac{d}{dx}f_2\left(x\right)={f_1\left(x\right)}^2+{f_2\left(x\right)}^2
\end{equation}
となります。右辺はどうあがいても、$f_1\left(x\right)+f_2\left(x\right)$だけで表すことができません。ですので、$\frac{d}{dx}f\left(x\right)={f\left(x\right)}^2$は線形微分方程式ではない=非線形微分方程式である、と結論できます。ある微分方程式が線形か非線形かはパッと見ではわからないことがあります。つまり、式を見ただけで線形・非線形を判断するのは危険ということです。

非同次の線形微分方程式

線形微分方程式では、基本解が複数得られた場合、基本解の線形和がすべて解の候補になります。線形和の場合、それぞれの項に係数を付けることができるので、最終的な解を求めるときは、係数を決定する、という作業が必要になります。一般に、線形和の係数を決定するという作業は、境界条件を参考にしながら行います。

これまで議論してきた微分方程式において、$f(x)=0$は常に成り立つことはすぐにわかります。だから、$f(x)=0$は自明な解として問題にしませんでした。しかしながら、世の中には、$f(x)=0$が解になり得ない微分方程式も存在します。$f(x)=0$が解になるかどうかによって解法が少し違ってくるので、それぞれに名前を付けて区別します。$f(x)=0$が解になるタイプの微分方程式を「同次」と呼び、$f(x)=0$が解にならないタイプの微分方程式を「非同次」と呼びます。当然、「同次」より「非同次」の方が難しくなります。

前節で出てきた線形/非線形の定義によれば、ほとんどの「非同次」な微分方程式は「非線形」ということになってしまいますが、「線形」の定義をすこし拡張し、非同次の線形微分方程式の範囲をすこし増やすのが通常です。それは非同次微分方程式の解法に由来します。まず、次のような非同次な微分方程式を考えます。
\begin{equation}
\sum_{n=0}^{N} k_n \frac{d^n}{dx^n} f(x) =q(x)
\end{equation}
のように、$f(x)$に関する部分とそれ以外に式を分けます。左辺は十分に一般化されていませんが、通常はこの程度の一般化で十分なはずです。この微分方程式の解を複数考えて、足し合わせると、左辺が$2q(x)$になるので、元の方程式を満たさないことがわかります。つまり、前節の定義では「非線形」です。
しかしながら、右辺を0として、
\begin{equation}
\sum_{n=0}^{N} k_n \frac{d^n}{dx^n} f(x)=0
\end{equation}
と置くと、これは「線形」です。微分方程式において、$f(x)$に関する項とそうでない項をそれぞれ左右にまとめあげて、$f(x)$に関する項を0とした微分方程式が線形であるとき、特別に「非同次線形微分方程式」と呼びます。というのも、非同次線形微分方程式は線形微分方程式の応用で解くことができるからです。

非同次線形微分方程式を解く場合には、まず、無理やりにでも1個だけ解を見つけます。例えば、$q(x)$が多項式だとしめたものです。
微分の次数の上限は$N$であることを鑑み$f(x)=\sum_{n=0}^{N} a_n x^n$と置くと、ちょっとした計算で左辺が次のように変形できます。
\begin{equation}
\sum_{m=0}^{N} k_m \sum_{n=m}^{N} a_n \frac{n!}{(n-m)!} x^{n-m}
\end{equation}
これと$q(x)$とを比較すれば、$a_n$を決定できます。こうして得られた解を$f_0(x)$とします。この$f_0(x)$は言わば「割り算のあまり」のようなものです。
非同次線形微分方程式の線形部分の解は
\begin{equation}
\sum_{n=0}^{N} k_n \frac{d^n}{dx^n} f(x)=0\end{equation}
を満たすので、いくら足しても方程式は変わりません。だから、余分に$f_0(x)$を足してやると自動的に$\sum_{n=0}^{N} k_n \frac{d^n}{dx^n} f(x)=q(x)$を満たすようになります。すなわち、大部分の解は線形部分の解で、それらに「あまり」を足してあげるわけです。

例題3

具体的に非同次線形微分方程式を提示し、調べてみましょう。
\begin{equation}
\frac{d}{dx}f\left(x\right)-5f\left(x\right)+3x=0
\end{equation}
今までの例題に対して余計な3xがついている、というパターンです。これがなければ、これまでと同様、適当に一般解を選べば、問題なく解けます。

解法3-1

直感によっ$f(x)$が多項式であると考えて、せいぜい2次くらいだろうということで、$f\left(x\right)=ax^2+bx+c$とする。これを元の微分方程式に代入してみる。
\begin{equation}
\frac{d}{dx}f\left(x\right)-5f\left(x\right)+3x=2ax+b-5ax^2-5bx-5c+3x=0
\end{equation}
すべての$x$について成立しなければならないので、
$-5a=0,\ 2a-5b+3=0,\ b-5c=0$となる。すなわち、
$a=0,\ b=3/5,\ 5c=3/25$で、$f\left(x\right)=\frac{3}{5}x+\frac{3}{25}$は一つの解である。確かにこれは、例題3の微分方程式を満たす。これを特別解と呼ぶ。
一方、これまでの解法と同様に$\frac{d}{dx}f\left(x\right)-5f\left(x\right)=0$には他の解がある。もし、$\frac{d}{dx}f\left(x\right)-5f\left(x\right)=0$が成り立つ解があれば、これを先の特殊解に足したものも解として使える。なので、$\frac{d}{dx}f\left(x\right)-5f\left(x\right)=0$を解くことにしよう。
一般解を$f\left(x\right)=Ce^{\tau x}$として、代入すると、
\begin{equation}
\frac{d}{dx}f\left(x\right)-5f\left(x\right)=\tau Ce^{\tau x}-5Ce^{\tau x}=\left(\tau-5\right)\ Ce^{\tau x}=0
\end{equation}
$\tau=5$となり、
よって、
\begin{equation}f\left(x\right)=Ce^{5x}\end{equation}
このようにして求めた解は、同次解と呼ばれている。
同次解と特殊解の和が解となるので、最終的に、
\begin{equation}
f\left(x\right)=Ce^{5x}+\frac{3}{5}x+\frac{3}{25}
\end{equation}
が得られる。

この解法におけるポイントは、$\frac{d}{dx}f\left(x\right)-5f\left(x\right)+3x=0$を
\begin{equation}
\frac{d}{dx}f\left(x\right)-5f\left(x\right)=-3x
\end{equation}
\begin{equation}
\frac{d}{dx}f\left(x\right)-5f\left(x\right)=0
\end{equation}
の二つの方程式の和と考える点にあります。元々の方程式は線形なので、解をいくら足しても解として成立します。ただし、上側の式には$-3x$だけ余りがあります。なので、あまりの部分を別枠で計算することにします。それが$f\left(x\right)=\frac{3}{5}x+\frac{3}{25}$です。この解は絶対必要です。さらに下側の式から出てくる同次解をオプション的に付け足してもかまいません。オプションを付け足すかどうかは境界条件で決まります。
例題3のように「余り」のある場合、特殊解という「余り」の条件を満たす解を足してやることで、うまく解が表せる、というのは線形微分方程式の特性を利用しています。ただ、ここに至って特殊解の求め方に、「直感」が導入されており、またしても天下り的な要素が出てきてしまいました。この直感の部分はいかんともしがたいものです。さらに、直感で解かれた特殊解が唯一無二のものかどうかははっきりしません。また、特殊解と同次解の和以外のパターンの解は検討していませんから、得られた最終解がすべてのパターンを網羅しているかどうかは、不明なままです。つまり、本当に解けているのかどうかわからない、という状態です。


解法3-2

通常の教科書を見ると、同次解を求めるために特性方程式というものを使うことがあります。特性方程式とは微分方程式に含まれる任意の次数の微分を対応する対応する次数のn乗の記号に割り当てるテクニックです。
特別解の求め方は解法3-1と同じとする。
同次解$\frac{d}{dx}f\left(x\right)-5f\left(x\right)=0$については、対応する特性方程式を考える。すなわち、$\frac{d}{dx}f\left(x\right)$を$t$の1乗、$f\left(x\right)$を$t$の0乗で置き換える。すると、次式を得る。
\begin{equation}t-5=0\end{equation}
これを解いて、$t=5$から
\begin{equation}f\left(x\right)=Ce^{5x}\end{equation}
以下略


実は、特性方程式というのは、$f\left(x\right)$で割り算してから、$\frac{d}{dx}$を$t$、$\frac{d^2}{{dx}^2}$を$t^2$というように機械的に置き換えてやって、多項式を作成することで、半自動的に微分方程式を解くテクニックです。このテクニックの根底にあるのは、一般解が$f\left(x\right)=Ce^{tx}$であることが前提ということです。$f\left(x\right)=Ce^{tx}$であると考えれば、一次微分や二次微分で、$t$や$t^2$が出てきます。途中で$Ce^{tx}$を割り算するというのがわかっているので、最初から割り算しておこう、という手抜きです。先に手抜きを教わってしまうので、わけがわからなくなるという理屈です。特性方程式というのは労力を端折るためだけのものなので、特にこだわる必要はないと、僕は思います 。

特性方程式にも学ぶ点があります。微分方程式を機械的に特性方程式に変換してよいということは、一般解を$f\left(x\right)=Ce^{tx}$に決め打ちしてよい、ということに他なりません。これまで見てきたように、普段は$f\left(x\right)=C\ \sin{\omega x}$ を一般解に用いるような場合であっても、$f\left(x\right)=Ce^{tx}$を一般解にして解くことができます。なので、$f\left(x\right)=Ce^{tx}$を一般解にもちいることは、一般性を失わない、ということだと推測できます。

この章のまとめ

ということで、わかったことは、一般解は普通$f\left(x\right)=Ce^{tx}$を使うとよい、ということです。その他の一般解で解いたとしても結果は同じになるのです。$t$は複素数であってもかまいませんから、$f\left(x\right)=Ce^{i\omega x}$を一般解に使ってもOKです。ただし、この場合、特性方程式は虚数単位を含むことになり、解き方は変わりませんが、ちょっと違和感があります。ただ、答えは同じです。

特性方程式に見られるように、実のところ、一般解を天下り式に受け入れると、基本解はほとんど自動的に求まります。ですので、微分方程式を解くという作業の大半は、境界条件を満たすように、基本解の係数を決定する、という作業が占めます。また、解法2-3や解法1-4で示したように、一般解が少々雑でも、基本解をちゃんと求めることができます。だから、少々強引でも天下り式に一般解を導入しても結果に影響はないんだ、ということで、一般解に関する議論を避けているような気がします。
それでもやっぱり、解法1-1と解法1-2は排他的な解であり、片方だけしか検討しないなら、すべての可能性を考慮したことにはなりません。そういうことが実際にあるのだから、複数の解法をいくら示しても、別の解がある可能性を払しょくできません。やっぱり解けていないんじゃないか、という気持ち悪さが残ります。

まずは、一般解をこのように決め打ちしてよい理由を説明したいと思いますが、そのためには、線形微分方程式の解き方の「フルバージョン」を示す必要があります。フルバージョンの説明には、実はフーリエ級数などの級数展開の話をしなくてはいけません。

2017年12月2日土曜日

アルゴリズムを数式に接続する

きっかけ

最近、「素数の音楽」という本を読んで、その中で「すべての素数を生み出す数式」というのが紹介されていたのに強いインスピレーションを受けた。普通の数式ではないが、明らかに多項式で、不思議な数式だ。この数式がどのようにして得られたのかにも興味をそそられるが、たぶん、僕の知力では追いつかないだろう。それよりも、素数を生み出すというようなアルゴリズム的な機能を数式に落とし込んでいるという点に感銘を受けた。そして、僕はどのような課題をクリアすれば、アルゴリズムを数式に落とし込めるだろうかと考え始めた。すぐにアイデアが浮かび、詳細を詰めた。全てではないが、単純なアルゴリズムであれば、比較的容易に落とし込みが可能だと今は思っている。

素数公式

今や電子暗号技術の根幹を成す素数は、数学のみならず全ての人類にとって重要な問題となっている。特に数学では、ギリシア時代から延々と議論が続いている。例えば、「ある数N以下の素数はいくつあるか」という素数の数え上げ問題などだ。
素数の数え上げ問題に最初に肉薄したのは、カール・フリードリヒ・ガウスだ。$N$以下の素数の数を$\pi$とおくと
\begin{equation}\pi\left(N\right)\propto \log{N}\end{equation}
という大まかな分布にたどり着いた。実際には、もう少し詳しいところまで到達しているが、驚くべきはその成果が若干15歳で達成されたことだ。ガウスの天才が規格外であることを示すエピソードとして有名だ。
以来、多くの数学者が素数の数え上げ問題にかかわったが、転機となったのはゲオルク・フリードリヒ・ベルンハルト・リーマンだ。リーマンは素数の数え上げに言及し、おそらく完全に素数の数え上げに対応する関数を示した。
リーマンの示した方法で素数の数え上げを行うには、ゼータ関数の非自明な0点がある特徴的な直線に並んでいる必要があることがわかっており、「リーマン予想」と呼ばれている。人類が調査可能な範囲において、リーマン予想は正しいことがわかっているが、リーマン予想が「完全に」正しいという証明は存在していない。このリーマン予想を証明することは数学における大問題となっている。ま、僕にはよくわからない世界だ。

リーマン予想は証明されない方が人類にとって良いかもしれないという意見もある。リーマン予想が正しいとなると、我々は素数を見つけるためのもう一つのアルゴリズムを手にすることになる。現在の暗号技術は素数を見つけるのが困難だという数学的経験則に基づいて成立しているのだが、リーマン予想によって別の素数探索法が現れる可能性がでてくる。すると、これまでの経験則が崩れて暗号技術全体が崩壊する可能性が出てくる、というのだ。

素数の探索

素数の探索は、プログラミングの格好の教材で、プログラマなら何度かつくったことがあるだろう。もっとも単純なものは次のようなものだ

ある数Nが素数かどうかを調べるために、Nを2~N‐1までの整数で割り算し、割り切れるかどうかを調べる。もし、一度も割り切れなければNは素数である。

JavaScriptで書けば次のようになるだろう。
function IsPrime(N) {
    var i
    for(i=2; i<N; i++) {
    if( (N % i)==0) return 0;
    }
    return 1;
}

話の都合上、$IsPrime$関数は$N$が素数の時に1を返し、素数でない時は0を返す関数として設計してある。
これは最も単純なので、計算に無駄が多い。計算の無駄を少なくすることでプログラムを高速化する手段はいくつも存在するので、素数の探索プログラムは、アルゴリズムの性能アップを学ぶ格好の題材なのだ。僕の目的はアルゴリズムを数式に変換することなので、もとになるアルゴリズムは効率よりも単純さが重要だ。だから、これでよい。

素数判定アルゴリズムを使うと素数の数え上げが簡単に作成できる。すなわち、
\begin{equation} \pi\left(x\right)=\sum_{N=2}^{x} IsPrime(N) \label{algopi} \end{equation}
一方リーマンの素数公式はもっと複雑で、
\begin{equation}
{\displaystyle \pi (x)=\sum _{m\leqq \log _{2}x}{\frac {\mu (m)}{m}}\left({\rm {li}}(x^{\frac {1}{m}})-\sum _{\rho }{\rm {li}}(x^{\frac {\rho }{m}})-\log 2+\int _{x^{\frac {1}{m}}}^{\infty }{\frac {dt}{t(t^{2}-1)\log t}}\right)}
\label{Riemann}
\end{equation}

になるらしい(Wikipediaより)。


アルゴリズムを数式にする

アルゴリズムによる素数の数え上げ式($\ref{algopi}$)とリーマンの素数公式($\ref{Riemann}$)は、複雑さが段違いということにすぐ気づく。リーマン予想が正しいとすると両者は同じ値を与える関数であるはずだ。ということは、両者の複雑さの違いは$IsPrime$関数に由来する。もし、$IsPrime$関数を普通の式で書き下せば、リーマンの素数公式に一致(あるいは類似)するのだろうか?という疑問を僕は持った。
ということで、$IsPrime$関数を数式に変換することを考えよう。Javascriptで例示したプログラムでは、for構文とif構文が1回ずつ使われている。これらを数式に置き換えることができるだろうか?
for構文の部分は$\sum_{i=2}^{N-1}$に極めて近い。$\sum$は和をとるが、プログラムでは、実は論理積がとられている。なので、積をとる$\prod$の方が近い。つまり、
\begin{equation}
\prod_{i=2}^{N-1} if\left(mod(N,i)\ne 0\right)
\end{equation}
ただし、$mod(N,i)$は$N$を$i$で割った時の余りを値とする関数とする。また、$if$関数は
\begin{equation}
if(x)=\left\{\begin{matrix}0&{if\ x\ is\ false}\\1&{if\ x\ is\ true}\end{matrix}\right.
\end{equation}
となっていると都合がよい。
ここで定義した$if$関数はプログラミングテクニックとして比較的なじみ深いもので、いくつかの言語では条件分岐に関してこのような実装を行っている。
さて問題は、このような$if$関数が通常の演算で実現できるだろうか?ということだ。リーマンの素数公式で使われている数学要素は、足し算、引き算、掛け算、割り算、積分、複素数、無限といったところだ。だから、僕たちは$IsPrime$関数をこれらの要素で構成しなければならないだろう。$if$関数に極めて近い関数に、$sgn$関数がある。
\begin{equation} sgn\ x =\left\{ \begin{matrix}-1&{if\ x\lt 0}\\0&{if\ x=0}\\1&{if\ x\gt 0}\end{matrix}\right. \end{equation}
$sgn$関数は別名を符号関数という。極めて便利だけど、残念ながら人工的すぎて、上述の数学要素で直接構成できるわけではない。この$sgn$関数に似た関数の一つにHilbert変換のインパルス応答関数$H(q)$がある。
\begin{equation} H(q) =\left\{\begin{matrix}-i&{if\ q\lt 0}\\0&{if\ x=0}\\i&{if\ q\gt 0}\end{matrix}\right. \end{equation}
これはインパルス応答関数なので、実空間のタイプがあって、
\begin{equation} H(q) =\int_{-\infty}^{\infty} \frac{1}{x}e^{-iqx}dx
\end{equation}
であれば、if関数に類似のものを次のように定義できる。
\begin{equation} if^\prime (x)=\frac{1}{2}+\frac{1}{2i}H(x)
\end{equation}
ただし、0のところだけ、違っている。引数が整数に限定される場合には、
\begin{equation} if (x) \sim if^\prime (x+\delta)\ where\ -1\lt \delta\lt 1
\label{iffunc}
\end{equation}
数学における4つの不等号$\lt,\le,\gt,\ge$に応じて$\delta$が選択される。
数学的な美しさというものが存在するなら、$\delta = \frac{1}{2}$とするのが良いかもしれない。
もし$\delta$関数が使えるなら、$if^\prime$関数は次のようにしてもよい。
\begin{equation}
if^\prime\left(x\right)=\int_{-\infty}^{x}{\delta\left(x\right)dx}
\end{equation}
これは、ヘビサイド関数として知られている。要は、$if^\prime$関数というのは、極めて人工的だけれど、通常の数学の概念と親和性があるということだ。

余りを計算する

プログラムに見られる構文は2つだけだが、実は余りの計算がもう一つの関門になっている。あまりの計算は通常の演算では作り出せない。そこで、$N$を$M$で割ったときの余りを返す$mod(N,M)$という関数を$if$関数を使って構成することを考える。
当たり前のことだけど、$N=pM+r$を満たす$0\le r\lt M$なる$r$を見つけることがミッションになる。いろんな方法が考えられるが先に$p$を見つけることを考えた方が実は近道かもしれない。すなわち、$r=N-pM$というわけだ。$p$を見つける最もシンプルな方法の一つが次の数式だ。
\begin{equation}
p=\sum_{m=0}^{\infty}if(N-mM)
\end{equation}
これを使うと$mod$関数は簡単で、
\begin{equation}
mod(N,M)=N-M\sum_{m=0}^{\infty}if(N-mM)
\end{equation}
以上をまとめると、
\begin{equation}
IsPrime(N)=1-if\left(\prod_{M=2}^{N-1}mod(N,M)\right)
\end{equation}
となる。
めだたく、新しい素数公式が次のように得られる。
\begin{equation}
\pi(N)=\sum_{n=2}^{N}\left\{1-if\left(\prod_{M=2}^{N-1}\left[n-M\sum_{m=0}^{\infty}if(n-mM)\right]\right)\right\}
\label{final}
\end{equation}

これは素数公式か?

アルゴリズムから出発したので、上式は素数公式であることが確実だ。ただし、$if$関数にフーリエ変換があり、精密な数値計算には向かない。また、途中に∞個の総和があり、計算量の見通しが難しい。また、アルゴリズムが有する計算量を完全に反映する。もっとも愚直なアルゴリズムから出発しているため、効率の面では最低だ。
この式の計算を進め、欠点を補えれば、使い物になるかもしれないが、僕は悲観的だ。重要なのは実用面ではなく、アルゴリズムを普通の解析関数に落とし込んだ点だと僕は思っている。ここまで落とし込めば、アルゴリズムという散文的な概念を数式という伝統的な数学で議論することが可能になるからだ。
リーマンの素数公式の驚くべき点は、素数という典型的な数論の概念を解析関数という別の数学概念に接続している点だ。ここで議論した$mod$関数は数論の世界を解析接続するための基本ツールの一つだ。もう一つのツールは$if$関数だ。ここでは$if$関数を使って$mod$関数を構成したが、その逆も可能だ。そこから、$if$関数と$mod$関数はある種の「同値」関係にあることがうかがえる。

ここに至り、僕は一つの仮説を持っている。リーマンの素数公式というのは、ある種のアルゴリズムを解析接続したものだというものだ。リーマン予想を証明する代わりに、素数探索アルゴリズムの解析接続をいろいろ試すというアプローチがあるんじゃないだろうか。僕は$if$関数を梃子にしたが、それはプログラマとしてはとても自然な発想だ。でも、$mod$関数が$if$関数で構成できるように、梃子として用いることができる数学的ツールはほかにもあるだろうことがうかがえる。

僕がここであらたに導入したのは本質的に$if$関数だけなのだけど、$if$関数だけですべてのアルゴリズムを伝統的な解析関数に変換できるかは不明だ。というのも、プログラミングの世界ではプログラミング言語として万能性を持つために必須な要素というのはもう少し多いからだ。ただ、最小チューリングマシンが極めてシンプルに構成できるという事実は僕たちにとって朗報だ。論理的には最小チューリングマシンの要素をすべてカバーする変換ツールを用意できれば、すべてのアルゴリズムが解析接続できることになるのだから!それは新しいパラダイムを提供するはずだ。

リーマン予想についてのコメント

式($\ref{final}$)とリーマンの素数公式が同じものだと考えると、$if$関数とゼータ関数が何らかの対応を持つことになる。そう思うとリーマン予想についていくつかの推測が得られる。式($\ref{iffunc}$)にあるように、$if^\prime$関数の引数が0になることを避けるために、不自然なオフセットが付け加える必要がある。そのオフセットはある範囲で自由であり、それを$1/2$とするのは自然に思える。逆に言うと、$1/2$でなくてもい。リーマン予想はゼータ関数の0点の実部が$1/2$であるというものであるが、それが$if^\prime$関数に付け加えるオフセットと対応するかもしれない。
例えば、式($\ref{final}$)に半整数を入力してみると、計算が破たんする。そうした破たんは半整数の場合にだけ顕著に生じる。つまり、特異点だ。ただし、入力が素数-1/2の時は、$if^\prime$関数が0になることがない。リーマン予想の$1/2$が式($\ref{iffunc}$)で付け足した$1/2$と対応しそうな感じがするでしょ?
そうすると、ゼータ関数の0点が$1/2$である必然性はないことになる。つまり、$if^\prime$のオフセットと同様に1以下の一定値であればよい、という話かもしれない。であれば、なぜ$1/2$なのかを説明するのは極めて難しいということが推測される。まずは、一定値だということを示すべきなんだろう。
$if^\prime$関数が0になるとは、約数を持つ=素数でないということだから、ゼータ関数の0点も素数でないことを示しているのかもしれない。0点という特別な性質なんだから、特別な性質をもつ素数と何らかの対応を持つだろう、と勝手に思い込んでしまっていないだろうか。式($\ref{iffunc}$)は、そういう先入観とは真逆の可能性を強く示唆していると思う。であれば、ゼータ関数の0点がほぼ等間隔である理由も思い当たる。ゼータ関数の0点はエラトステネスのふるいであるかもしれないということだ。ふるいの目(穴)は等間隔に開いているものだ。
すでに指摘したがリーマンの素数公式は数論の問題を解析接続してしまうという驚きの成果であり、どうしてもそれに目を奪われてしまう。つまり、意味がきちんとしているのは整数の入力だけなのに、複素数の入力が許されてしまうためのにそこに惑わされるのだ。$if$関数を定義するためにどうしても複素数の計算が出てきてしまうわけだが、それがゆえに式($\ref{final}$)も複素数の入力を許してしまう。意味がないとは知りつつ、複素数を入力を試してしまい、その不思議な光景に目を奪われるのだ。

マイルストーン

現時点では、$if$関数以外のツールを僕たちは手にしていないが、どのようなツールが可能かについてちょっとしたアイデアがある。NHKの白熱教室のエドワードフレンケル教授の回でラングランズプログラムの例として、ある方程式の解の数を多項式の係数として得るという奇妙な数式が紹介された。その時は全く理解不能だったが、それはアルゴリズムを数式に変換する全く別の形態であるという気がしている。
プログラマの視点からすると、$if$関数と不自由なループしか使えないというのでは、万能性からは程遠いと言わざるをえない。プログラミング言語が万能性を持つには、複数の変数を取り扱う手段がほしいところだ。なので、アルゴリズムを数式に変換するツールとして、複数の数値を交差計算するツールがほしいということになる。その一つの方法として、代数式の係数が使える。つまり、因数分解された多項式の括弧を外す際に各多項式の複数の係数の積和が実施される。どの係数とどの係数をかけ合わせるかは、変数の次数が制御する。それはある種のアルゴリズムを構成する。
このアイデアを一般化するために、テンソルが応用できる。例えば、2階のテンソルは、2次の多項式と対応させることができるが、それは一つの行列で特徴づけることができる。同様にn階のテンソルは、n階の行列で特徴づけることができる。すなわち、変数に対応するベクトルに対し、n階のテンソルの和を考えることで、あらゆる代数式を構成できるだろう。
これまで僕たちはアルゴリズムを一つの値を出力する一つの関数に表現するとしてきたが、そのようなスタイルに適合するアルゴリズムは極めて限定的だ。例えば、ワードプロセッサはそのようなフォーマットにはそぐわないのは明らかだ。別の表現形式として、多項式の係数を利用するということも悪くない。すなわちそれが、NHKの白熱教室で紹介された奇妙な多項式の背後にある数学だと直感している。もしかすると、その方が簡単かもしれない。そのようなテンソル形式で$if$関数を構成するには無限階のテンソルが必要になる。予想としてはそのようなテンソルを使えば、ワードプロセッサのような複雑なソフトウェアを含むあらゆるアルゴリズムを一つの数式として得ることができるだろう、ということだ。

2017年11月12日日曜日

西川式微分方程式0章

西川式:微分方程式と線形応答

ずいぶん昔に、学生向けにテキストを書いていました。大学院でも似た内容の講義をするので、Web版を作ったら、みんな読めるかな?ちょっと長いので、連載形式にして、章ごとに公開します。今回はプレビューというか、予告編というか、そんな程度です。


はじめに

大学で学ぶ数学・物理において、微分方程式は極めて重要です。しかしながら、なかなか理解するのが大変で、微分方程式が解けるかどうかというのが、学生にとって一つの関門になっています。僕自身も長年納得がいかず、大変苦労しました。ただ、その苦労の大半は、ちゃんとした説明があれば、必要ないものでした。だから、テキストにまとめることによって、多くの人が僕のような苦労をせずに済むようにしたいと思っています。

このテキストは、大学で学ぶ微分方程式の講義についていけなかった人、疑問だらけで納得がいかない人、そういった落ちこぼれチックな人のためのものです。微分方程式なんて、チャラいよ~、という人は読む必要はありません。きっと頭がすごく良いのでしょう。微分方程式の解法は数学者たちが1000年かかって作り上げてきた人類の至宝です。その極意をたった1年かそこらで理解できる超天才に僕が教えることなどないでしょう。
それから、一旦、他の教科書や講義で微分方程式を学んでおいてください。僕のテキストは微分方程式を学ぶ中で生じる違和感を共有しているという前提で書かれています。その違和感を持っていないと、面白さがわからないかもしれません。

できない子の論理

微分方程式を解く場合、天下り式に一般解というのを代入してみて、一般解に付随している係数を決める、ということを行います。このとき、いくつかの疑問が発生します。
(疑問1)一般解というのはどういう理由で導入されるのか?
(疑問2)一般解以外の解は存在しないのか?
あとでも詳しく例示しますが、
\begin{equation}
\frac{d^2}{dx^2} y = -a^2 y
\end{equation}
のとき、$y=\sin{⁡bx}$とおいて、$a$と$b$の関係を求めます。(疑問1)はなぜ$y=\sin{⁡bx}$とおくという発想に至るのか?という疑問です。そして(疑問2)は$y=\sin{⁡bx}$ではなくて、$y=\cos{⁡bx}$とか、$y=\log{⁡bx}$ではだめなのか?という疑問です。
こうした疑問はまず間違いなく講義では説明されません。確かに、一般解を用いて求められた解は与えられた条件を満たすため、元の微分方程式の解であるわけで、結果オーライなのだから、最初に与えた一般解というのは成功だった、と因果律をさかのぼって、天下りの一般解が正当化されます。
また、いくつかの微分方程式のパターンを学ぶにつれ、微分方程式に応じて適切な一般解を選択せねばならないということがわかってきます。そうすると、次の疑問が浮かびます。
(疑問3)一般解をどのように選択すればよいのか?
先に述べたように、微分方程式の解法では、結果(解)が仮定(一般解)を正当化するので、(疑問3:一般解をどのように選択すればよいのか?)は説明する必要がない、という立場をとります。しかしながら、それは乱暴であるように思います。結果が仮定を正当化するということは、言い換えると、一般解は必要条件(解が求まる)を満たすということは納得できるが、十分条件(他の可能性が排除される)は満たしていない気がします。十分条件を満たしているよ、という説明がない限り、納得できません。

落ちこぼれ脱出作戦

僕はこれらの疑問はまっとうだと思っています。そういう疑問を置き去りにして、形式だけを学ぶという、通常の講義スタイルこそダメだと思っています。同じことは多かれ少なかれ量子力学にも言えます。量子力学の出発式は微分方程式であり、微分方程式こそが自然の本質であるというのが量子力学の真骨頂です。ですから、微分方程式の理解と量子力学の理解のレベルは直結しており、どちらも今一つ得心がいかないという状況が似ているのは当然かもしれません。
そういうことなので、微分方程式や量子力学が理解できない、というのは決して恥ではなく、むしろ、現在の講義スタイルで理解できたと思っている人の大半は、理解できていないことすら理解できていないという救い難い状況だと思っています。だから、このテキストをここまで読んできた人には、ご褒美をあげたいと思いますが、そのご褒美は、テキストを進むうちにもらえます。

2017年11月4日土曜日

糖尿病患者をなめるなよ!

糖尿病歴10年

僕は糖尿病と診断されて、10年以上経ちます。インスリンも10年以上ってことです。筋金入りの糖尿病患者です。あんまり優秀な糖尿病患者ではありません。でも、それは仕方がないのです。糖尿病患者の苦しみは実はすさまじいものです。

血糖値と空腹感

動物は、血糖値が下がると、空腹を感じ、血糖値が上がると満腹を感じます。ふつうの人は、超絶におなかがすいた状態で血糖値が70mg/dlくらい。食後は、140mg/dlくらいまで上昇します。通常は100mg/dlくらいです。だから、マイナス30mg/dlは、たまらなく空腹を感じるってわけです。僕は血糖値のコントロールが悪いと、通常の血糖値が180mg/dlくらいです。その状態だと、空腹時には120mg/dlくらいまで下がります。マイナス60mg/dlです。数値的には常人の倍くらい空腹を感じることになります。もっとひどい時もあります。それこそ、気が狂うくらいの空腹です。それを我慢しろなんて、無理です。

このような議論は、医療関係者にも知られています。糖分は麻薬のようだ、とも言われています。実際、麻薬と同じような効果があるという説まであります。麻薬中毒者には、支援団体がありますが、糖尿病患者には生活支援団体がありません。糖分はどこでも入手できます。麻薬より多くの誘惑があります。それを根性論でなんとかするなんて、不可能に近いと思います。ふつうの人の腹ペコの状態が四六時中続いていて、それでも空腹を我慢しないといけないなんて、想像つきますか?

糖尿病の治療では、75歳を一つの基準にします。その理由の一つに、統計的に糖尿病患者は100歳までに死亡することがわかっていることが挙げられます。糖尿病患者は早死にするのです。だから、75歳以降は無理せず、安楽な生活を送る方が幸せだ、ということです。もう一つの理由があります。75歳くらいから認知症が深刻になります。認知症になると我慢が効かなくなり、食事療法や運動療法が満足にできません。すなわち、いくら医者が努力しても、患者が言うことを聞かないので、すべての努力が報われないのです。だから、患者と医者の合意の下で、75歳になったら、もういいよね、という取り決めを行うのです。
だから、僕の寿命は75歳です。もしかしたら、80歳まで生きるかもしれませんし、70歳くらいでダメかもしれません。少なくとも、健常者よりはかなり短いでしょう。余命宣告というほど短くはありませんが、はっきりと100まで生きることはないと宣言されるのは、それはそれでショックなことです。

ダイエット

糖尿病の治療の基本は食事療法と運動療法です。食事療法とは、平たく言うとダイエットです。糖尿病患者は、ダイエットのプロです。命がけでダイエットしている人たちが、糖尿病患者です。

僕は糖尿病歴10年以上なので、10年以上ダイエットを続けています。糖尿病では、最初に入院を勧められます。糖尿病の入院は治療が目的ではなく、糖尿病に関する知識を勉強するのが主たる目的で、教育入院と呼ばれます。その中で最も時間を割くのが、食事療法=ダイエットです。

ダイエットは商業的にも重要なので、医学的な研究がたくさんあります。その重要な結論として、ダイエットで結局重要なのは、カロリーの抑制だ、ということです。食べ方とか、食べ物の種類とか、いろいろなダイエット法が巷に溢れていますが、そんなことは些細な事。摂取カロリーが少なければ痩せるし、多ければ太るという単純で冷酷な関係があるということです。

医学的には、20歳時の体重を基準として、そこからの体重の増加はすべて余分な脂肪であると推定されます。そして、脂肪1Kgにつき、7000kcalの熱量があります。もし、40歳で、20Kg太っているなら、20Kgの脂肪が蓄積されており、その脂肪は140メガカロリーに相当します。ビール腹のおじさんは、大体このくらいの太り方をしています。この場合、1年あたり1Kg = 7000 kcalだけ余分に摂取してきたということになります。
これを365日で割ると、一日当たり20 kcalだけ余分だった、ということがわかります。成人男性の1日の標準摂取カロリーは2400 kcalなので、0.8%だけ余分だったということです。たったの0.8%です。これは逆にものすごい精度で2400 kcalを守っているとも言えます。
例えば、定規なしで1mの線を描くことを考えてみてください。ぴったり1mなんてなりません。10cmくらいずれてもおかしくないでしょう。その精度は10%です。0.8%の精度というのは見た目が1mぴったりなのはもちろん、線がまっすぐかどうかでもくるってきます。線がまっすぐでない場合、線の太さによっては、線の曲がりの外側と内側でもくるってきます。そういうことまで考慮しないとダメなレベルで、僕たちは無意識にカロリーコントロールしているということです。
例えば、20 kcalというのはコンビニおにぎりの10分の1くらいです。すなわち、おにぎりを一口食べると、20kcalを軽くオーバーするってことです。毎日の食事量がその精度で制御されているということです。もちろん、毎日の食事量は変動します。多い時もあれば少ない時もあるでしょう。でも平均すると、+20 Kcalということです。それを「無意識」におこなっているのです。我々は摂取カロリーを労なく誤差1%以下に制御しているのです。この医学的事実から、この無意識の制御は非常に正確で強力だと考えられています。

ダイエットはその正確で強力な無意識の制御を上書きしようという行為です。無意識による食事量の制御は非常に強力なので、一時的に食事量を減らしても、無意識のうちに減らした分を取り戻してしまいます。この制御は、生物が何億年もの進化の末に獲得してきたものですから、当然です。
逆に考えると、減らさねばならないのは一日当たりたったの20 Kcalです。大幅に減らす必要はないのです。たったの20Kcalなら、概ねひと口に相当します。なので、すべての食事において、一口残す、ということを習慣にするだけでOKです。
重要なのは習慣です。生物には、強力な食事量制御が無意識のうちに働きます。意識的な制御は、一時的には無意識の制御を上書きしますが、気を許した瞬間に無意識の制御が復活します。
例えば、のどが渇いて、自動販売機でジュースを買うとします。その時、何を飲みますか?カロリーに気を付けていれば、コーラゼロを飲むかもしれません。コーラゼロのカロリーの表示は0Kcalですが、実はちょっとだけカロリーがあります。100mlあたり5kcal未満の場合は、0 Kcalの表示になります。ペットボトルは500 mlなので、最大25 Kcalあるかもしれません。我々の脳はそれを抜け目なく知っていて、カロリーが完全にゼロのお茶ではなく、20 Kcalのコーラゼロをあなたに選択させるのです。そして、せっかく控えた20 Kcalをこっそり取り戻しているのです。無意識の制御はこのように狡猾に抜け目なく、ダイエットに抵抗します。

多くのダイエット法では1か月に10 Kg痩せた!なんてのを売り文句にします。でも糖尿病患者のダイエットは、1年間に1Kgでよいのです。いや、体重なんて減らなくてもよいくらいです。そのかわり、糖尿病患者のダイエットは一生続きます。そのような継続的なダイエットでは、狡猾な無意識の食事量制御が本当の敵になります。無意識の制御を欺く方法の一つが「習慣」です。

例えば、自動販売機では、お茶とブラックコーヒーしか買わないと誓いを立てるのです。最初は我慢が必要ですが、だんだんと当たり前になり、習慣となります。習慣になったらコーラゼロを避けるのに、苦労がなくなります。糖尿病患者は10年、20年の単位で戦うのです。我慢なんて秒単位の戦いではないのです。
毎食事の際に、かならず一口残すと簡単に20 Kcal程度の削減になります。外食ではご飯を一口残します。家ではおかずを半分残します。職場のカフェテリアでは、おかずを一品減らします。食事を残さず食べることを小さいころからしつけられてきたので、食事を残すことに強い抵抗感が今でもあります。毎日おいしい食事を用意してくれる家内には、申し訳なく思っています。でも、食事を残すことを習慣づけることで、ほんのちょっとだけ減らすのです。これを1か月続けると少しだけ、体重が減るかもしれません。

運動療法

食事療法と並んで重要なのが運動療法です。20歳以降に増加した体重はすべて脂肪というのは、言い過ぎで、一部は筋肉なんじゃないか?と思うかもしれません。でも、ほとんど確実に、脂肪です。いや、筋トレしてるから、筋肉だよ、と思うかもしれません。でもその筋肉は、ダイエットでは脂肪扱いなんです。

食事療法主体のダイエットでは、脂肪はほとんど減らないという実験事実があります。人間の場合、最初に糖類がエネルギーとして使われます。糖類が減ってくると、次は筋肉を分解して、糖に変えて用います。脂肪は最後まで使われず、飢餓状態に備えるのです。糖類は一時的なエネルギー源なので体重の減少にはほとんど寄与しません。なので、正しい運動療法を組み合わせないダイエットでは、脂肪が減らず、筋肉が分解されます。女性が大好きな食事制限ダイエットで減る体重は筋肉なので、ダイエットを繰り返す女性は筋肉量が減り、痩せにくい体質になるという悪循環は、隠れ肥満として有名です。

筋トレでは、脂肪は燃焼しませんので、筋トレ+食事療法だと筋トレで作った筋肉を筋トレで分解するという、わけがわからないマッチポンプ状態になります。なので、筋トレで作った筋肉はダイエットでは脂肪と同等の扱いになるのです。
脂肪の燃焼は、基礎代謝の一部と、有酸素運動が主なものになります。筋トレで筋肉を増やせば基礎代謝は増えますが、それは一日当たり10 Kcalのオーダーでの話です。1Kgの脂肪を燃やすには、7000 Kcal必要なので、基礎代謝の改善で1 Kg痩せるには、2年くらいかかる計算になります。

ダイエットの本来の目的は体重を減らすことではなくて、脂肪を減らすことです。そのためには、有酸素運動しかありません。有酸素運動というのは、かなり面倒くさい性質を持っています。

まず、有酸素運動で脂肪を燃焼させるには15分程度のウォーミングアップが必要です。ウォーミングアップ中は脂肪の燃焼はほとんどありません。ダイエット目的での有酸素運動では、15分経ってから、どのくらい運動したかが重要になります。例えば、20分のジョギングは、40分のウォーキングと同じくらいのカロリー消費量ですが、脂肪燃焼時間は、ジョギングが5分、ウォーキングが25分になり、ウォーキングの方が3倍くらい効率が高くなります。

次の面倒くさい性質は、有酸素運動で脂肪が燃焼しだしても、脂肪だけが燃焼するわけではないことです。脂肪はかならず糖とセットで燃焼することが知られています。糖のストックは多くありませんので、糖がなくなると筋肉が分解されます。つまり、長時間の有酸素運動は、筋肉量の低下を招くのでよくない、ということです。これはオーバートレーニングとして知られており、マラソン選手の上半身が痩せている理由です。かれらは、足以外の筋肉をトレーニングで文字通り食いつぶしてしまっています。

さらに面倒なのは、燃焼の際の脂肪の割合は50%が最大で、運動強度が増すにつれ、効率が落ちます。つまり、頑張って激しい運動をするほど、脂肪の比率が減り、筋肉が減るリスクが高まるのです。ウォーキングなら脂肪燃焼が50%ですが、ジョギングだと25%になったりするわけです。その場合、同じ時間のウォーキングとジョギングでは、脂肪燃焼量はほとんど変わらないことになります。

ここから結論されるのは、脂肪燃焼を目的とした運動療法では、なるべく低負荷の運動を無理しない程度に長時間行うのが効率的ということです。

運動の種類ですが、筋トレは最悪です。筋トレは、実際の運動時間が秒単位なので、トータルの消費カロリーは多くないのです。無酸素運動とよばれ、ダイエット効果には不向きです。しかし、有酸素運動は筋肉を食いつぶす傾向があるので、ダイエットでは、少しの筋トレを併用する方が良いとされています。
単位時間当たりの消費カロリーが最も高いのは水泳です(1000 Kcal/hour)。でも水泳は1日1時間、週1回ぐらいが適切なところなので、水泳選手でない限り、長い目で見たときの消費カロリーは多くありません。
1日あたりで見ると、登山の消費カロリーがダントツ(最大8000 Kcal/day)です。どんな登山好きでも、1か月に2日くらいしかできませんが、長い目で見ると、水泳よりも多くのカロリー消費になります。
一般に、ダイエット目的なら、自転車が最も効果的です。自転車はウォーキングより少し高めの運動強度ですが、運動時間を長くとることができます。自転車は1時間乗ってもそれほど長く感じませんが、1時間のウォーキングは結構退屈するのです。1か月くらいの平均で消費カロリーを比較すると、あらゆる運動の中で自転車が最も多くなります。

脂肪の燃焼比率は最大で50%なので、1 Kg = 7000 Kcalの脂肪を燃焼させるには、14000 Kcalの運動が必要です。ウォーキングでは1時間あたり280 Kcal程度なので、50時間の有酸素運動が必要になります。ただし、15分のウォーミングアップを考慮すると、1時間のウォーキングなら62回行うことになります。概ね、1日2回のウォーキングで1か月1Kgの脂肪を減らすことができます。うまくすると、2Kgくらい減るかもしれませんが、無理をしていると1Kgの筋肉が分解される可能性も残ります。これ以上に効果的な運動療法はありません。

過激なダイエットでは、1か月に5Kgとかの減量効果を謳うことがあります。5 Kgの脂肪は、35000 Kcalに相当し、一日当たり、1000 Kcal以上の運動が必要になります。ジョギングだと、毎日2時間に相当しますが、そんな運動はできないはずです。ということは、脂肪以外の何かが体重減少に寄与したと考えるべきです。脂肪のほかに、水分・便・筋肉が体重減少に寄与します。女性の場合、宿便が取れるだけで、2~3キロ減ります。また、水分は簡単に1~2キロ減ります。なので、1か月に5Kgというのは、脂肪も少し減ったかもしれませんが、内訳の多くは、宿便と水分と推察されます。なので、すぐに戻るし、実際のところはダイエットでも何でもないと思われます。

手軽な運動療法としては、ウォーキングが最も高効率なので、糖尿病患者はウォーキングを運動療法の基本に据えます。健常者の場合、中年以降は運動量が減り、体力が衰えるものですが、頑張っている糖尿病患者は毎日の運動によって、体力が維持され、健常者より健康なくらいです。僕は自転車通勤を運動療法として取り入れていますが、散歩と合わせて一日の運動時間が2時間を軽く超えます。ちょっとしたアスリートです。血糖値以外はすこぶる健康というのが、理想的な糖尿病患者です。

食事

食事療法の基本はカロリーですが、食べ物に関する知識がないと、カロリーを計算することができません。なので、食事を見てカロリーが計算できなければなりません。それには、栄養士並みの知識が必要になります。
栄養士は食材と重量からカロリーを計算するわけですが、糖尿病患者は見た目からカロリーを概算しなければなりません。なので、食材の量の目分量や調理法にも通じておかなければなりません。
カロリーを計算する方法として、80 Kcalを1単位とした計算法が一般的です。というのも、お惣菜の小鉢1皿が概ね80 Kcalくらいで、見た目にわかりやすいのです。白米はもっとも計算しやすい食材です。外食にでてくるごはんだと、お茶碗1杯で4単位くらいです。家庭では3単位くらい。女性や子供用の小さなお茶碗だと2.5単位です。2.5単位というのは、コンビニのおにぎり1個に相当します。僕は糖質を少し控えるようにしていて、1回の食事では2.5単位のごはんにしています。
お肉は20~30gで1単位です。肉料理一人前だと、3~4単位のお肉が使われることになります。野菜は1回の食事でせいぜい1単位です。調味料や炒め油で1単位上乗せします。揚げ物はさらに1単位。食材は無数にあって、それぞれにカロリーがあるので、ある程度詳しく理解しておかないといけません。エビ・カニ類は、案外低カロリーだったりして、勉強するとおもしろい発見があります。
1回の食事では800 Kcalが基本です。でも、ライフスタイルにも依存します。僕は朝が500 Kcalくらい、昼が600 Kcalくらい、夜が1000 Kcalくらいになっています。

毎日の積み重ねを10年の単位で続ける

糖尿病患者の苦しみは、以上のことを毎日、10年単位で続けることです。何とかダイエットなんて、1か月か2か月の話です。次元が違います。また、糖尿病患者のダイエットは体重減少が目的ではないというところもポイントです。1か月に1Kg減量すると、1年で12Kg、10年で120Kgも減ってしまって、僕の体は跡形もなくなるでしょう。ある時、体重減少がうまく止まらなくて、困ったことすらありました。良好な体重を維持するというのが糖尿病患者のダイエットの目的なのです。

糖尿病患者はダイエットのプロです。普通の人が知っているようなダイエット法はすべて知っていると考えて間違いありません。最初にサラダを食べるとか、10年前から実践していますが、あんまり効果はありません。でも効果がわからないだけかもしれません。医学的には、サラダを最初に食べることで血糖値の上昇が緩やかになることは証明されています。糖尿病患者はダイエットのプロなので、医学的に証明されたことはちゃんと実践するのです。そして、巷にあふれる怪しいダイエット法は無視します。

医学的に効果が完全に証明されたらくちんなダイエット法というのは、世の中に存在しません。というのも、肥満は万病のもとと考えられており、肥満を解消するための研究は世界中で続けられています。にもかかわらず、肥満の治療が本格化しないのは、それが存在しないからです。
生物は長いな進化の歴史を持ちますが、現在の人類のように食料に困らず、肥満を解消する必要に迫られたことは一度もありません。生物の歴史は、むしろ飢餓との戦いの歴史なのです。なのですべての生物は飢餓状態に適応するように進化してきました。糖尿病は、極端な飢餓状態の中では特に優れた形質だったと考えられ、むしろ生存に有利だったのです。人間社会の進歩が、生物としての人間の進化をはるかに超えて進行した結果、食料が有り余る現代への適応不良として顕在化した病気が糖尿病です。がんや認知症も、人間の寿命が急激に伸びた結果、顕在化した病気と言えるので、同じようなものです。

教育入院

僕は、こういった知識を糖尿病発覚直後に行った教育入院で勉強しました。授業料(入院費)はそこそこしますが、保険適用なのでお得です。午前中は勉強をして、午後は、検査と問診をします。その間に運動療法をします。
ご飯は結構しっかりしたものを食べます。そこも重要です。基本的に、糖尿病患者が食べられないものはありません。食事を抜くのもよくありません。決められた量の食事を、決められた時間にきちんと食べることがよいとされています。
外食などの場合には、食事の量がお店のお任せになってしまいます。その場合、ちゃんと量を計算して食べねばなりません。教育入院では、食事の量を覚えるということも重要な勉強なのです。「腹八分目」を体に覚えこませるのです。いや、「腹五分目」くらいかな。
僕の上の娘は、高校生の時にダイエット検定なるものを受けましたが、その内容は僕が教育入院で勉強したものの「サブセット」でした。糖尿病患者は命がけでダイエットするのです。ちゃらちゃらしたダイエット検定なんて、目じゃないのです。

糖尿病であることを公言する

糖尿病はどっちかというと恥ずかしい病気だと考えられています。努力が足りないから糖尿病になったという印象があるからです。でも、病的な肥満でない限り、カロリーオーバーなのは1日当たりたったの20Kcalです。それは無意識の制御がちょっとミスっているだけです。食べる量だけではなく、運動量にも無意識の制御が働いているのです。20Kcalというのは、曲がり角を曲がるとき、内側を歩くか、外側を歩くかの違いくらいで生まれてしまいます。信号が赤になりそうなとき、少し早歩きするか、あきらめるかの違いで、20Kcal/dayくらい変わります。20分朝寝坊するだけで20Kcalくらい違います。普段の生活の中のちょっとした省エネが何十年も積み重なると10Kgくらい太るのです。ちょっと早歩きを心掛けたとしましょう。でも体はその分、朝寝坊になったり、一口多くおかずを食べたりして、無意識のうちにそのカロリーを取り戻します。1年に1Kgくらいの体重増加はむしろ自然なことです。それを恥ずかしいと思う方がおかしいよね。

肥満の定義は、あまりはっきりしません。肥満の判定基準として、身長と体重から計算されるBMIがよく知られています。日本では肥満の基準は25以上ですが、WHOの基準では、30以上が肥満とされています。身長170cmだと、BMI=25は72.5Kgですが、BMI=30は86.7Kgです。日本では、BMI=30の人は、ほとんどいません。日本では、そのような人は病的肥満と呼ばれていますが、海外で病的肥満と言えば、マツコ・デラックスみたいな体形です。病的肥満は何か別の理由から肥満になっている病態を指します。多くは、脳の病気です。そういう人はそんなに見かけませんよね。だから、世界標準では、日本にはほとんど肥満はないのです。
そういうことなので、肥満気味の状態は、糖尿病の遠因ではありますが、別の要素も多いと考えられています。ただ、別の要素というのは、遺伝的な要因だったりして、本人の努力ではいかんともしがたいので、治療改善を目指す医学的立場からは、肥満気味ということを目の敵にせざるを得ないわけです。でも考え方を変えて、がんや認知症のようにほとんど運・不運が原因と思われているような病気と同じ扱いにした方が良いと思います

糖尿病の教育入院で議論されることですが、多くの糖尿病患者は自分が糖尿病であることを隠す傾向にあります。でも、糖尿病であることを公言する人もいて、比べると、糖尿病であることを公言する人の方が血糖値のコントロールが良いと言われています。理由は、隠し事をする、恥ずかしいと思うとことに伴うストレス説が有力です。公言していると周りが気を使ってくれて、気持ち良いので、逆にストレスがたまりにくいという説もあります。

僕は糖尿病であることを公言しています。僕はサイエンティストなので、血糖値測定結果などの実験事実を認めることを信条としているのです。実験事実は包み隠すべからず、です。その時、なるべくあっけらからんな印象を与えるようにしています。僕は36歳で糖尿病と診断されましたが、すでにかなり深刻な状態で、その2年前くらいから深刻な糖尿病の状態だったと考えられます。診断が下ったときはショックでした。だって不治の病なんですよ!健常者とは違っていろいろ無理が利かなくなるわけです。
落ち込んだのですが、よく考えると、50歳を超えると誰でも1つくらい病気を抱えるものです。僕は15年ほど早いですが、そういう人たちの仲間入りをしたわけです。ま、人生の段階をちょっと飛び級した、という風に考えました。病気があることを悲観しても、何も始まりません。いずれ誰でも病気になるもので、それが僕の場合は若くして糖尿病だっただけの話です。

僕は、糖尿病が恥ずかしい病気でなくなると良いな、と思っています。というか、糖尿病患者はたゆまないダイエットに取り組んでいるアスリートなんだって、思ってもらいたいのです。

P.S. 糖尿病でよかったことの一つが、ちょっとした薬や治療が保険適用になる場合があることです。一度、軽い水虫になったのですが、その時、水虫の軟膏を6か月処方してもらいました。糖尿病が深刻だと、水虫を端緒として傷口から雑菌が侵入し、足先とかが壊疽して切断に至る場合があります。だから、水虫は糖尿病合併症としてちゃんとした治療対象なんです。効き目抜群の処方薬をタダ同然で使えて、すっかり治りました。またある時、ちょっと足首が捻挫して痛い時がありました。足首を痛めてウォーキングできないと、血糖値のコントロールが悪くなるので、これも治療対象になるのです。使えきれないほどの湿布をもらいました。全部保険適用です。
ちょっと下痢気味だというと、整腸剤(漢方薬とかビオフェルミン)を処方してくれます。糖尿病治療薬のいくつかは下痢の副作用があるのです。定期検診は、今のところ6週間に一度なんで、風邪とかを診てもらうわけにはいかないんですけど、コンビニ医療の大義名分になってて、ちょっと気が引けるくらいのときもあります。

おまけ:御堂筋暴走事件

糖尿病では低血糖が最も怖い症状です。普段は高血糖なので、経口薬やインスリンで血糖値を無理やり下げています。しかし、いろんな事情で食事がとれなかったり、遅くなったり、量が少なかったりすることがあります。その場合は注意が必要になります。
血糖値を下げる薬剤は即効性のもありますが、通常は2時間から6時間のタイムラグがあります。なので、朝の投薬では昼と夜の食事量を計算に入れて量を調整することになります。もし、昼食が満足に取れないと、血糖値を下げる薬の効果が、血糖値を上げる食事の影響をはるかに超えてしまい、低血糖を起こします。低血糖は最悪の場合、気絶(昏倒)を引き起こし、死に至ります。
低血糖が引き起こしたとみられる痛ましい事故が、2014年6月30日に御堂筋で起きました。運転手が低血糖で気絶し、自動車がそのまま暴走し、3人の歩行者が重軽傷を負いました。運転手は糖尿病で、経口薬とインスリンを常用していました。仕事が忙しく、昼食を満足にとれなかったということです。自己血糖値測定で低血糖を認識したので、どら焼き1個とオレンジジュースを食べたと証言しています。

一般に、インスリンを使用している糖尿病患者がどら焼きを食べることはありません。オレンジジュースも飲みません。食事がとれない場合の非常食としてどら焼きとオレンジジュースを食べたのはきわめて合理的です。
血糖値というのは血液中のグルコース量のことです。グルコースというのは単糖と呼ばれます。食品ではグラニュー糖あるいはブドウ糖のことです。ふつうの砂糖はショ糖と呼ばれ、グルコースが2つくっついた化合物です。インスリンを使っている糖尿病患者の多くはグルコースを10g程度常時携帯していて、低血糖の症状が出たらグルコースを食べます。5分~10分で血糖値が急上昇し、低血糖の症状はなくなります。でもそれは、低血糖の症状を感じた場合の応急処置です。
さて、食事がとれなくて低血糖が「懸念される」糖尿病患者は、グルコースを食べるべきかどうか?答えはNOです。携行しているグルコースはせいぜい10gです。一時的に低血糖を改善する役には立ちますが、すぐにまた低血糖になる可能性があります。なので、別の手段を使います。
この場合の低血糖の根本原因は食事として摂取する糖分が足りないということです。なので、糖分の多い食品を食べることが根本対策になります。とりあえず何でもよいかというとそうではありません。カロリーがそこそこで、糖分が多いものが良いとされています。簡単に言うと、腹持ちのする脂質の少ない食品、です。この観点からすると、チョコレートは低血糖対策としてはよくありません。ミルクとかヨーグルトとかもよくありません。ハンバーガーとかフライドポテトは、カロリーの大半が脂質です。良いとされるのは、アンパンとかです。どら焼きは成分がほとんどアンパンと同じですから、予備的な低血糖対策として理想的な食品です。でもそれは、血糖値を上げてしまうので、普段は決して食べません。オレンジジュースも同じです。なので、運転手が低血糖対策として食べた食品は、医学的には正解です。そして、それ以上の対策は無理です。にもかかわらず、有罪の判決が出ました。これは納得がいきません。

そもそも罪というのは、故意であること、が要件です。その中には、予見できたけど対策しなかった、というものも含まれます。予見して対策したけど不十分だったというのは、グレーゾーンです。予見して可能な限り対策したけど防げなかった、は完全にセーフとされています。御堂筋の事件では、運転手は予見し、可能な限り対策したけど、防げませんでした。これで有罪はダメです。運転手は事故の2時間ほど前に臨時の血糖値検査をして、どら焼きとオレンジジュースを食べました。血糖値の検査には手間とコストがかかります。保険適用でも1回50円くらいになります。所要時間は3分です。車を止めて手間とコストをかけて血糖値測定をしたのち、低血糖対策に適したどら焼きとオレンジジュースを購入し、食べたはずです。これ以上の対策は思いつきません。

一審では有罪判決でしたが、その後控訴し、2017年3月16日に、一審判決を破棄、差戻しになっています。普段食べることがないどら焼きを食べていることを指摘し、低血糖に対する対処を行っており、過失ではないとの判決文になっているようです。

低血糖の症状というのは自覚がとても難しいものです。健常者でも日常的に低血糖になっています。例えば、空腹。低血糖と診断されるギリギリの血糖値まで下がります。低血糖の初期症状の一つが空腹感です。例えば、二日酔い。二日酔いはアルコールの分解に糖が使われて糖が不足することに伴う低血糖が原因です。頭痛、吐き気、むかつきは、ほとんどが低血糖の症状です。例えば、めまい。軽い低血糖の場合、バランス感覚が少し狂います。でもそれは、脳こうそくの症状かもしれません。問題は、空腹を感じても低血糖とは限らない、ということです。低血糖になると空腹を感じますが、タイムラグがあります。生物の体にはホメオスタシス(恒常性)があるので、低血糖の対策が自動的に取られます。低血糖から空腹感に至るタイムラグの間に、普通であれば血糖値を上げる対策が奏功し、危機的な低血糖状態は避けられます。しかしながら、糖尿病患者の場合は、頻繁な低血糖が知らないうちに進行し、万策が尽きて、重大な低血糖症状を引き起こす場合があるのです。低血糖対策はたくさん用意されているのですが、今どのレベルの低血糖対策がなされているのかを知る術はありません。なので、今の低血糖がどのくらい深刻な状態なのかがわからないのです。
地震に似ています。小さな地震が続いていても、大地震が起こるとは限りません。大地震が怖いので、小さな地震を見逃さないようにしていて、地震対策をしていたとしても、思っていたより大きな地震がやってきて、地震対策が十分でなかったとわかる。同じ構図です。さて、大地震を予見できなかった地震学者に罪はあるやなしや。ちなみに、イタリアでは一度有罪判決が出ています。

イタリアの地震裁判は素人目にもやりすぎ感がありますが、糖尿病患者の発作に関しては予断を許しません。糖尿病患者は病気をカミングアウトして、周囲の理解を得るための努力をすべきなんじゃないかな、と僕は思います。



2017年10月17日火曜日

アウトソーシング

アウトソーシング全盛

昨今は経費削減のためにいろんな業務が外部委託(アウトソーシング)される傾向にある。アウトソーシングすると、どうして経費削減できるのだろう?

アウトソーシングには利点と欠点があり、それをよく理解しないといけないし、安定した組織においては、アウトソーシングは不経済であることが多く、導入のメリットがないばかりか、害悪になる。特に、図書館などのサービスはアウトソーシングのやり方を考えないといけない。

身近なアウトソーシング

家庭のレベルの伝統的なアウトソーシングは、家政婦である。ご存知のように、家政婦を雇うには、そこそこの経済力が必要で、並みのパートでは賄えない。なので、ほとんどの家庭では自分たちで家事を行う。つまり、家政婦の場合はアウトソーシングが不経済ということだ。最近多いアウトソーシングの例は、配食サービスだ。食材だけ、あるいは調理済みの食事を宅配するサービスだ。家事の時間が取れない場合は経済的に釣り合うが、一般的にはこれも不経済だ。一般家庭の経済感覚では、アウトソーシングというだけでは、経費削減にはならない。
アウトソーシングは別の理由でも敬遠されることがある。タクシーは自動車移動のアウトソーシングである。タクシーは不経済に思うかもしれないが、マイカーの場合、車両価格、ガソリン代、駐車場代、保険代、維持費もろもろを計算に入れると、タクシーの倍くらいになる。それでも我々はマイカーに利点を見出す。いつでも車をつかえる利便性、プライバシー、自分の好みの車、そういうものに価値を見出しているので、タクシーではなく、マイカーを使いたいと思うのだろう。自動車会社のCMに踊らされている面もあるだろう。細かな使い勝手をカスタマイズできないというのは、アウトソーシングの弱点の一つで、それがタクシーの例では見て取れるとおもう。

それでもアウトソーシング

利益を追求する企業がアウトソーシングを進めるのは、その方が利益があるからだ。アウトソーシングの利益とは何だろう。第一に、人件費の圧縮だ。
比較的専門性が低く労働集約型の業務は、真っ先にアウトソーシングの対象になる。最近は、事務作業のうち、比較的容易なものはどんどんアウトソーシングになっている。正式な雇用契約のある社員の人件費は比較的高額なので、より経済効率の高い業務につかせたいという経営判断により、アウトソーシングが進んでいるのだと考えられる。

しかしながら、そもそもこれは経営者の判断ミスの埋め合わせだと考えることもできる。つまり、人件費が高騰して、軽作業用の人員が確保できなかったという経営判断のミス、と理解することもできる。あるいは、人員配置のミスと言ってもよい。判断ミスなら、それを修正して正常化すべきなのだが、アウトソーシングが常態化しているのが現在のやり方だ。

アウトソーシングが広がったのは、バブル崩壊後、しばらく経ってからだ。バブル崩壊時に社員採用を大幅に削減し、人件費を圧縮できたものの、人を減らしすぎて業務が滞るようになった。その欠員を補充するために、人材派遣が多くなった。バブルで人件費が高騰し、バブル崩壊で軽作業用の人員を大幅削減してしまい、人材確保できなくなり、派遣に頼るようになった、ということだ。短期的には悪くない判断だが、中長期的には修正すべき対応だ。しかしながら、中長期的な展望を欠いた経営者が現状維持に甘んじた結果、派遣社員の問題がかなり深刻になった。派遣社員の待遇はもちろんだが、派遣を受ける側の企業の経営がおかしくなっている。

アウトソーシングのデメリット

僕が人材派遣会社なら、ターゲット企業にある程度食い込んでから、契約更新時にじわじわと契約条件を吊り上げる。練度の高まった派遣社員を引き上げられると、当該企業は業務に支障をきたすようになる。そうすると契約の主導権は逆転し、人材派遣会社が有利になる。現在は、そのようなフェーズで、アウトソーシング経費が経営にのしかかる。
かといって、今更アウトソーシングをやめるわけにもいかない。というのも、アウトソーシングしている作業がどんどん高度化してしまっていて、社員で肩代わりすることができなくなっているからだ。つまり、アウトソーシングが進んだ結果、業務内容が高度化し、逆に専門性が高い業務がアウトソーシングされるという状況になっている。社員はアウトソーシングされた業務にはタッチしないのが原則なので、社員の練度が上がらず、アウトソーシング経費をねん出するために社員を切るという選択を迫られる。これこそ、人材派遣会社が狙っていた展開だ。アウトソーシング経費は、人材派遣会社の言いなりにならざるを得なくなる。

そうすると会社側の行動として、派遣されている人材をハントして社員として取り込む、ということが進む。このフェーズも現在進行中だ。派遣切りが社会問題化していて、その解決策として派遣社員の中途採用優遇が進められており、これは世論の賛同を得ている。
しかしながら、正社員として採用すると、実質的な将来債務が発生してしまい、経営の自由度を制限する。そのため、会社は、派遣社員をフリーランスとして再契約するようになる。ただ、現状の法制度では、フリーランスの雇用条件が非常に悪い。これも社会問題化しており、現在は働き方改革というのが進んでいる。

行ったり来たり

時系列を整理してみよう。経営者たちの求めに応じて、人材派遣の規制緩和をしたのが2000年ごろだ。すると派遣社員の待遇が悪いとして、2005年ごろには派遣期間に規制を設けた。それでも問題はなくならず、法の抜け道をついてアウトソーシングがどんどん進んだ。しばらくいたちごっこが続いたのち、人材派遣会社が極めて強力になり、アウトソーシング経費が高騰しだした。それが2010年頃だ。経営者たちはたまったものではないので、優秀な派遣社員を人目る策として、個人契約を進めた。しかしながら、それは単に給料の切り下げでしかないので、適正化に向けて法整備を検討しだした。それが2015年ころで働き方改革というものだ。
ここ20年くらいで、アウトソーシングのメリットとデメリットを行ったり来たりしていることがわかる。短期的には経済的なアウトソーシングを進めるが、5年を目途に中長期的には不経済であることがわかる。法的な規制によって適正化するが、やはり5年程度で不経済であることがわかってきて、再び法整備による解決を図る、ということを続けている。
この流れを見ると、経営者の判断ミスから業務のアウトソーシングが進み、アウトソーシングの欠点が露呈すると、小手先の対策や政治介入を通じて、短期的な対策を図るも、最終的には次の問題が生じるという、なんともコントのような展開であることがわかる。改革すべきは経営者であることが明白なのだが、経営者たちを支持基盤とする自民党政権下では、根本的な解決は無理かもしれない。

問題点の整理

個人レベルのアウトソーシングの例でみたように、アウトソーシングの多くは中長期的には不経済であったり、デメリットが多い。企業のアウトソーシングでも同じことが言える。経営者は短期的なメリットを見て、それを中長期的に採用したいと考えるが、現状のアウトソーシングは、もともと短期的な応急措置としての装置であり、システムとしては脆弱なのだ。中長期的にアウトソーシングに頼るという経営判断を根本的に改めなくてはならない。
そもそも、経済活動というのは、得意な分野を結集し、価値を最大化するという行動規範だ。極めて特別なノウハウや投資によって得意分野を先鋭化し、付加価値を高めて利潤を上乗せするというのが企業経営の基本である。経営資源という考え方で整理するとわかりやすい。経営資源には、資産・設備などの資本、ノウハウなどの知財、そして人材がある。また、人材には、特別な才能と訓練教育等で培われた能力との2種類がある。大きな企業になると個人にとどまる特別な才能は、大量のマンパワーに薄められてほとんど無視できる。人材の多くの部分は交換可能である。その互換性に目をつけたのアウトソーシングである。アウトソーシングでは企業は教育訓練の費用と時間を節約でき、その分の経費負担がない。また、仕事の質と量をある程度予測できるので、費用対効果がわかりやすい。しかしながら、アウトソーシングでは、業務内容の改善や練度向上を期待できない。仕事の効率は、最初から80%くらいあって、その後緩やかに上昇し、最終的には110%とかになるかもしれない。一方、社員の場合、最初は30%くらいかもしれないが、すぐに80%に達し、最終的に200%くらいになる。その段階で後進の育成を行い、スループットを落とさず、継続的に業務効率を高いレベルに維持する組織とすることができる。派遣と社員では成長率がかなり違う。というのも、派遣の場合は100%以上はサービスなので、それ以上向上させるインセンティブがない。日本人は比較的お人よしなので、派遣であっても頑張る人が多い。しかし、派遣が一般化した現在、そういう人は少なくなってくるだろう。というのも派遣で働く人は、社員になりたいと思っていない人も多くなっているからだ。
しかしながら、経営者はそのような派遣の事情をよく理解していないので、社員の練度向上を過小評価してアウトソーシングを進めている。その結果、業務が空洞化し、人材が枯渇する。
つまり、アウトソーシングにおける派遣社員は経営資源ではないという点に注意しなければならないということだ。経営資源のうち、人材だけはほぼ確実に成長が見込める。つまり、中長期的には最も重要な経営資源であるということだ。アウトソーシングはそれを(短期的には)捨てるという経営判断をするということなので、本当は慎重に決めないといけないんだけど、そうなってないよね。

アウトソーシングで気をつけないといけないもう一つのことは、業務内容にも中長期的な視点がなくなるということだ。短期的な派遣社員にとって、中長期的な業務というのは自分で責任が持てないことになる。その時の判断として、その中長期的な業務を無視するか、軽視するかとなるのは、致し方ない。業務の定義の中に、その中長期的業務が含まれていたとしても、その業務の質(結果)が判明するのは派遣期間内ではないだろう。そうすると、手を抜いてもバレないし、頑張っても評価されない。中長期的業務というのはアウトソーシングに適さないということがわかる。

アウトソーシングすべきでない業務

中長期的視野に立たないとだめな業務として、教育・人材育成がある。先に述べたとように、人材は中長期的には最も重要な経営資源だ。そして、人材を経営資源たらしめるのは教育である。派遣では教育の観点が欠落しているので、派遣社員を経営資源とみなすことができない、という解釈ができる。
教育というのはかなり時間がかかるものだ。短期的な利益を見れば、極めて効率が悪い。「教育は国家百年の計」言われるくらい、その成果が隅々までいきわたるのに長い時間がかかる。ある教育に着目すると、その教育を受けた人(第一世代)は、その教育内容を人生の中で実践し、様々なノウハウを蓄積する。第一世代が先生になると、その教育内容に加えて、ノウハウも教えるようになる。なので、第一世代の教育内容に欠けていたノウハウの部分も、第二世代は教わることができる。その結果、第二世代はノウハウの蓄積という時間のかかる作業から解放され、より効率的に教育内容を活用できるようになる。第一世代が先生になって教育する側になるまでにおよそ20年必要だ。第二世代以降の教育内容はほとんど変わらないので、ある教育改革が完全に定着するには20年はかかるということだ。そして第二世代以降は人生の中でその教育内容を活用するわけだが、その影響は死ぬまで続く。ある教育の導入時点では、その教育を施された老人にどのような影響があるのかなんて、知るすべがない。個人レベルでは実験可能かもしれないが、社会的影響は実験のしようがない。だから、その教育の成果は第二世代が死ぬくらいの時期まで見ないと、正しく判断できない。第二世代が死ぬという時間がちょうど百年くらいだ、というのが、先の言葉だと僕は思っている。

僕たちは戦後生まれだけど、先生の世代は戦中くらいだった。ずいぶん考え方が違うことを実感してきた。戦後教育で大きく変わったのは、戦争に対する考え方だ。戦後教育では戦争反対が強く押し出された。僕たちは戦争は悪いことだと教えられてきたし、日本の平和憲法は自虐的なものではなくて、誇り高いものだと信じている。平和憲法に強い影響を与えた当事者である米国が、湾岸戦争で先制攻撃を正当化して以来、その誇りが揺らいでいる。僕より上の年代は、日米安保・学生運動の時代を生きてきた人たちで、学校で教わった平和憲法の理念と、親から教わった敗戦の屈辱とのはざまで、様々な葛藤があったのだろう。平和憲法の後ろ盾だったはずの米国が、自ら平和憲法の理念を踏みにじる様子を見て、葛藤の反動で平和憲法の否定に傾くのもよく理解できる。僕の世代は、親も平和憲法の下で教育を受けており、米国と平和憲法と結び付けて考えることはない。米国はきっかけでしかなく、平和憲法の理念を僕たちの哲学としてどのように受け止めるか、ということが重要であり、それを行動として示すためにどのような選択肢があるのか、を僕たちの世代は考えると思う。平和憲法は屈辱ではなく誇りであり、米国が果たせなかった夢を我々が果たし、世界をリードする我々の強力な武器であると、信じている。日本の平和憲法は条文が極端ではあるが、運用においてはバランスがとれており、多くの国で手本として研究されているという事実がある。

バイトになぞらえて理解する

アウトソーシングというのは、むしろアルバイトに近い。バイト君に経理をやらしてよいか?という話だ。派遣社員をバイト君に読み替えれば、極端なアウトソーシングがいかに危険かわかるだろう。能力のあるなしではなく、責任のあるなしで見てみると、何がアウトソーシングに適して、何がそうでないかは一目瞭然だ。

今、図書館業務のアウトソーシングが盛んで、僕はとても心配している。図書館の業務のうち、図書の貸し借りと、一般蔵書の維持管理は、短期的な業務なのでアウトソーシングが可能だろう。一方で、図書館の重要な機能として、図書の長期的な管理がある。図書の中には、一般貸出が可能な図書と、貸し出しが禁止か、あるいは手続きが厳密な貴重本等があり、後者の維持管理は極めて長期的な視点に立たねばならない。そのような業務は一般の人の眼には触れないが、図書館の重要な業務である。
市井の図書館でも、地域の行政文書や資料、古文書などの維持管理を行っているはずだ。図書館業務のアウトソーシングによって、これらの貴重な文書や資料が存亡の危機にある。というか、実際に廃棄されている。いくつかの例では、市の職員が廃棄していたが、おそらく、図書業務を専門としない職員だったと思われる。つまり、組織内で図書館業務をアウトソーシングしていたということだ。図書館業務に責任を持つ司書というのは国家資格である。図書館業務には、文書の歴史的価値・保存方法に関する専門知識が必要とされているからだ。しかしながら、司書の給与水準は低く、専門家として尊敬されていない。そのため、図書館は真っ先にアウトソーシングの対象になってしまっている。これは緩やかな焚書と言ってよい。

コンサルティングは知性のアウトソーシング

通常はアウトソーシングという印象はないが、各種のコンサルティングは高度な専門業務のアウトソーシングだ。内容にもよるが、コンサルティングの単価はかなり高い。しかしながら、同じクオリティの業務を社員で賄えない場合に、コンサルティングを導入することになる。コンサルティングする側はビジネスなので、割に合わないことはやらない。だから、報酬しだいで業務の質が変化する。この場合は、業務に対する熱意を金で買う、という構造になる。
一般に、コンサルティングは高い利益率を誇るが、それはコンサルタントの高い専門性と情報力、そして企画力に基づいている。コンサルタントと同程度の技量を持つ社員がいたとしても、その社員は通常業務に忙殺され、生産性がなかなか上がらないことも多い。そういう雑事から解放され、より先鋭化することで、コンサルティング業が成り立つという側面がある。
善良なコンサルティングの導入は、多くの場合、経費圧縮と業務改善につながる。ただし、超短期的には高額のコンサルティング料に目を剥くことになるだろう。ただ、コンサルタントはプロなので、コンサルティング料くらいの利益はすぐにもたらすだろう。つまり、早々に損益分岐点を越えて、お得になるということだ。長期的には社員でコンサルタント級の人材を賄うことになるのだが、それには10年、20年かかるだろう。その間の教育コストを考えれば、コンサルティングは安いし、正しいアウトソーシングと言える。

まとめ

中長期的視野での業務、責任が発生する業務、熱意が必要な業務、こうした業務がアウトソーシングに向かない。あるいは、それらをアウトソーシングするなら通常の倍くらいの報酬が必要だ。日産は社長をアウトソーシングして成功したが、そのために支払った報酬は、一般社員の100倍以上だった。アウトソーシングは経費削減を意味しないことを、経営者たちはよく理解すべきだ。

2017年10月1日日曜日

ビッグバンはどこで起こったか?(ヨタ話)

誰もが知るレベルの宇宙論の話

僕の専門とは全く違いますが、宇宙論に少し触れます。僕は門外漢なので、難しい宇宙論はさっぱりついていけません。でも、専門的でないレベルにおいても、いろいろわからないことがあります。
この記事において、僕はあるモデル宇宙を提案します。でも、僕はそのモデルが正しいと主張したいわけではありません。そういうテキトーなモデルでも、宇宙にかかわるいくつかの疑問をうまく説明できるということを示したいだけです。そこから、先入観にとらわれず可能性を論じる意義、あるいは僕の狂気を示したいのです。

素人でも知っている宇宙論の話には次のようなものがあります。

  1. およそ135億年前にビッグバンという大爆発が起こって、僕たちの住む宇宙が誕生した。
  2. 僕たちの宇宙は膨張していて、無数にある銀河はお互いに遠ざかっている。
  3. 銀河はとても遠いので、僕たちが目にする星々の輝きは、大昔に発せられたものである。

3は光の速度が有限であるということから導き出される結論です。たぶん、これは正しいでしょう。2は星々の光の赤方偏移という現象を調べることで、確認されています。厳密には、2の後半の文章を直接確かめたことになります。
2の後半が確かめられると、2の前半部分も肯定されますが、細かく言うと解釈が2つできます。一つは、空間自体が膨張しているという説明、もう一つは、僕たちが宇宙と呼ぶ領域が拡大しているという説明です。違いが分かりにくいですね。まず後者についてです。ビッグバンなどが理由で僕たち(の地球)は高速で移動していると考えられます。同じことが他の星々にも言えます。最初はビッグバンの爆心地にすべての星がいたとすると、時間とともに星々が散らばっていくので、星々の存在領域は時々刻々拡大することになります。
一方、前者はビッグバンというのは単なる爆発ではなくて、空間が膨張を始めるという現象だと考え、その余波がずっと続いていると考えます。その際、星々は飛散しているのではなくて、空間が膨張しているので、それに応じて互いに遠ざかると考えます。星々の赤方偏移は極めて大きいのですが、それを説明するには星々の飛散では難しくて、一般相対性理論に基づく空間膨張を考慮するとうまくゆく、ということが根拠になっています。
さて、1は広く受け入れられていますが、ビッグバンというのが何なのかはよくわかっていません。それでもビッグバンがあったという根拠になっているのが、宇宙背景放射の存在です。星空は厳密には真っ黒ではなくて、ノイズのような模様があって、それが宇宙背景放射です。その模様はボヤっとしていますが、とても古いもので、ビッグバン直後に発生した光だと考えられています。

1~3にはそれぞれにちゃんとした科学的根拠があって、それなりに説得力がありそうです。しかし、本当にそうでしょうか?あらゆる文献が1~3は正しいということ述べています。そういう資料は偉い先生が書いたものだから、正しいはず、という結論だったら、それは宗教と変わりありません。もっと疑問を持つべきだと僕は思います。
ビッグバンの存在を疑う人はほとんどいませんが、それでも、ビッグバンのアイデアの根源がキリスト教にあると言ったら、ぞっとしませんか?ビッグバンは聖書に書かれているのです。聖書では、神は世界を作るにあたって、最初に「光あれ」と言ったとされています。これはまさにビッグバンです。ビッグバン理論がキリスト教の先入観に影響されている可能性はないでしょうか?
ビッグバン理論は一度破たんしています。その破たんを救ったのがインフレーション理論です。僕は専門家でないので、インフレーション理論はさっぱり理解できませんが、ビッグバン理論を成り立たせるために無理やり構築した理論という印象を僕は持っています。とはいうものの、僕はいくつかの別の理由でビッグバンはあったんじゃないかと思っています。その話はまた別の機会に。

理解できないことは恥ずかしいことじゃない

僕がどうしても理解できないのは、宇宙背景放射があらゆる方向からやってくる、という事実です。ビッグバンがあったとして、それは宇宙のどこかであって、僕らはそこから遠ざかっているはずです。そうすると、宇宙背景放射ビッグバンの方向から来ないといけません。でも、実際にはどっちを向いても宇宙背景放射が見えるのです。そんなことがどうやって可能になるのでしょうか?

宇宙背景放射は、ビッグバンの「爆風」のなかで陽子と電子が衝突した光の名残とされています。星々も爆風の中で誕生したので、爆風自体がインフレーションで拡大すると、爆風の残光はあらゆる方向から届く、ということで問題点を回避します。
でも、その時には、インフレーションが極めて大規模で、135億光年よりはるかに大きく生じないといけないでしょう。それでも、ビッグバンの爆心地方向とそれ以外で密度のムラが生じるかもしれません。そういうものは観測されていないので、インフレーションの規模はけた違いに大きい必要があります。しかし、そんなに都合の良い規模やタイミングでインフレーションが起こるのは不自然な気がします。

そもそもビッグバンの爆心地はどこでしょう?僕たちが観測できる限りでは、宇宙は等方的で、爆心地の方向はさっぱりわかりません。しかも、あらゆる方向の星々が、同じ調子で我々から遠ざかっていることがわかっています。爆心地方向から僕たちを追いかける形になっている星々というのは見つかっていないわけです。だからこそ、空間が膨張しているという説明が有力なわけです。空間が膨張するにはなんらかの仕掛けが必要ですが、その理由を、ダークマターとかダークエネルギーとかに求めているというのが現在の宇宙論のようです。なんだか、できの悪いサスペンスドラマみたいです。

宇宙空間の膨張の様子を説明する際によく用いられるのが、風船のたとえです。僕たちのいる宇宙は風船の表面みたいなもので、風船が膨らむと風船のゴムが等方的に伸びるように、僕たちの宇宙は等方的に膨張している、という説明です。このとき、風船の中心は風船の表面にはありません。つまり、ビッグバンの爆心地は風船の中心のようなもので、それは僕たちの宇宙に対応する風船の表面にはない、ということを暗示します。だから、僕たちは、ビッグバンの爆心地を探すことができないのかもしれません。

この風船モデルにはトリックがあります。それは、風船が膨らんでゆく方向です。風船が膨らむ方向というのは僕たちが認知する世界とは垂直の方向で、僕たちはその方向への移動ができませんし、直接知覚できません。それは時間軸のような気がします。ビッグバンの爆心地は僕たちの宇宙のいたるところから同じように過去で、同じ距離に存在することになります。それは、僕たちが決して到達することのできない過去に存在するわけです。
単純化のために2次元で考えると、僕たちの宇宙は爆心地を中心とした円上に存在し、その円が時々刻々大きくなっているというモデルになります。円周方向が僕たちの認識する空間で、動径方向が時間に相当します。2次元風船モデルと呼ぶことにします。物理の世界では時間と空間は区別なく統合されることが多いので、時間と空間が図の中に同じように示される2次元風船モデルはとっても魅力的です。

風船モデルは意味がない?

風船モデルはとっても単純で魅力的なんですが、いろんな弱点があります。特に重要なのは、僕たちが星々の過去の光を観測するという事実をそのままではうまく説明できないことです。遠く離れた星は、僕たちの星とはビッグバンの爆心地からの方位が異なります。そして、遠く離れた星での発光現象は「過去」の出来事なので、動径方向の距離も異なります。遠く離れた星の過去の光を僕たちが観測するとは、遠くの星の過去の位置から発せられた光が現在の僕たちの位置に届くということです。つまり、遠くの星の過去の位置と現在の僕たちの位置を結ぶ直線が、その星の光の経路になるでしょう。図に書くと次のような感じです。



遠い星からの光を前提なしで直線だと断じることはできませんが、直線でないとなると直線でない理由を考察しなければなりません。重力で光が曲がったように思っても、曲がっているのは空間であって光そのものは直進するというのが一般相対性理論の結論ですし、光は直線だと考えるのが素直です。
さて、ある星である時刻で発せられた光が現在の僕たちに届くとします。その星が別の時刻で発した光は現在の僕たちに届くことはありません。別の時刻の光が僕たちに届くのは、現在とは別の時刻になるでしょう。ところが、風船モデルでは、現在の僕たちとその星のあらゆる時刻とを結ぶ直線を考えることができます。逆に考えると、現在の僕たちは、特定の星のいろんな時刻(時代)の光を観測できてしまうのです。そこから、現在の僕たちに届く光には何らかの条件が必要だとわかります。どんな条件でしょうか?

遠くの星からの光に角度の制限がないと、あらゆる時代の地球に光が届く


遠くの星の話だといろんな要素が入るかもしれないので、僕たちのいる場所で発する光を風船モデルで考えてみましょう。僕たちの知っている光の重要な性質に、光はとっても速いということがあります。そこで、風船モデルにおいて「速さ」を考えます。速さとは単位時間当たりの移動距離です。つまり、ある時刻ののちにどれだけ移動するかを考えます。風船モデルでは、時刻とは動径方向、距離とは円周方向に相当しますので、ある時間刻みで、一定距離進む様子を作図すると次のようになります。



「速い」とは、同じ時間刻みの際の移動量が大きいということです。図に見られるように、速くなると経路の角度が立ってきます。すなわち、風船モデルにおいて「速度」とは、「時間の進む方向との成す角度」のことだとわかります。その角度が小さいと遅く、大きいと速いわけです。では、その角度はどこまで大きくなれるのでしょう?光はとっても速いので、「速度」の限界値だと思って差し支えないでしょう。
作図上で最大の角度は「後ろ向き」の180度ですが、それは「過去」の方向です。そのような光は「未来からの光」として観測されることになりますが、そういうものに出会ったことはありません。つまり、そういう角度は許されません。過去にぎりぎり向かわない最大の角度はすなわち、時間軸に垂直な方向です。つまり、光は世界を表す円の接線方向に進むのだと考えられます。

風船モデルでの赤方偏移

宇宙における赤方偏移というのは、遠い星から発せられた光が、星との距離に応じて波長が長くなって観測される現象のことを言います。風船モデルでは波長を考えるとややこしいので、代わりに周期を考えることにします。光速は一定と考えたとき、波長が長くなると周期が長くなることは同じ意味になります。
下図のように、遠い星から光が発せられる場合を考えます。光の波を考えた場合、光は振動によって一定の周期で山と谷を繰り返します。ある時刻で光の波が山になって、その後谷になって、また山になって、となります。一方、遠く離れた僕たちの世界では、遠くの星からの光を観測します。風船モデルにおいて、光は線で表されるので、下図のように光の山と谷が平行線となります。僕たちはその平行線と次々と出合うことで、遠くの星からの光を波として観測します。
さて、この図において、山と谷の間隔が遠くの星の時間軸と僕たちの時間軸とでは違っていることがわかります。幾何学を考えると、星の時間軸での周期が、僕たちの時間軸では$1/\cos \theta$倍になっていることがすぐにわかります。これが風船モデルにおいて観測される赤方偏移です。

驚くべきことに、風船モデルにおける赤方偏移は一般相対性理論に基づく宇宙論的赤方偏移とほとんど一致します。さらに驚くべきことに、風船モデルにおける赤方偏移の議論は、宇宙の膨張が一定であっても、赤方偏移でみると宇宙の膨張が加速しているように見えるということも説明します。面倒なので詳しい説明はやめますが、風船モデルでは円周に沿った距離と、平坦な時空における直線距離の2種類が考えられ、遠くの星ほど両者の開きが大きくなります。その結果、星の間の距離が見かけ上変化し、そのせいで、加速膨張しているように見えるというからくりです。

常に光速で運動する

風船モデルにおいて、僕たちの認識する世界がなぜ円周上に限られるのかについて議論しないといけません。また、宇宙の膨張速度に関しても議論しないといけません。
ハッブル定数から見積もられる宇宙の年齢がおおむね宇宙のサイズに等しいということは、最近の宇宙論では単なる偶然だとされています。というのも、風船モデルのようなものを考えたとき、宇宙のサイズと宇宙の年齢が等しいということは、ビッグバン以降、僕たちが光速で飛び続けているという結論になるからです。通常議論される宇宙の膨張速度は光速よりずっと遅いと考えらえているので、都合が悪いわけです。なので途中にインフレーションが起こって、たまたま宇宙のサイズと宇宙の年齢が等しいというのです。
一方、光速で運動していると相対性理論にがんじがらめにされて、いろいろ不具合が生じるものだと考えらるわけですが、そんな兆候は一切ありません。だから、僕たちが常に光速で移動していると考えるのは受け入れがたいのです。でも、本当にそうでしょうか?

光速に近い運動の際に無視できなくなるローレンツ変換は、4次元時空では単なる回転操作になります。便宜上、静止している物体は時間方向に光速で運動していると考えると、ローレンツ変換は光速を上限とする世界における運動量保存則のようなものになるのです。これはよく知られた話です。だから、僕たちは常に光速で運動していると考えてもおかしくないのです。
アインシュタインの相対性理論の有名な式$E=m c^2$は静止質量に関するエネルギーですが、もっと一般的で厳密な式で$E^2=m^2 c^4+p^2 c^2$というのがあります。この式では、静止していたとしても、4次元時空では$m c$の運動量を持っていることを意味します。すなわち、僕たちは静止していたとしても4次元時空では光速で運動しているという考え方ができるのです。

光速で運動していると、どのような不具合に直面するでしょうか。光速での移動に成功した人はいないので想像するしかありません。ネットを検索すると、多様な意見を見つけることができます。でも、最初にそういうことを考えたのはアインシュタインでした。完全に光速に達するところはあいまいになっていますが、光速に達しない状況に関しては、次のように、きっぱりと断言しています。
あらゆる慣性系で運動の法則が同じように成立する
すなわち、光速にいくら近づいても、特別なことは起きない、ということです。そのような条件で運動の法則を書き直したのが相対性理論です。だから相対性理論を信じる限り、光速に近づくと特別なことが起こるというのはウソです。
そして、光速に達するということをローレンツ変換で考えると、4次元時空における速度ベクトルが元々の時間軸に対して垂直になるということだとわかります。一気に光速に達する代わりに、徐々に光速に達することもできます。その際、光速かどうかというのは、出発時点での時空に対して光速(垂直)なだけであり、途中の速度からみると、まだまだ光速には達していません。すなわち、出発時の運動の法則=光速未達のとき(途中)の運動の法則=(出発時に対する)光速時の運動の法則、となります。ゆえに、光速に達しても僕たちは何も感じないと結論できます。
だから、僕たちは元々光速で運動していると考えても全く問題がないと思うのです。逆に言うと、光速で運動している影響を僕たちは常に受けていてそれを当たり前だと感じているかもしれません。ローレンツ変換もその一つですが、それよりも身近に強い影響を受けている可能性すらあります。僕たちは時間軸方向の運動に自由がありませんが、それは僕たちが時空において時間軸方向に光速で運動し続けているからということで説明が可能です。光速に近い速度で運動すると、運動方向の空間が縮むという話があります。光速に達すると、その方向の空間が完全につぶれて、その方向の運動が禁止されるわけです。
これを風船モデルで考えると、僕たちはビッグバン爆心地から光速で飛び去っているので、その方向の運動が禁止され、その方向に垂直な運動だけを認識する、ということです。その結果、僕たちの世界は円周上に限定されるという説明が可能になります。
僕たちの世界が円周上に限定されるということは、あらゆるレベルの運動が円周上に限定されます。光は、電荷をもった粒子(通常は電子)の運動が元になって発せられますが、その運動は空間方向に限定されるので、光は空間方向、すなわち時間軸に垂直な方向に発せられると理解できます。

光は、時間軸に垂直に発せられるとしたとき、現在の僕たちが観測する光(星空)は、どのような時間的・空間的位置から発せられたものでしょうか?風船モデルで作図してみましょう。
ビッグバンの爆心地と光源を結ぶ直線がその光源での時間軸になります。その直線に垂直に光が発せられ、現在の僕たちに届きます。すると、ビッグバン爆心地・光源・現在の僕たちを結ぶ直角三角形ができます。このように、ビッグバン爆心地と現在の僕たちを結ぶ直線を長辺とする直角三角形の直角の位置をつなぎ合わすと、下図のような小円が描けます。



つまり、僕たちが観測する星空がこの小円です。現在の宇宙を表す円に対してちょうど直径が半分になります。ここから、僕たちが観測できる宇宙の差し渡しサイズは現在の宇宙のサイズのちょうど半分ということがわかります。また、過去にさかのぼって僕たちの宇宙に光を届けた(可能性のある)範囲は、小円の内側ですが、現在の宇宙を成り立たせるには、大円の内側全てを考慮しなければなりません。その面積比は1:4です。
2次元の風船宇宙の話を3次元時空における風船宇宙に置き換えてみましょう。円は球になります。円周は球の面積になり、円の面積は球の体積になります。1:2⇒1:4、1:4⇒1:8になります。さらに4次元時空の風船モデルでは、1:2⇒1:8、1:4⇒1:16になります。1:(8-1)というの通常物質とダークマターを比、1:(16-1)は観測できるエネルギーとダークエネルギーの比に概ね一致します。
言いたいのは、僕たちは宇宙のすべてを観測することはできないし、宇宙のすべてが僕たちの宇宙に影響を与えるわけではないということです。そういう僕たちとの関係が薄い「宇宙の何か」がダークマターとかダークエネルギーとかかもしれないよ、という指摘です。

量子力学における矛盾を風船モデルで説明する

量子力学はとても成功した理論ですが、いろいろ奇妙なことが起こります。いまでは、そのほとんどが検証され、正しいことがわかっています。だから、量子力学を疑う人はまずいません。でも、僕は量子力学にもいくつか疑問を持っています。
量子力学では光(のようなもの)を介してエネルギー交換が生じます。そして、エネルギー交換前後での因果関係があやふやになります。それは結果の状態が確定しないと原因の状態も確定しないという有名な話のことです。例えば、レーザーから光子が飛び出て、壁に当たって吸収されたという現象を考えたとき、光子の発生は完全に量子力学過程です。壁に当たって光子が吸収されるわけですが、その吸収も最初の段階は量子力学過程です。レーザーと壁の2つの系で光子というエネルギーが量子力学過程で結びついているわけです、僕たちは、レーザーの発光と壁での吸光に因果関係を感じますが、それらが一つの量子力学過程だと思うと、レーザーから光子が出る現象と壁で光子が吸収される現象は、どちらが先かという議論は意味がないことになります。つまり、壁で光子が吸収されるから、レーザーから光子が飛び出したという説明もOKということです。僕たちが普通に感じる因果関係とは逆ですが、量子力学はそのあたりをあいまいにします。
常識的に考えると、関連する二つの事象を時系列に並べて、先に生じる事象の方を「原因」、後に生じる事象を「結果」だと、僕たちは認識します。光はとても速いですが、その速度は有限ですから、関連する二つの事象のうち、どちらかが先で、どちらかが後のはずです。先に生じる方が「原因」で、それが無ければ後に起こる「結果」もありません。そういう関係を、専門用語で因果関係と呼ぶわけです。壁が光を吸収するには、光が存在しなければならないので、レーザーでの発光が先=原因で、壁での吸収は後=結果であると、僕たちは直観します。有限の光速という事実は、距離を隔てた二つの事象間で必然的に時間的順序を要求し、そこから僕たちは因果関係を見出そうとします。でもそれは間違いだというのが量子力学の主張です。量子力学がいまひとつ正体不明に思える理由です。有限の光速と量子力学のあいまいな因果関係が相いれないというのが僕の疑問です。

壁とレーザーだったら距離が近いので、因果関係があいまいになっても何とか許せますが、星の光と僕たちの眼に置き換えると違和感が顕著になります。遠い星での発光と僕たちの網膜での化学反応は、星から発せられる光子を通じて量子力学的に結びつくはずですが、余りに遠い場所での出来事なので因果関係をあいまいにはできません。だって、その光は、何万年も前に遠い星で発生したものなんですから!何光年も離れた星での現象が、僕たちの観測の有無の影響をうけるなんてことはないはずです。でもそれが起こるのだというのが有名な量子テレポーテーションです。問題提起した科学者たちの頭文字をとってEPR(Einstein-Podolsky-Rosen)相関と呼ばれています。皮肉なことに提唱者の一人であるアインシュタインはEPR相関はあり得ないという立場を取りました。現在は、EPR相関の実在が確かめられていますが、理解は進んでいません。ただ、EPR相関を用いた計算機である量子コンピュータの開発が盛んにおこなわれています。
「同時」の概念の基準を光とする相対性理論と因果関係を問わない量子力学は、短距離ではなんとなく受け入れられるかもしれませんが、長距離ではあきらかな違和感を生じます。風船モデルでこのあたりを考えてみましょう。

風船モデルが正しいかどうかなんてわからないのですが、風船モデルにおいて光線の上を「同時」と定義しましょう。光を時間の基準にするとはそういうことです。どんなに離れていても「同時」です。遠く離れた2つの現象は「同時」です。どんなに奇妙でも、遠く離れた星の正体不明の発光現象と僕たちの眼の中の色素のcis-trans転移は、同時に起こっているのです。2つの現象が何光年離れていても一つの同じ光子の介在を考えると、同時なのです。これはEPR相関だと言えます。
一方、僕たちにとっての同時とは、僕たちの時間軸に垂直になります。それは遠い星における同時とは全く違う直線になります。「同時」が二つの事象で異なるのです。それを図にしたものが下の図です。



一目瞭然です。遠い星の「同時」と僕たちの「同時」が異なります。特殊相対性理論を受け入れた瞬間、僕たちは全世界共通の時計を捨て、場所や慣性系ごとの時計を持つようになりました。それはつまり、二つの場所に共通する「同時」の概念を放棄することを意味します。それが相対性理論の奇妙さの原因だと僕は思います。それでも「同時」の概念は必要だし、なくなったりしないはずです。僕は、「同時」の概念を完全に説明する相対性理論の資料にであったことがありません。時計が遅れるとか進むとかの話は多いですけどね。

相対性理論では光を時間の基準に据えます。これは、光を「同時」と定義することを意味します。風船モデルでは光は線で表されますが、その光線の上はすべて「同時」です。奇妙なことに、上図で描いたように、遠い星での「同時」と僕たちの「同時」は同じ直線にはなりません。これは「同時」の概念の拡張です。
光線の上は「同時」ですから、どんなに遠くても「瞬時」に相互作用できます。空間的には隔たっていますが、時間的には隔たっていないのです。時間的に隔たっていなければ、「瞬時」に相互作用できます。だから、遠くの星の発光現象と僕たちの眼の中の色素の化学反応は一つの量子力学的相互作用で結びついてもよいのです。
図で明らかなように、僕たちから見ると、遠い星での発光は過去の出来事であることは明らかです。僕たちの時間軸で考えると、遠い星での発光と僕たちの眼の中での化学変化にあきらかな時系列が認められ、そのため僕たちはその順序を因果律として直観するわけです。
このように、風船モデルは量子力学における因果関係の長距離相関をわりとすんなり説明してくれます。そして残念なことに量子テレポーテーションに抱いている僕たちの希望を打ち砕きます。無限の可能性を秘めたファンタジーとしてのテレポーテーションは、その他の科学と同様に無情な限界をもつ当たり前の現象として、冷酷な物理法則の奴隷となるのです。

光速は無限か有限か

僕たちは光速が有限であることを観測事実を通して知っています。しかし、風船モデルでは一本の線として描かれ、それは時間を超越して存在しています。つまり、光線は伸びてゆく直線ではなく、発光点を通り時空全体を横切る線であるということです。宇宙規模のEPR相関を肯定し、何億光年も離れた二つの場所の現象が「同時」に起こり得るという、文章にすると信じられないような記述になります。あたかも、速度が無限に見えます。

風船モデルにおいて、光は時々刻々移動する輝点かもしれません。その場合、過去に発せられた遠い星の光を現在の我々が観測するということが著しく困難になります。
風船モデルにおいて、光を時々刻々移動する輝点と考えるということは、動径方向の時間軸以外に時間の概念を考えていることになります。その場合、星も我々も、ビッグバンの爆心地から遠ざかる点と考えねばなりません。星の光を観測するとは、点として移動する星から発せらえた光子の点が、同じく点として移動する僕たちにちょうどヒットする、ということです。それはかなり難しいということがわかります。だから、風船モデルに描かれた時間軸(動径方向)が僕たちの主観時間であると考えた方が合理的です。それはつまり、光は線であり、僕たちや星々も線だということです。光は線だけれど、僕たちや星々は点である可能性も残っています。ただしその場合、光線は遠く離れた現象と「交差」はしますが、「つなぐ」ことはしません。つまり、EPR相関は起きなくなります。

では、僕たちが観測する光速とは一体何でしょう。実は、風船モデルにおいても、有限の光速が観測されます。光速を測定する場合、一定距離離れた2つの場所に発光器と計測器を置き、発光時刻と光の観測時刻を精密に測定することで、光の速さを求めます。これを風船モデルで作図すると、次のようになります。



ビッグバンの爆心地を中心とする円弧が「現在」で、その半径を$r$とします。発光点から$r \theta$離れた地点で観測を行います。光は発光点の時間軸に対して垂直に描かれるます。この図でわかるように、発光後$\Delta t$秒後に光を観測することになります。距離$r \theta$を$\Delta t$で除したものが光速です。$r$はビッグバンからの経過時間に比例しますが、ビッグバンからとても長い時間が経過しているので、計測時刻が違っても結果に差はほとんど現れないでしょう。すると、距離が倍になれば、$\Delta t$もほぼ倍になり、光速は一定だという結論が得られてもおかしくありません。
ただし、それは僕たちが計測した光速で、風船モデルでは光は線として描かれて「同時」の基準ですから、この測定法は同時を定義することであって、「光速」を測定しているわけではないのです。
実は、計測された光速が、ローレンツ変換に現れる光速と同じである必然性は、風船モデルでは説明できません。風船モデルで観測される光速は、$r\theta / \Delta t $で、$\Delta t /t= 1-\cos \theta \simeq \theta ^2 / 2$であることを考慮すると、計測される光速は$2 c  /\theta$となります。これは光速の定義からは程遠いですが、一応有限の値にとどまります。
フィゾーの実験では、光が往復する時間を計測しました。その場合、もっと奇妙なことがおこなります。今度は、観測地点に鏡をおいて、発光点で時間を計測することになります。同時の概念が拡張されているので、光にとっては発光と同時に鏡に到達し、即時に反射します。そして反射すると同時に発光点に戻ります。反射に要する時間を0とすると、光は、発光と「同時」に発光点に戻ってくることになるのですが、戻ってきたときの発光点の時間は進んでいます。これはある種の「ウラシマ効果」です。その時の経過時間は、驚くべきことに片道に要する時間と変わらない$\Delta t$です。往復したのに片道の時間しか経過しないのです。それは「同時」の概念が拡張されているからにほかなりません。距離は$2 r \theta$進んだことになるので、算出される光速は$4 c/\theta$になります。余計な2が消えるどころか増えました。
まさにこの部分は風船モデルの弱点で、僕が風船モデルを確信できない理由です。ローレンツ変換に現れる光速は、僕たちの時間の概念の基準であり、風船モデルでは宇宙の膨張速度であるわけですが、それは上記の方法で測定した光速と一致しないのです。一致するには、ビッグバン爆心地からの距離が極めて不自然な値でなくてはなりません。それはあり得ないのです。

おことわり

風船モデルは、平坦な時空を俯瞰するというだけのモデルで、突飛な話ではないと僕は思っています。
でも、風船モデルでは、いくつか奇妙なことが起こります。僕たちは常に光速で移動しているので、過去方向からの様々な力は僕たちに届きません。ビッグバン理論では僕たち自身が作る重力で宇宙が縮小に転じることになるので、それを防ぐ「何か」としてダークエネルギーなんかが議論されています。でも、風船モデルでは過去からの重力などが現在に届かないので、宇宙を収縮する力として働きません。逆に、未来からの力が働くことになるのですが、それは宇宙を膨張させる力になります。ただ、僕たちはとっくに光速に達しているので、それ以上加速しません。
時空をすべて俯瞰する風船モデルでは、すべての事象は不確定性も含めて決定済みだと考えられます。つまり、運命(運命図)の存在が肯定されるのです。ただ、いつ、だれが、どのような原理で、運命図を描いたのか、というのは全くの謎で、僕たちが知覚できない「神の原理」の存在が推測されます。
僕たちの知覚する時間とは異なりますが、時空を俯瞰する世界の原理にも「時間」に似た概念があり、そこでは運命図が「神の原理」に従って成長し、ゆらいでいるかもしれません。
風船モデルによれば、発光と受光の現象は「同時」ですが、それぞれの時刻は異なりますし、同じ円周上ではないので「世界」も異なります。発光点にいる僕たちが受光点の「世界」まで移動し、結果を確認したとして、発光点の僕たちと受光点での僕たちでは、移動に要する「時間」の分だけ時空を俯瞰する世界での「時間」が違っているかもしれません。その間の運命図のゆらぎによって、僕たちの観測結果は不定になる、なんていうのも面白い考え方です。つまり、ある瞬間の現象は過去も未来も含めて完全に決定されているけれど、主観時間の経過とともに過去・現在・未来の描像がゆらぐので、現在の僕たちが未来に到達した場合のことは、不確定になっているという何を言っているのかわからない感じになるっていうことです。ちょっとしたロマンです。

風船モデルでは、僕たちの知覚する時間がすでに書き込まれているので、物質は点ではなく線で描かれます。重力や電磁気力のような場は線を取り巻くチューブのような形状になります。重力や電磁気力、弱い力、強い力という僕たちの世界を構成する基本法則は4次元の時空で完全に成立するようになっていることが知られています。だから、風船モデルのように平坦な時空でも違和感なく成立すると思います。
いくつかの事案では、4次元の時空を僕たちは光速で運動していると考えるのが自然に見えるのですが、そのためには常に加速されている必要があります。ローレンツ変換では、僕たちにかかわるあらゆる3次元空間中の運動が4次元時空中では時間軸方向の加速に寄与する形になります。しかしながら、時間軸方向は光速の制限を受けるので、運動する度に減速させられています。そのようなことが顕著になるのは振動です。光速で移動している物体は移動方向の運動が制限され、その物体(あるいは周辺)の運動は光速移動方向と垂直にしか許されません。それはローレンツ変換を受け、運動が妨げられ、物体は加速を減じられる=慣性を受けます。そのようなことが起こると普通はエネルギーが散逸し、運動がなくなるわけですが、零点振動という現象があり、ある種の振動は決してなくなりません。それは永遠に加速し続ける装置になります。振動運動はローレンツ変換によって抑制されるので、慣性質量をもつようになります。断っておきますが、これはヨタ話です。

ヨタ話ついでにもう一つ。風船モデルでは、タイムマシンが作成可能です。過去への通信だけでなく、過去への移動すら可能です。もちろん、エネルギーの問題は別途解決しなければなりませんけれど。過去への通信は物理的障害が低めです。光は時間軸に垂直に発するので、その光が僕たちにとっての過去や未来の方向に傾いていれば、過去や未来の方向に光を届けることができます。具体的には、鏡面仕上げした高速回転するコマの側面に光を当てるだけです。コマの側面が極端に高速だと、時空図において我々の時間軸とは違う角度に時間軸を持ちます。そこで光が反射すると、その時点での時間軸に垂直な方向に光が進みます。コマの側面が我々に近づく場合には、赤方偏移とは逆の青方偏移が観測され、それは過去に向かう光です。その場合、光を当てる前にコマが光るの現象が観測されるはずです。これはすなわち、過去方向への情報交換が可能ということです。コマの回転速度が速いほど、コマから距離が離れるほど、時間のずれが大きくなるでしょう。
過去に移動するには、とにかく加速して速度を増します。僕たちを乗せたタイムマシンがどんどん加速するという仮想実験をしましょう。加速方法やそのエネルギーに関する問題は大人の事情で無視します。時空における加速の実態は、ローレンツ変換による時間軸の回転です。どんどん加速して出発時点に対して90度回転まで来ると、タイムマシンは光速に達することになります。光速に達しても加速をやめないとさらに回転します。回転が180度になると、もともとの時間軸に対して反対方向となり、これは時間の逆行です。さらに加速して回転角度が360度になると元の時間軸に戻ります。加速にはとても長い時間がかかるでしょうが、僕たちを乗せたタイムマシンの航路は時空図に円を描きます。つまり、長い加速の末に僕たちは出発地点に戻るのです。そこに現在の地球があるかどうかはわからないのですが、運命図の概念が正しければ、そこに現在の地球があるはずです。途中の時間逆行時にすこし加速を緩めるとより過去の地球にたどり着くこともできます。それはまさに僕たちの知っている真のタイムマシンの機能です。が、光速に達するだけでなく、その4倍も加速するわけで、途方もない時間が必要です。人類が到達した最高速度はボイジャー1号の秒速1万7000kmで、これは光速のたった5.6%です。

風船モデルにおいて振動する粒子を描くと、「波」線になります。中心力が必要なので、もう一つ粒子を描くとそれらは互いに絡み合ったらせんになります。それらがローレンツ変換を受けたとき、細部の形状がどのようになるかは僕にはわかりませんが、ちょっと奇妙になる気がします。あ、断っておくと、風船モデルの真偽にかかわらず、4次元時空において振動を考えると必ずこのような議論になります。これは先ほどの永久に加速する装置です。
小さな粒子の運動だと違和感は生じませんが、大きな天体となると、違和感が顕著になります。太陽系内の天体の運動では重力などの伝搬にかかわるタイムラグはほとんど無視できますが、銀河のような大きなスケールでの天体の運動はとても難しくなります。というのも、ある天体Aの重力が別の天体Bに到達するには何万年も必要で、重力が伝搬する間に天体Bは移動してしてしまっているわけです。天体Aと天体Bは重力を介して相互作用しますが、その相互作用は対称ではない(天体Aが天体Bから受ける力と天体Bが天体Aから受ける力は同じではない)のです。「同時」の概念に似ていますよね!
天体が運動すると天体の作る重力場は時々刻々変化しますが、風船モデルでは時間が描きこまれているので、静的な図形になります。それぞれの天体の運動から、それらの経路について計算される重力場が描かれ、それに従って天体の運動が定まるわけです。こういう関係をself-consistent(自己無頓着場)と言います。あるいは、定常解というときもあります。しかも、僕たちが観測する天体は時空の切り取り面だということも考慮しないといけません。
風船モデルでは意図的に天体の作る時空のゆがみの議論を外しています。大きな天体は自身の重力によって時空をゆがませます。風船モデルでは一つの円周を「世界」とし、暗黙の了解として同じ円周上にある物体を通常の意味での現実の構成要素とみなしていましたが、時空はゆがみうるので、「世界」もゆがみます。実際の「世界」はきれいな円弧ではなく凸凹なのです。ブラックホールのような極端な重力場ではまさに落とし穴のように時空がゆがんでしまいます。時間の進行方向はもはやビッグバンの爆心地の逆方向とはなりません。時間軸はおおむねradial方向でしょうが、細かく見るとゆらぎがあります。その時の時空図はとても複雑になるので、うまく計算できるかどうか自信がありません。

さて、最初に言及した宇宙背景放射を風船モデルで考えてみましょう。宇宙背景放射は正確に言うと「宇宙の晴れ上がり」というビッグバンの40万年後の重要イベントの残光です。風船モデルでは、振動する物体は加速されるわけですが、光速に到達するにはそこそこの時間が必要だと思われます。ほとんどの物質が光速に到達し、飛散が本格化したのが「宇宙の晴れ上がり」と考えます。そのとき宇宙は小さな円(球あるいは超球)になっているでしょう。そこから現在の僕たちに向かって光が届くわけです。それを光線Bとします。光線Bは僕たちの時間軸に対して、それはそれはとても浅い角度です。風船モデルにおける方位角θは90度に近く、極めて大きな赤方偏移を示します。光線Bは過去からの光ですが、僕たちは時間軸を知覚できないので、光線Bから時間軸方向の成分を取り除いた部分だけを知覚します。残った光線のベクトルはとても小さいですが、方位はどのようにもなり得ます。つまり、あらゆる方向に光線Bを観測するわけです。光線Bの発光点は極めて遠くの狭い領域ですが、観測される方向はいろんな方向というちょっと矛盾したようなことが起こり得るのです。それは現象を4次元の時空で考えるべきなのに、僕たちの知覚できる宇宙が3次元の空間であるという齟齬による違和感です。

風船モデルは単なるモデルで致命的な弱点もあるし、僕はあんまり信じていませんが、現状の宇宙論のような複雑怪奇なものよりは「筋が良い」と思っています。「オッカムの剃刀」という逸話があって、真実は往々にして単純明快であるという経験則があります。アインシュタインは光速があらゆる観測者にとって同じであるというかなり単純な原理を取り入れて相対性理論にたどり着きました。ビッグバンを時空の中に描いてみたらどうなるか、という素人でもわかる原理を取り入れたのが風船モデルです。平坦な時空とビッグバンだけを前提にしているので、それらが正しければ風船モデルも正しいはずですが、その前提が正しいかどうかはわからないので、風船モデルもヨタ話の域をでません。
例えば、ビッグバンはなかったけれど僕たちが観測する事象はビッグバンのような膨張する宇宙論に合致する部分だけ、という状況も考えられます。その場合にはいかなる観測事実を積み重ねても、ビッグバンの有無は結論できません。そんな奇妙なことがあるわけないと思うかもしれませんが、僕たちの観測できる宇宙について、風船モデルにおける小円のような条件が存在していることは確かです。その条件がビッグバンのように中心から膨張する現象に一致する部分だけ、ということは理論上あり得ます。だから、実験事実がどうあろうと、ビッグバンがないとか、インフレーションがないとかの可能性を排除すべきではないと僕は思うのです。

2017年9月20日水曜日

Wish and Spirit

新しいiPhoneが発表された

多くのリーク情報が氾濫したため、目新しさが半減したが、とにかく新しいiPhone(Xと8)が発表された。フラグシップモデルのiPhone XでAppleはついにホームボタンをなくした。それはJobsの長年の指令だった。Jobsの遺志を継いだTim CookはJobsが目指したことを忠実に実行し、達成したことになる。それは正しいことだったのか?

Jobsは何故ホームボタンをなくしたかったのだろう?

Jobsは典型的なミニマリストだ。だから、何事もシンプルな設計を好む。だから、ボタンは一つでも減らしたかった。その象徴がホームボタンだった。
おそらく、ボタンが減るのなら、それがホームボタンでなくてもよかったはずだ。でも、堂々と一番目立つところに大きく鎮座していつも目につくのがホームボタンなので、ホームボタンを好んで攻撃したのだと思う。真面目なCookは、それを真に受けたのだろう。あるいは、Jobsの遺志(Wish)を実現することが、今のApple社員たちの社是なのだろう。それはすでに故人崇拝の域に達している気がする。

iPhoneはボタンが多い

iPhoneはスマートフォンの元祖なので、レガシーを引きずっている。その結果、現行のスマートフォンの中では、もっともボタンが多い機種となっている。僕の使っているAndroidのボタンは3つだ。前の機種から、ボタンは3つしかない。それに比べて、新しく発表されたiPhone 8はボタンがなんと5つもある。iPhone Xではボタンがひとつ減って、4つになったわけだが、それでもまだ1個多い。
ホームボタンが減って大騒ぎしているのは、iPhoneユーザーだけで、Androidユーザーは何年も前にそれを経験している。僕は、今のAppleは迷走状態にあるのだと思う。

Appleの迷走ぶりは、2013年のiPhone 5sで顕著になった。Jobsが亡くなって2年経っており、Jobs抜きで開発した製品を発表しなければならなかった。その時、搭載された機能が、件のホームボタンに指紋認証を付与したTouch IDだった。Jobsの遺志を尊重して開発チームはホームボタンの廃止を検討していたに違いない。にもかかわらず、目玉機能をホームボタンに追加してしまった。それから4年、Touch IDはiPhoneの重要な機能の一つになってしまった。いくつかの重要な機能がTouch IDと強く結びついてしまった。それはつまり、ホームボタンを簡単には廃止できないということだ。iPhone Xに関する驚きの多くは、Touch IDがなくなって不安だ、というものだ。Touch IDをホームボタンに搭載したことで生じた混乱だと言える。
Touch IDをホームボタンに搭載した時点で、このような混乱は予想できた。

どうすればよかったのか

Appleは破壊的なイノベーションによって成長を続けてきた会社だ。既存の自社製品を陳腐化してしまうような新製品を次々と投入してきた。だから、Touch IDを捨て去るという判断も、Appleらしいと言えるかもしれない。
でも、Touch IDは結構筋の良い技術だ。生体認証を様々な場面で気軽に利用できるということは、セキュリティー確保において極めて大きなアドバンテージとなっている。しかも、それをホームボタンに搭載すると、スマートフォンを使い始める操作=認証のための操作となるので、今までの使い方を変えずに、強力な認証機能を追加できる。こっそりハイテク型の非常に筋が良い技術だ。僕は廃止すべきはホームボタンとTouch IDではなかったと思っている。廃止すべきだったのは、消音ボタンと電源(サイド)ボタンだ。それで、Android端末とようやく肩を並べ、Touch IDの分だけ有利になったろう。

迷走

Jobsはこっそりハイテク型の技術をとても大事にした。AppleのOSはとても人気があるが、その理由の一つに独特の質感がある。指に張り付くような滑らかなスクロールはiPhoneの代名詞だが、そのような質感を実現するには極めて複雑で面倒くさい調整(プログラミング)が必要だ。それには時間とコストがかかるが、Jobsはあえてそのような細部にこだわった。目につきにくい部分の細かな技術の積み重ねによって、「気持ちよさ」が伝わるということを熟知していたに違いない。

Jobsが本当にやりたかったのは、iPhoneの特徴とみなされるホームボタンすら例外とせずに改良の対象とすることだったと僕は思う。そういう聖域なき改革でしか、より完成度の高い道具を目指すことはできないからだ。
生前のJobsなら、ホームボタンを廃止するなんて、簡単だったはずだ。でもしなかった。それには理由があったはずだ。おそらく、その一つは、「サイドのボタンは押しにくい」といったシンプルな理由だと僕は思う。電源ボタンあるいは、ホーム画面呼び出しボタンとして頻繁に押すことになるホームボタンが押しにくいなんて、Jobsには考えられなかったはずだ。ホーム画面の呼び出しは別のボタンでもよかったと思う。我慢ならないのは、使い始める動作がスムーズでないことだったろう。だから、あえてホームボタンを廃止できなかった。
頻繁に押すボタンだからこそ、ホームボタンは目立つところに押しやすいように配置されねばならなかった。見た目のデザインを損なったとしても、シンプルに機能を追及するというのは、典型的なミニマリストの哲学だ。
そういう意味で、Touch IDはJobsのアイデアだったかもしれない。僕なら、ホームボタンは廃止でもTouch IDは廃止しないだろう。Touch IDのような認証機能はスマートフォンを握ってから画面を指で触る前に完了することが理想だ。スマートフォンを握るとき、人差し指はスマートフォンの裏面の特定の場所に自然に張り付く。僕ならその位置にTouch ID機能を搭載する。それで、緊急時の電源操作を行う小さなボタンを残して、ほかのボタンを廃止する。Touch IDはボタンとしてのメカを廃止するけど、電源ボタンとしては機能するようにするだろう。

Tim Cook率いるAppleの開発者たちは、JobsのWishを忠実に実現した。でも、それはJobsのSpiritに反すると僕は思う。そういう最終手段に訴えたということは、Jobsの遺産は今回で完全に枯渇したと僕は見ている。その証拠に、新しいiPhoneにはびっくりするような革新が全くなかった。顔認証はすでにありふれている。Face IDの精度は高いかもしれないが、僕たちが求めているのはそういうものではない。僕たちの日常が変わってしまうような、使わずにはいられない気の利いた技術革新だ。

Face IDの最悪な点は、真黒なスマートフォンの画面を一瞬見つめないといけないことだ。僕らがスマートフォンを使い始めるとき、スマートフォンを握るや否や、電源ボタンあるいはホームボタンを指で探って操作するものだ。そういう何気ない動作によって、僕たちは無意識のうちに画面を正面い捉える前からスマートフォンを使い始めている。顔認証では原理的にそういうことは無理だ。Jobsなら即却下するだろう。

2017年9月19日火曜日

物理や数学における作法

記法

高校では、数学や物理の記法は完全に統一されていて、ベクトルだったら、$\overrightarrow{a}$という感じで、文字の上に矢印を書くと教わる。でも、大学の物理の教科書では、$\bm{a}$のように太字&イタリックで書くことが多い。どっちが正しいかというと、統一さえしておけばどっちを使ってもよい、とされている。ほかの表記法を好む人も多い。
最近は、学校教育で$\overrightarrow{a}$を使う国が多いので、$\overrightarrow{a}$が増えてきた。でも、がっつり系の専門書は依然として$\bm{a}$が大半だ。僕は最近多次元を取り扱うことが多いので、$a_i$のように添え字を使うことが多くなっている。

数学では、このような記法の問題はしばしば問題になる。だから、数学の論文では最初に記法の説明がまとめられていることも多い。統一したら良さそうなものだが、次から次へと新しい記法が編み出されるので、統一しようにも話し合いが追いつかないという事情がある。

数学がこんな感じだから、数学をツールとして利用する物理の世界にも多くの混乱がある。しかしながら、物理の世界では、もっと保守的だ。

物理学者が発明した記法の典型例として、Diracのブラケットが挙げられる。$\langle a|$とか、$|b \rangle$、さらにこれらの内積を$\langle a | b \rangle$と書く。$\langle a|$や$|b \rangle$は、波動関数に対応するベクトルなんだけど、$\overrightarrow{a}$ではなくて、しかも2種類ある。2種類は厳密に区別されるので、$\overrightarrow{a}$のような記法より優れているかもしれない。
アインシュタインは、別の記法として、$a^i$や$b_i$を発明した。有名なアインシュタイン規約である。より高い次元の複雑な計算を間違わないように進めるために、編み出された記法だ。
物理におけるこれらの記法は、発明者の名を冠して尊重され、特別な理由がない限り発明者の定義通りに解釈される。その点は数学の世界より混乱は少ない。

流派

数学に比べると幾分マシだけど、物理にも混乱っぽいものが存在する。有名なのは、流体力学におけるオイラー的記述法とラグランジュ的記述法だ。同じ流体力学なんだけど、両者は座標系の取り方が違っている。どちらが優れているというわけでもないし、原理的には両者は同じ結論になるので、両論併記というのが普通になっている。でも、学習する側からすると、面倒くさいことこの上ない。

僕は学生の時、X線散乱・回折の勉強をみっちり行った。4回生の時と修士の時で研究室が違っていて、4回生の時は散乱、修士の時は回折の研究室だった。散乱と回折というのは本質的に同じ現象で、測定対象が結晶だと回折、それ以外だと散乱と呼ぶ。そこで気づいたのが、2つの研究室で用いる式がちょっとずつ違う、ということだった。ポスドクの研究室も散乱だったのだけど、そこでの式もちょっと違っていた。ポスドク時のボスは、オーストリーのKratkyスクール、フランスのLaueスクールという呼び方をしていて、その時、学問にも流派があるんだって、知った。
Kratky流とLaue流というのは、まさしくドイツ・オーストリーの質実剛健さと、フランスの優雅さの違いだ。それはフーリエ変換の定義に如実に表れている。
Kratky:  $F(X)=\int f(x) e^{-2 \pi i xX} dx$ / $f(x)=\int F(X) e^{2 \pi i xX} dX$
Laue:  $F(q)= \int f(x) e^{- i q x} dx$ / $f(x)=\frac{1}{2 \pi} \int F(q) e^{ i q x} dq$
前者は小さい文字で$ 2 \pi$というキーワードが現れているけど、後者にはそれがない。式的には後者の方が洗練されているように見える。しかしながら、ブラッグの反射条件を念頭にすると、実は前者の方が優れている。式としての美しさを優先するか、実用性を優先するかという、ほとんど宗教戦争になっている。
僕は、4回生の時にLaue流、修士の時にKratky流を学んだ。ポスドクの時は、両者の折衷であるロシア流というのだった。面白いね。

実はフーリエ変換の定義には、3つのスタイルがあり、そのうち2つはKratky流とLaue流に対応している最後の1つは、
Unitary: $F(q)=\frac{1}{\sqrt{2 \pi}} \int f(x) e^{- i q x} dx$ / $f(x)=\frac{1}{\sqrt{2 \pi}} \int F(q) e^{ i q x} dq$
というもので、こうすると、逆変換が順変換と全く同じ形になるという利便性がある。フーリエ変換にはこれら3つの流派が混在しており、どの教科書で学ぶかで、式が少しずつ違ってくる。

レオロジー

あんまりメジャーじゃないんだけど、僕の専門分野の一つにレオロジーというのがある。実は、僕は学生時代にはレオロジーが苦手で、さっぱりわからなかった。僕はどうもあきらめの悪い性分らしく、何年もかけて、じっくり勉強し、なんとか人並みには理解できるようになった。
僕は高分子物理の出身なので、レオロジーも高分子の流儀に従い、勉強したわけだけど、どうもいまいち納得がいかない状態だった。得心がいったのは、「線形応答理論」というキーワードを聞いた時!だった。線形応答理論というのは信号処理なんかで活躍する数学の一分野で、高分子物理からは縁遠い。僕はソフトウェアが得意なので、線形応答理論も一通りり知っていた。でも、レオロジーと線形応答理論の接点には気づいてなかった。

レオロジーでは、複素弾性率の周波数応答$G^* (\omega)$が物性の基本となっている。一方、線形応答理論ではインパルス応答関数$h(t)$が系の特徴を決定する。なんだか違う感じだけど、驚くことに両者は全く同じになる。
インパルス応答関数というのは、入力関数$f(t)$に対して、応答が$h(t) \otimes f(t)$になるときの$h(t)$のこと。応答関数をフーリエ変換すると、$H(\omega) \cdot F(\omega)$になる。$f(t)$がデルタ関数の時は、$F(\omega)=1$なので、$H(\omega)$が得られる。もし、$f(t)$が$sine$や$cosine$のときは、$F(\omega)$はデルタ関数(の和)になり、$H(\omega)$の特定の$\omega$の情報が得られる。それはすなわち、レオロジーで言うところの$G^*(\omega)$そのもの!
レオロジーにおけるひずみと応力は微小変形の範囲では、互いに線形応答の関係にあるので、数学的必然として線形応答理論に従うわけだけど、見た目が少し違うので、僕は気づかなかった。レオロジーの標準的な学習は、線形応答理論の標準的な学習の流儀とはちょっと違っているというのがその理由の一つ。先にこういうことがわかっていると、僕はレオロジーの勉強に躓かずにすんだかもしれないなぁ、と思いつつ。でもあっさり通過していたら、深い理解に到達しなかったかもしれないとも思う。


2017年8月28日月曜日

数とは何か

ここ数年、ずっと考えていること

僕は工学部化学系の出身で、数学どころか物理も結構ええかげんな感じでしか勉強したことがない。でも、今の僕の専門は、物理で、しかも応用数学チックなところにある。だから、物理や数学のことをずっと独りで勉強してきた。
いろんなことが少しずつ解けてきて、僕自身は満足なんだけど、後から考えると、僕が試行錯誤して学んできたことの多くは、教えてもらえれば苦労なんかしなくてよかったな、って思う。その最たるものが数学だ。

大学の数学で強烈に覚えているのは、僕たちを全く寄せ付けない、εーδ論法だ。一体全体、なんでこんな回りくどいことをしなければならないんだろう?これが理解できない僕たちは、数学に触れてはいけないんだろう。数学は才能の学問であり、才のない僕らは教育すら受ける必要がない、そういう分野なんだと聞かされてきた。理論物理の世界では、SU(2)とか、わけのわからない群論記号で議論が行われる。だからその分野も僕の踏み入れてはいけない領域なんだと思ってた。
でも違った。ある本を読んで、εーδ論法がなぜ必要なのか、理解できた。群論のことも、理解できた。そのおかげで、いろんな数学が一気に理解できて、SU(2)とかも、おおむねわかった。僕に必要だったのは、ちゃんとした説明だけだった。

苦労して勉強してきたおかげで、僕はその先に進むことができるような気がしている。今興味があるのは、「数」のこと。結局は群論なんだけど、様々な物理の世界を特殊な「数」に割り当てることを目論んでいる。例えば、テンソル。異方性を持つ物性値はことごとくテンソルになるけど、このテンソルはある種の複素数の性質を持っている。量子力学では複素数のベクトルとか行列とかが活躍するんだけど、複素数のベクトルや行列って特殊な「数」としての性質を持っている。そういう広義の「数」の概念で、僕のかかわる物理の世界を書き直してみようと、最近画策している。

数の概念の拡張

小学校以来、僕たちは算数・数学で「数」の概念を拡張し続けてきた。最初に習ったのは「正の整数」あるいは「自然数」だ。0を含むかどうかは微妙だけどね。その次に習ったのは「小数」だったと思う。次に「分数」。中学校になって「負の数」「無理数」。高校になって「複素数」を順に習った。その時の僕は気づかなかったけど、「ベクトル」と「行列」もある意味「数」だった。高校の先生はそんなことを全く教えてくれなかったけどね。
こういう順に並べると気づくと思うけど、僕たちは順番に「数」の概念を拡張してきたことになる。例えば、「小数」は「自然数」を含み、「分数」は「小数」を含む。それぞれのカテゴリーで、計算の様子が少しずつ変化し、それぞれに特徴があるものだ。例えば、「分数」では除算が、分子分母を入れ替えて積を取る、という演算になって、積の一種として扱えるようになる。

ここで、εーδ論法の話が絡んでくる。εーδ論法は、「小数」を含む「数」に対して利用できるツールである、ということだ。「小数」を含む「分数」や「無理数」でも自動的に利用できる。これは、εーδ論法を用いて証明された定理は、利用範囲が広いこと意味する。
εーδ論法で必要とされるのは、対象がコンパクトである、ということだけだ。コンパクトという概念は、二つの「数」の間をどれだけ小さくとっても、まだまだ間の「数」を見つけてこれるような、そういう性質のことだ。「数」と「数」の間にちょっとぐらいの穴があっても構わない。ただ、隙間が見つけられれば良い。その典型例が「小数」だ。「小数」では、一部の「分数」や「無理数」が表現できない。つまり「穴」がある。でも、桁を下げてゆけば、いくらでも隙間を見つけることができる。そういう例は結構多い、と数学者たちは考えている。そういう「世界」で利用できる強力なツールがεーδ論法ということだ。ちなみに、「微分」という概念は「穴」があると都合が悪い。だから、微分ではなくてεーδ論法を使うのだ。
概念だけで説明されると、とても手に負えない「コンパクト」という概念だけど、「有理数」「無理数」で説明したら、そんなに難しいものでもない。

注釈:隙間が無限に見つられるという定義は、厳密には「稠密」で、コンパクトというのはそれが局所的に収束すること、あるいは収束する状態のこと。

特殊な「数」

僕たちの「数」の概念の拡張は基本的に高校数学で終わっている。でも、仕組みが分かったのだから、もっと先に進んでもよい。

僕が特殊な「数」に興味を持ったきっかけは、「複素数の行列表現」だ。虚数単位$i$は$\sqrt{-1}$として定義され、それ以外の定義は教えてもらえない。ところが、ハミルトンの四元数を勉強した時、3種類の虚数単位が紹介され、それぞれの行列形式が提示された。僕はとてもびっくりした。厄介な虚数単位が3つもあるんだから!そして、それぞれの虚数単位に別々の行列が対応するというのだ。わけがわからない。
もっとびっくりなのは、三元数とか五元数とかはなくて、普通の複素数である二元数の次は、四元数でその次は八元数だそうだ。ハミルトニアンに名を残す天才ハミルトンが三元数を探し続けて行き詰まり、ある日突然、橋の上を歩いていた時に四元数を思いついたそうだ。あまりの嬉しさに、橋にその発見を落書きしたと伝えられている。

さて、四元数にはいろんなバリエーションがあるとされている。split-quarternionと呼ばれる「数」では、二乗したらー1になる2つの虚数単位と、二乗したら1になる3つめの虚数単位を用いる。二乗したら1になる虚数単位って意味が分からないぐらいだけど、そういう性質を持つ行列が定義出来て、split-quarternionを具体的な「数」として計算することが可能になっている。そして、split-quarternionで用いられる、二乗したら1になる虚数単位を使った二元数というのも考えることができる。こうしてできる新しい複素数はsplit-complex number と呼ばれる。split-complex numberは、自動的に対称行列に対応する。逆に対称行列はすべてsplit-complex numberであると言える。物理の世界では、異方性をもつ物理量のほとんどは対称行列で表現できる。つまり、そのような物理量はsplit-complex numberということだ。split-complex numberには特有の性質がある。その「数」としての性質は、異方性をもつ物理量の現実の性質と深く結びつくはずだ。僕はそこに興味がある。

量子力学の一つの謎を考察する

量子力学ではDaggerという演算がしばしば用いられる。行列に対し、転置と複素共役を同時行う操作と定義されている。量子力学では、しばしば転置と複素共役がセットで表われ、それぞれを単独で用いることが少ない。なぜなんだろう?

そのヒントになるのが、虚数単位の行列表記だ。通常の虚数単位は$i$だけど、$\begin{pmatrix} 0  & 1 \\ -1 & 0 \end{pmatrix}  $のような行列を用いてもよいらしい。$\begin{pmatrix} 0  & 1 \\ -1 & 0 \end{pmatrix} ^2= \begin{pmatrix} -1  & 0 \\ 0 & -1 \end{pmatrix}  $ なので、確かに$i$の性質を持っている。このように表記は違うけど、本質的に同じものを「同値」という。虚数単位の行列表現はその典型例だ。
これを用いて、$a+b i$を行列表示すると、$\begin{pmatrix} a & b \\ -b & a\end{pmatrix}$となる。一方、共役は$a- b i$なので、$\begin{pmatrix} a & -b \\ b & a\end{pmatrix}$である。行列の方を見比べると、ちょうど転置になっていることがわかる。これをまとめると、行列表示では転置すると自動的に共役になるということだ。

Daggerは転置して共役なので、2回ひっくり返って元に戻る、ということになる。じゃ、Daggerにする意味ないよね、と短絡してはいけない。複素数1個だったらそうだけど、複素数を要素とする行列(複素行列)では、そうならない。$\begin{pmatrix} a+b i \\ c +d i \end{pmatrix}$だったらどうだろう。これを無理やり行列表示すると$\begin{pmatrix} a & b \\ -b & a \\ c  & d \\-d & c \end{pmatrix}$になるだろう。これを転置すると、$\begin{pmatrix} a & -b & c & -d \\ b & a & d & c\end{pmatrix} =\begin{pmatrix} a-bi & c-di\end{pmatrix}$になる。これはDaggerの操作だ。
つまり、Daggerの本質は転置で、複素数の転置とは、複素数の共役ということだ。通常の複素行列では、要素の複素数自身に転置操作が及ばないので、Daggerによって要素にも転置操作が及ぶようにする、ということだ。

うまくいきそうだけど、この議論ではちょっとした危険をはらんでいる。先の議論では、行列の要素にさらに行列を埋め込んで、中の方の括弧を無視するということを行った。つまり、
$\begin{pmatrix} a+b i \\ c +d i \end{pmatrix} = \begin{pmatrix} \begin{pmatrix} a & b \\ -b & a \end{pmatrix} \\ \begin{pmatrix} c  & d \\ -d & c \end{pmatrix} \end{pmatrix} = \begin{pmatrix} a & b \\ -b & a \\ c  & d \\-d & c \end{pmatrix}$

こんなことが許されるのだろうか?
こんなことを許して、どこかに不都合が生じたりしないだろうか?

すこし四元数のことを調べてみる

さて、$\begin{pmatrix} 0  & 1 \\ -1 & 0 \end{pmatrix}  $以外に$i$の性質を満たす行列はないだろうか?先の四元数では、$\begin{pmatrix} 0  & 1 \\ -1 & 0 \end{pmatrix}  $のほかに、$\begin{pmatrix} i  & 0 \\ 0 & i \end{pmatrix}  $と$\begin{pmatrix} i  & 0\\ 0 & -i \end{pmatrix}  $が用いられる。いずれも$i$として使うことができるが、要素に$i$が含まれているので、あんまりありがたくない。
でもWikipediaをみると、四元数の行列表示として4x4の行列が示してある。例えば、
$\begin{pmatrix} 0 & 1 & 0 & 0 \\ -1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & -1 & 0 \end{pmatrix}$が挙げられている。これは、$\begin{pmatrix} i & 0 \\ 0 & i \end{pmatrix}$であり、先に示した四元数の虚数単位の一つに一致する。

だから、行列の要素に行列を埋め込む、というのは「OK」らしい。実はそういうのはブロック行列と呼ぶらしい。$\begin{pmatrix} A & B \\ C & D \end{pmatrix}$の各要素が行列であるようなものだ。この場合、行列式は、$ det A  det \left(D - C A^{-1} B \right) $であらわされる。僕らが良く知る行列式の公式$AD-BC$に極めて似ているけれど、行列の場合は計算順序を入れ替えられないので、$C A^{-1} B$はこれ以上簡単にはできないように思える。ただし、$ABCD$が特別な場合はそれが可能だ。特別な場合というのは、例えば、$\begin{pmatrix} a & b \\ -b & a\end{pmatrix}$だ。

この事情は複素数が行列表示できるという話のときに気づくべきことだった。つまり、複素数の積は交換可能なのに、積が交換可能でない行列で表示できるわけがないだろう、ということだ。
実のところは、積が交換可能(可換)な行列のタイプというのがあって、それらは共通の特徴を持つ。可換な行列の一つが、$a+bi$ということだ。一般に、$ a E + b X$という行列であれば、積が可換になる。さらに、$X^2 = \alpha E$を満たすとき、「普通の積」の性質を持つようになる。そういう場合、「複素数」タイプと呼ぶことにしよう。

$ABCD$が複素数タイプの場合は、$ \det A  \det \left(D - C A^{-1} B \right) =\det A \det \left(D-A^{-1}BC\right) = \det (AD - BC)$となり、僕らの知っている普通の複素行列と矛盾しない結果になる。
この事情は逆行列の場合も同じだ。だから、可換なサブ行列からなるブロック行列は、サブ行列を要素とする普通の行列とみなしてよい、となる。ということで、Daggerという操作は複素数まできっちり拡張された正当なる置換操作であるということになる。

知らない間に通り過ぎることの善悪

高校までの数学では、複素数が導入されて、つぎは行列が導入された。上記の議論に基づくと、順当な「数」の概念の拡張だとわかる。でも、僕らはそんなことは一切知らされず、計算技術の側を用いて、計算を進めてゆくうちに、なんとなく理解が進むという側面がある。だから、まずは計算ができること、を学習目標に設定するのは悪くはない。ただ、「それが全て」みたいな指導が横行していて、数学のありがたさが今一つ見えてこない。そのせいで、最近は、高校で行列を教えることをやめてしまった。

さらに、大学で学ぶべき高等数学の邪魔をしているという明らかなデメリットがある。僕たちは、「数」というものを「すでに存在しているもの」「計算の対象」とみなす傾向がある。我々が知る多くの「数」は、「たまたま現実世界の何かとうまく対応する概念」でしかない。うまく対応するのは、ある種の必然ではあるのだが、全ての「数」が何かと対応するとは限らない。多くの「数」が数字の概念からの拡張であるのは、算法を定義しやすくて調べやすいからという都合によるものだ。「数」の概念は、数字よりもずっと広い概念で、その本質は、数学者でない我々には想像の及ばない世界だ。だからと言って、数学者でない人に理解できないわけではない。

僕はプラスチックの研究者で、樹脂にいろんな微粒子や繊維を混ぜた複合材料の研究をしばしば行っている。その時、材料を「数」とみなすこともできる。混ぜるという行為は、材料同士の「演算」だ。物性測定は、ある種の「演算」あるいは、「関数」に割り当てることができる。材料同士の混合や物性測定に対応する「演算」は自明ではないが、その演算ルールが明らかになれば、材料研究が進む。だから、僕たちは、演算ルールを明らかにするという研究を行う。

このような材料研究を数学の言葉で抽象化すると、材料研究の難しい部分がどこにあるのか俯瞰できる。材料$A$と材料$B$があって、それらを混合する演算を$+$としよう。ある物性を測定するということを$f(A)$のように関数で表すことにする。このとき、AとBの混合物の物性は、$f(A+B)$になるだろう。$f(A+B)=f(A)+f(B)$のような演算則が成立するなら、材料研究はとても簡単だ。このような演算則は「線形結合」と呼ばれる。現実の演算則はもっと複雑だが、もし演算則が完全に理解できれば、僕たちは材料設計を自由自在に行うことができるだろう。だから、僕たちは、$f(X)$がどのように書き下されるのか、$f(A+B)$を$f(A)$と$f(B)$の関数として書き下す方法などを研究する。

このような抽象化は単純すぎるが、世界を数学で記述するという概念の例として、わかりやすい。僕は物理をベースにした科学者だけど、「数」について、いろいろ考えている。その時、つくづく感じるのは、「ちゃんと教えてほしかった」ということだ。