Scribble at 2026-03-03 10:31:52 Last modified: 2026-03-04 08:01:33

添付画像 — Programmable Cryptography (Part 1)

興味深い議論だ。

まず、プログラムの難読化について説明しておくと、プログラムというものは、簡単に言えば「関数」だと考えてよい。何か入力の値や初期条件を与えたら、それに応じた出力の値を生み出すという対応関係があるからだ。それを PHP で書こうと C++ で書こうと、この議論においてはどの言語を使ってもいい。ただし、そこで採用されている入力から出力へと処理するアルゴリズムが、少なくとも適切な入力値に対しては、リソースが許容する範囲で必ず入力に応じて決まった出力の値をもたらさなくてはいけない（ただし、集合論で言う全射や単射である必要はない）。ここで「リソースが許容する範囲」とは、もちろんメモリの量や時間のことである。そして、できる限り少ないメモリと時間で出力の値を計算できるよう、効率のよいアルゴリズムであることが望ましい。このような特徴を保ちながら、ソースコードの構造を第三者にとって理解困難にするコンパイラ技術が難読化 (obfuscation) だ。しかし、難読化には理論的な限界と実用上の限界が指摘されている。

難読化の限界を説明すると、学校でよくやる数列のクイズを覚えている方は、教師が「１，３，５，...」などと数字を挙げていって、「その次の数は？」と問われたときの答えを、最初に示された数どうしのもつ規則性から推定する練習をしたであろう・・・というか、これが「練習」なのかどうかは疑わしい。なぜなら、そういう規則性を推定すること自体は教えられていないからだ。教師は個々の数列が「２つずつ増える」単調増加の等差数列であると言うだけだからだ。本当は、それは規則性の見つけ方や推定の仕方を教えているわけでもなんでもない。論理的な思考を厳密にしようとする人の方が、こういう雑な説明に納得せず、得てして「理系」などと言っている雑な思考の人間の方が簡単に納得してしまうものだ。ともあれ、こういうクイズをやったことがあるなら、ここで一種の関数として扱っているプログラムについても、入力値と出力値のペアを幾つか眺めるだけで、そのプログラム（関数）がどういうものかを推定できるかもしれない。ここで、推定できる関数は、「学習可能」であるという。プログラムの内部で、どれほど複雑な処理をしていようと、表から観察できる入力値と出力値との対応関係だけで、任意の入力値を与えた場合に出力値がどうなるかを推定されてしまえば、そんなプログラムは情報セキュリティの役には立たないわけである。そして、研究者は学習不可能なプログラムのソースコードを完全に復元されないようにするコンパイラを、理想的な難読化のツールと定義して、数学的に安全性が証明された難読化のツールを開発しようとしてきた。しかし、研究の過程で、この定義を満たさない反例が見つかってしまったというわけである。学習が不可能であるにもかかわらず、難読化プログラムのソースコードを復元できる場合があるということだ。

したがって、多様な計算を可能にするプログラム可能な暗号へという展開そのものが「良い」かどうかが自明とは言えないということに加えて、そういうプログラム可能な暗号化には原理的な限界もあるということになる。

冒頭に戻る