makenowjust-labs/blog

MakeNowJust Laboratory Tech Blog

L*について説明してみる

2023-07-19 (更新: 2023-12-10) / 読むのにかかる時間: 約24.8

Automata Learning とは、未知の (ブラックボックス) システムに対する入力とその出力から、システムの振舞いを有限状態オートマトンとして再現する手法です。 これは、仕様が形式化されていないシステムに対して形式的な手法を適用するための足掛りになるなど、近年重要な技術となっています。

Angluin によるLL\astは Automata Learning のアルゴリズムの中でも最も代表的な存在です。 LL\astは未知の正規言語を教師を使って学習するアルゴリズムで、多くの Automata Learning の基礎となっています。

この記事ではLL\astの、その原理やアルゴリズムの詳細について解説します。

LL\astについて

LL\astDana Angluinによって提案された Automata Learning のアルゴリズムです[1]。 教師を用いて、未知の正規言語のオートマトン (DFA) による表現を学習できます。

ここで言う「未知」というのは、オートマトンや正規表現でどのように表すのかは定かではない、という状況を表します。 L={w  wは長さが3の倍数}L = \{ w\ |\ w\text{は長さが3の倍数} \}L={w  wabababを含む}L = \{ w\ |\ w\text{は}aba\text{と}bab\text{を含む} \}のように文章で言語が定義されている場合や、もっと現実的な例では、学習したい言語は既にコンパイルされたプログラムで受理される文字列として定義されるような状況をイメージしてください。

LL\astについて、まずはじめに動作の大雑把なイメージを説明します。

LL\astの動作のイメージ

LL\astの登場人物は「教師 (Teacher)」と「学習者 (Learner)」の二人です。

この例では、L={w  wは長さが3の倍数}L = \{ w\ |\ w\text{は長さが3の倍数} \}LL\astで学習する様子を説明していきます。

  1. 学習者は学習対象のシステムを予想して仮説 (Hypothesis) となるオートマトンを構築し、それが正しいかどうかを教師に問いかけます。

  2. 教師はその仮説が正しいかどうかを答えます。間違っている場合、反例となる入力も同時に返します。

  3. 学習者は反例を元に、仮説のオートマトンを修正します。

  4. 修正した仮説のオートマトンが正しいかを、再度教師に問いかけます。

  5. 仮説のオートマトンが正しい場合、LL\astが終了します。

このように学習者が教師に問いかけを繰り返して、仮説を学習対象のオートマトンに近付けていくのがLL\astとなります。

LL\astの詳細

それでは、学習者はどのようにして仮説のオートマトンを構築・修正していくのでしょうか? ここからは、LL\astの詳細について説明していきます。

なお、この説明は Hames Worrell の講義ノート[2]を元にしています。

教師

ここまで教師と言ってきましたが、具体的には次の 2 つのクエリ (関数) の組として定義されます。

  • MEMBER(w)\mathsf{MEMBER}(w): 文字列wwが学習対象のオートマトンで受理されるかどうかを判定するクエリ。
  • EQUIV(H)\mathsf{EQUIV}(\mathcal{H}): 仮説のオートマトンH\mathcal{H}が学習対象のオートマトンと等しいかどうかを判定するクエリ。違う場合は反例となる文字列を返します。

QQTT

LL\astではQQTTという 2 つの文字列の集合を、空文字列のみの集合{ε}\{ \varepsilon \}から更新していき、この文字列の集合によって仮説のオートマトンを構築します。 それぞれ、次のような役割になります。

  • QQ: 仮説のオートマトンの状態集合となる文字列の集合。
  • TT: QQの各文字列の末尾に連結したときに、受理されるかどうかで区別できる文字列の集合。

これだけだとよく分からないので、さらなる説明のためにTTによる等価性T\equiv_Tを次のように定義します。

q1Tq2    tT.MEMBER(q1t)=MEMBER(q2t)q_1 \equiv_T q_2 \iff \forall t \in T.\: \mathsf{MEMBER}(q_1 \cdot t) = \mathsf{MEMBER}(q_2 \cdot t)

q1Tq2q_1 \equiv_T q_2のとき「q1q_1q2q_2TTによって等価」と呼び、そうでない場合 (q1̸Tq2q_1 \not\equiv_T q_2) 「q1q_1q2q_2TTによって区別される」と呼ぶことにします。

このとき、QQTTによって区別される文字列の集合と説明できます。 つまり、QQは次の分離性 (Separability) 条件を満たすものとします。

q1,q2Q. (q1=q2    q1Tq2)\forall q_1, q_2 \in Q.\ (q_1 = q_2 \iff q_1 \equiv_T q_2)

さらに、QQTTからオートマトンを構築するために、次の閉鎖性 (Closedness) 条件を考えます。

q1Q,σΣ.q2Q.q1σTq2\forall q_1 \in Q, \sigma \in \Sigma.\: \exists q_2 \in Q.\: q_1 \cdot \sigma \equiv_T q_2

QQTTが分離性条件と閉鎖性条件を満たしているとき、次のようにして仮説の DFA H(Q,T)\mathcal{H}(Q, T)を構築できます。

H(Q,T)=(Σ,Q,ε,F,δ)whereF={q  qQMEMBER(q)}δ(q,σ)=q s.t. qTqσ\begin{array}{l} \mathcal{H}(Q, T) = (\Sigma, Q, \varepsilon, F, \delta) \\ \text{where} \\ \quad\begin{array}{rcl} F &=& \{ q\ |\ q \in Q \land \mathsf{MEMBER}(q) \} \\ \delta(q, \sigma) &=& q'\ \text{s.t.}\ q' \equiv_T q \cdot \sigma \end{array} \end{array}

分離性条件によりδ\deltaは決定的に定義されて、閉鎖性条件によりδ\deltaが正しく定義されることに注意してください。

QQTTの更新方法

LL\astは次のような手順のアルゴリズムになります。

  1. QQTT{ε}\{ \varepsilon \}で初期化
  2. QQを閉鎖性を満たすように更新する
  3. 仮説の DFA H=H(Q,T)\mathcal{H} = \mathcal{H}(Q, T)を構築し、EQUIV(H)\mathsf{EQUIV}(\mathcal{H})を呼ぶ
  4. EQUIV(H)\mathsf{EQUIV}(\mathcal{H})が成功した場合は、H\mathcal{H}を返す
  5. EQUIV(H)\mathsf{EQUIV}(\mathcal{H})が失敗した場合は、反例を分割して必要なq,tq', t'を求めQ,TQ, Tに追加する
  6. 2 から 6 をEQUIV(H)\mathsf{EQUIV}(\mathcal{H})が成功するまで繰り返す

ここで問題となるのは、手順 2 や 5 でQQTTをどのようにして更新していくかです。 これらの更新方法について説明していきます。

まず、手順 2 のQQを閉鎖性を満たすように更新していく方法について説明します。 手順 1 でQ={ε}Q = \{ \varepsilon \}としたときや、手順 5 でQQqq'を追加したあと、QQTTは閉鎖性を満たしていない可能性があります。 そこで、閉鎖性を満たすように足りない文字列をQQに追加する必要があります。

これを行う関数は次のようになります。

Algorithm 1 Correct QQ to satisfy closedness.

function Close(Q,TQ, T)

for qQq \in Q do

for σΣ\sigma \in \Sigma do

if ¬qQ.qσTq\lnot \exists q' \in Q.\: q \cdot \sigma \equiv_T q' then

QQ{qσ}Q \gets Q \cup \{ q \cdot \sigma \}

end if

end for

end for

return QQ

end function

内容はシンプルで、各状態qqとアルファベットσ\sigmaについて、qσq \cdot \sigmaTTによって等価な状態が存在するかを調べて、無い場合はqσq \cdot \sigmaを追加する、といったものになっています。

次に、手順 5 の反例を分割する方法について説明します。

これは、次のような関数で実現できます。 ただし、wwEQUIV(H)\mathsf{EQUIV}(\mathcal{H})の返した反例の文字列で、H\mathcal{H}は仮定の DFA です。

Algorithm 2 Split the given counterexample.

function Split(w,Hw, \mathcal{H})

H=(Σ,Q,q0,F,δ)\mathcal{H} = (\Sigma, Q, q_0, F, \delta)

qq0, i1q \gets q_0,\ i \gets 1

while true\mathbf{true} do

qδ(q,wi), ii+1q \gets \delta(q, w_i),\ i \gets i + 1

if MEMBER(qwiww)MEMBER(w)\mathsf{MEMBER}(q \cdot w_i \dots w_{|w|}) \ne \mathsf{MEMBER}(w) then

return (w1wi1,wiww)(w_1 \dots w_{i-1}, w_i \dots w_{|w|})

end if

end while

end function

wwは反例の文字列のため、どこかしらにはMEMBER(qwiww)MEMBER(w)\mathsf{MEMBER}(q \cdot w_i \dots w_{|w|}) \ne \mathsf{MEMBER}(w)となる状態qqがあり、アルゴリズムは正しく分割結果を返します。

LL\astアルゴリズム

最後に、上で定義した関数を使ったLL\astのアルゴリズムを疑似コードで示します。

Algorithm 3 The LL\ast algorithm.

function Learn()

Q{ε}, T{ε}Q \gets \{ \varepsilon \},\ T \gets \{ \varepsilon \}

while true\mathbf{true} do

QQ \gets Close(Q,TQ, T)

H=H(Q,T)\mathcal{H} = \mathcal{H}(Q, T)

result=EQUIV(H)\mathnormal{result} = \mathsf{EQUIV}(\mathcal{H})

if result\mathnormal{result} is success then

return H\mathcal{H}

end if

Now, result\mathnormal{result} is a counterexample ww.

(q,t)=(q', t') = Split(w,Hw, \mathcal{H})

QQ{q}, TT{t}Q \gets Q \cup \{ q' \},\ T \gets T \cup \{ t' \}

end while

end function

大体前の説明の通りになっているのが分かるのではないかと思います。

アルゴリズムの分析

LL\astの正確性や停止性、計算量について少し分析します。

正確性・停止性

LL\astEQUIV(H)\mathsf{EQUIV}(\mathcal{H})に成功した場合に停止するため、教師が正しければ結果の DFA は学習対象のオートマトンと等価なものになるはずです。

一方、LL\astがいずれ停止するという保証はどこにあるのでしょうか? これは、次のMyhill-Nerode の定理から説明できます。

言語LLの同値関係L\equiv_Lw1Lw2    wΣ.(w1wL    w2wL)w_1 \equiv_L w_2 \iff \forall w \in \Sigma^\ast.\: (w_1 w \in L \iff w_2 w \in L)で定義し、L\equiv_Lによる同値類[w]L={wΣwLw}[w]_L = \{ w' \in \Sigma^\ast | w \equiv_L w' \}で定義する。 このとき同値類[w]L[w]_Lの数が有限である、かつそのときに限りLLは正規言語である。

関数Learnのループでは、一周毎にQQの要素が少なくとも 1 つは増加してきます。 QQの各要素はTTによって区別できるのですが、これはつまり学習対象の言語ではQQの各要素はそれぞれ別の同値類に入ることを意味します。 よって、QQが無尽蔵に増え続けるということは起こり得ず、同値類の数程度 (つまり最小オートマトンの状態数) のループ回数で停止するはずだと分かります。 さらに、同値類が異なるように状態を分けていることから、LL\astの結果の DFA は最小 DFA となることも分かります。

計算量

計算量として、EQUIV(H)\mathsf{EQUIV}(\mathcal{H})MEMBER(w)\mathsf{MEMBER}(w)の呼び出される回数について考察します。 ここでのQQTTはアルゴリズムが結果を返す直前のQQTTとします。

まず、EQUIV(H)\mathsf{EQUIV}(\mathcal{H})の呼び出される回数は、単純にT1|T| - 1回のはずです。

次に、MEMBER(w)\mathsf{MEMBER}(w)の呼び出される回数を考えます。

T\equiv_Tの中でもO(T)O(|T|)回呼び出されることに注意すると、関数Closeで呼び出される回数はO(QΣQT)O(|Q||\Sigma||Q||T|)回程度だと分かります。 ただし、qQ,tTq \in Q, t \in Tに対するMEMBER(qt)\mathsf{MEMBER}(q \cdot t)の呼び出しはT\equiv_Tの中で何度も行なわれるので、結果をキャッシュすることで、呼び出し回数をO((QΣ+Q)T)O((|Q||\Sigma| + |Q|)|T|)回程度にできます。

また、関数Splitの中で呼び出される回数は、反例の文字列さをwwとしてO(w)O(|w|)回程度のはずです。 w|w|は無尽蔵に大きくなりそうに思えますが、もしEQUIV(H)\mathsf{EQUIV}(\mathcal{H})が常に最小の反例を返すのであればw|w|は最小 NFA の大きさQ|Q|以下となるはずなので、実際にはそれほど大きくなりません。 さらに、分割点の探索をMEMBER(qi1wiww)MEMBER(qiwi+1ww)\mathsf{MEMBER}(q_{i-1} \cdot w_i \dots w_{|w|}) \ne \mathsf{MEMBER}(q_i \cdot w_{i+1} \dots w_{|w|})となる位置iiを 2 分探索で探すことでO(logw)O(\log |w|)で実現できます。

TQ|T| \le |Q|であることを踏まえてまとめると、O(((QΣ+Q)T+logw)T)=O(Q(Q2Σ+logw))O(((|Q||\Sigma| + |Q|)|T| + \log |w|)|T|) = O(|Q| (|Q|^2 |\Sigma| + \log |w|))程度だと分かります。 今一効率が良いと言えるのか分かりませんが、多項式時間で未知の正規言語の DFA が求められるというのは意外なことだと思います。

実装

ここまで理解すれば実装は難しくないのではないかと思います。 参考までに Ruby による実装を残しておきます。

class DFA
  def initialize(state_set, initial, accept_set, delta)
    @state_set = state_set
    @initial = initial
    @accept_set = accept_set
    @delta = delta
  end
 
  def run(w)
    q, i = @initial, 0
    while i < w.size && q
      q, i = @delta[q][w[i]], i + 1
    end
    i == w.size && @accept_set.include?(q)
  end
end
 
class LStar
  def initialize(alphabet, teacher)
    @alphabet = alphabet
    @teacher = teacher
    @state_set = ['']
    @tests = ['']
  end
 
  def learn
    loop do
      delta = close
      h = make_hypothesis(delta)
      result = @teacher.find_counterexample(h)
      return h unless result
      new_state, new_test = split(delta, result)
      @state_set << new_state unless @state_set.include?(new_state)
      @tests << new_test unless @tests.include?(new_test)
    end
  end
 
  def distinguish?(w1, w2)
    @tests.any? { |t| @teacher.member?(w1 + t) != @teacher.member?(w2 + t) }
  end
 
  def close
    delta = {}
    @state_set.each do |state|
      delta[state] = {}
      @alphabet.each do |a|
        next_state = @state_set.find { |q| !distinguish?(state + a, q) }
        unless next_state
          next_state = state + a
          @state_set << next_state
        end
        delta[state][a] = next_state
      end
    end
    delta
  end
 
  def split(delta, w)
    q, i = '', 0
    expected = @teacher.member?(w)
    loop do
      unless @teacher.member?(delta[q][w[i]] + w[i+1..]) == expected
        return [q + w[i], w[i+1..]]
      end
      q, i = delta[q][w[i]], i + 1
    end
  end
 
  def make_hypothesis(delta)
    DFA.new(
      @state_set,
      '',
      @state_set.filter { |q| @teacher.member?(q) },
      delta
    )
  end
end

使い方は次のようにmember?find_counterexampleメソッドを持ったクラスを用意して、それをteacherとしてLStarを作り、learnメソッドを呼び出します。 下の例ではL={w  wは長さが3の倍数}L = \{ w\ |\ w\text{は長さが3の倍数} \}の場合の学習を行なっています。

class SampleTeacher
  def member?(w)
    w.size % 3 == 0
  end
 
  def find_counterexample(h)
    10.times.map { 'a' * _1 }.find { |w| h.run(w) != member?(w) }
  end
end
 
teacher = SampleTeacher.new
learner = LStar.new(['a'], teacher)
dfa = learner.learn
pp dfa

ちなみに、あまり効率の良い実装ではないことには注意してください。 工夫できるところは色々あるので、より効率的な実装を追求してみてもいいでしょう。

反例の見つけ方

実際に実装をしてみると悩むのが、どうやって反例を見つけるか、という点だと思います。 上の例はアルファベットが 1 種類の単純なものなので、適当な回数繰り返して試せばいいのですが、アルファベットが複数あるとこの方法も使えません。

代表的な方法は、DFA をランダムに遷移して文字列を生成する方法です。 初期状態からランダムに何度か遷移して、その遷移に使った文字列で反例を探します。 この方法は効率的ですが、ランダム性があるため場合によっては学習が不完全に打ち切られてしまう可能性があります。

他にも W method や WP method と呼ばれる決定的な方法も存在します[3]

LearnLibであれば、これらの方法を試すことができるので、使ってみるといいかもしれません。

発展

Mealy 機械への応用: 少し工夫することでMealy 機械を学習することもできます。 具体的にはMEMBER(w)\mathsf{MEMBER}(w)の結果を受理したかどうかではなく、最後の遷移の出力とすることで Mealy 機械の学習が可能となります。

Compisitional Automata Learning: 冒頭で書いた通り、近年 Automata Learning は形式検証への応用が盛んに行なわれています。 しかし、対象のシステムのオートマトンでの状態数が大きい場合、現実的な時間で学習が行なえない場合があります。 そういった問題を解決するために、現実のシステムは複数のコンポーネントから構成されていることに注目して、複数コンポーネントからなるオートマトンを学習する Compisitional Automata Learning の手法が研究されています[4] [5]

あとがき

永らく書こうと思って放置していたLL\astについての記事をまとめることができました。

LL\astは有限状態オートマトンの有限性が如実に現れた興味深いアルゴリズムだと思います。 さらに、実用上の重要性も高まっており、研究対象としても興味深いのではないかと考えています。

あと本文とは直接関係ないのですが、この記事のために Markdown 中にpseudocodeを書けるようにしてみました。 pseudocode.jsを使っています。 どうだったでしょうか。

終わりに、結構長い記事になってしまいましたが、最後まで目を通していただきありがとうございました。

参考文献

  1. Angluin, Dana. "Learning regular sets from queries and counterexamples." Information and computation 75.2 (1987): 87-106.
  2. James Worrell. "Exactly Learning Regular Languages Using Membership and Equivalence Queries." Lecture notes by James Worrell, University of Oxford. https://www.cs.ox.ac.uk/people/james.worrell/DFA-learning.pdf
  3. Khendek, Fujiwara Bochmann, et al. "Test selection based on finite state models." IEEE Transactions on software engineering 17.591-603 (1991): 10-1109.
  4. Labbaf, Faezeh, et al. "Compositional Learning for Interleaving Parallel Automata." Foundations of Software Science and Computation Structures LNCS 13992 (2023): 413.
  5. Neele, Thomas, and Matteo Sammartino. "Compositional Automata Learning of Synchronous Systems." International Conference on Fundamental Approaches to Software Engineering. Cham: Springer Nature Switzerland, 2023.