クラウド会計サービス事件の原告は、一審判決後にウェブ上で掲載されたインタビュー記事において、原告のもう一つの特許(第5936284号)の侵害を主張しなかった経緯を説明しています。こちらの特許は、機械学習を使った自動仕訳に関するものとされています。その説明によれば、
(1) 訴訟提起の時点では、被告方法が対応テーブルの特許(第5503795号)の方により近い(加えて裁判所の理解も得やすいだろう)と判断した;かつ、
(2) 被告が、被告方法は機械学習の応用であると主張したので、特許第5936284号の侵害も事後的に主張しようと試みたが、時機に遅れた攻撃防御(平たくいえば後出し)として裁判所に斥けられた(なぜ時機に遅れたかについても、双方が相手方の非を述べていますが、ここでは省略します)、
といういきさつで、訴訟の対象にならなかったということです。
この説明では、原告は訴訟提起の段階では「機械学習の応用であるか否かが争点になることはない」と考えたか、又は「被告が被告方法について機械学習の応用であると主張する」とは予想しなかったように読めます。前者の立場で原告は、機械学習(又はAI技術)の応用はそのさらに上位概念である自動仕訳の技術思想を実現するための手段に過ぎないという見方をしたのかもしれません。しかし原告が事後的に(2)の主張を試みたところをみると、「機械学習の応用であるか否か」が決め手の一つになり得ると後になって考えたのでしょうか。
そこで、訴訟のテーブルに上ることがなかった原告の特許第5936284号について、検討してみます。この特許の請求項1は、特許第5503795号と同じように会計処理装置についての発明で、全体の構成もほぼ同じです。相違点は、特許第5503795号では取引内容の記載に含まれたキーワードから対応テーブルを参照して特定の勘定科目に仕訳するところを、特許第5936284号では各キーワードに対応づけられた出現頻度の高い勘定科目へ自動仕訳する、というところです。特許第5503795号の請求項1にあった「キーワードの優先ルール」は、特許第5936284号にはありません。
これだけ読んでもどこが機械学習なのかわかりませんが、従属項の請求項8と明細書の段落「0036」以降にその説明があります。特許第5936284号の会計処理装置は「ラーンド・データベース」(learned database)を備え、その中にキーワード(この特許ではその最小単位として「形態素」と呼んでいる。)に対応づけられた勘定科目の出現頻度が記憶されています。取引内容の記載に含まれる複数のキーワードごとに出現頻度(スコア)が最大の勘定科目を選び、記載全体としてスコアが最大になる勘定科目を選ぶという仕組みです。さらに処理の都度、キーワードごとの出現頻度を更新(インクリメント)していくとのことで、「学習」の意味は主にこの「更新(インクリメント)」の部分にあるという印象を受けます。
観測データ(今の場合はキーワードの組み合わせ)を知った上で事後確率最大のクラス(今の場合は勘定科目)を選ぶ、という意味では、ベイズの識別規則の応用のように見えますが、「学習」が専らデータベースの更新を意味していて、その前提となる学習済みモデルの形成(どのようにデータベースの初期状態を作るか)のところはよくわかりません。機械が教師データから抽象的なモデルを自律的に形成するところが機械学習(のうち教師あり学習)の肝心な部分という立場からは、この特許でいう機械学習は作り終えたモデルのメンテナンスの自動化を指すように思えます。(この項続く)