ぴろりのくせになまいきだ。

世間に平和はおとずれなぁい

材料屋から見たインフォマティクス2021

みなもすなる「いんふぉまてぃくす」といふものを、ということで、もう現場を離れてしまったのですが、ちょっとかじろうとした人が思ったことを書いておきます。

あらかじめ断っておきますが、一つの論旨に基づいて書かれる形式ではなく、各テーマについて思うところを書いていこうと思います。
まとまりがなくて申し訳ありませんがご容赦ください。
また、個人の見解も多く含みますので、その点はご容赦ください。何か間違いなどがありましたら、ご指摘いただけると大変ありがたいです。

マテリアルズ・インフォマティクスと書いていると毎回長いので、以下では「MI」と省略します。

今回のテーマ

MIは何が難しいのか

MIでは何ができるか?

データはどこから?

インフォマティクスが当たり前になった場合の研究開発

それでは、各テーマについて書いていきたいと思います。
1つの記事にするには少々長くなりそうですので、「データはどこから?」と「インフォマティクスが当たり前になった場合の研究開発」については分割して別の記事としたいと思います。

MIは何が難しいか

そもそも、MIが何か、という話から始めます。
MIとは、材料科学(マテリアルサイエンス)に対して、情報に関連する分野(インフォマティクス)の知見や手法を適用し、両者を融合していこう、という分野だと捉えています。
これに関しては、2年程前に書いた記事も参考になると思います。このころは情報収集を始めてすぐでしたが、おおよそ間違っていないと思われます。
piroriblog.hatenablog.com

さて、2年前の記事にもありますが、インフォマティクスと他分野の融合は、バイオ・インフォマティクス、ケモ*1インフォマティクス、といった分野において先行して行われていたようです。
バイオ・インフォマティクスでは、遺伝子に対してどのような形質が発現するか、ということをインフォマティクス的に分析しよう、という取り組みが主であると理解しています。
また、ケモ・インフォマティクスでは、化合物の情報(例えば、官能基の種類、側鎖の長さなど)から、物性を分析しよう、ということが行われていると理解しています。
両者は、ある程度の成功をおさめ、遺伝子、化合物の情報から、それぞれ形質、物性を予測することができるようになってきていると思っています。また、逆に所望の形質を発現する遺伝子、所望の物性を具備する化合物を求めること(逆問題を解く)ことも可能であると思っています。

一方で、MIは、上記のようなことを何とかやろうとしているが、なかなか苦労している、というフェーズであるとみています。
なぜ苦労しているか、ということに関して一言で表現すると、「あまりに材料に関するパラメータが多すぎる」であると考えます。
詳しくいうと、材料の物性を決める「材料側の」パラメータがあまりに多すぎて、しかも、材料の「機能を決める」パラメータもまた多い、ということです。

材料というと、ある程度の形を持っていて、何かしらの機能を発現することになります。機能には、その材料が何であるかにもよるのですが、構造材料であれば強度、防食性、対候性などが挙げられ、磁性材料では、磁力(正確な表現ではないが)、キュリー点などが挙げられる、といった具合です。

具体例として、わたしは触媒が少し得意なので触媒で説明します。
例えば排ガス触媒を例にとると、触媒のシステム全体から触媒のハニカム部分を抜き出したとき、材料側のパラメータとして以下のものが(ごく一部ですが)挙げられます*2

  • ハニカムに関するパラメータ
  • 触媒層に関するパラメータ
    • 触媒層の厚さ
    • 触媒層の空隙率
    • 触媒層の貴金属(金属種、合金状態、表面状態、粒径など)
    • 触媒層の担体(種類、粒径、添加剤など)

……*3

細かいものまで挙げ始めると本当にキリがありません。

一方で、機能のパラメータとしては、例えば、浄化性能、耐久性が挙げられます(これもまた一部です。)。
この機能のパラメータの種類が多くあることもまずそうなのですが、さらに、それぞれの性能に関して、取得する条件によってその性能の値が変化し、掛け算するととんでもない組み合わせの数になります。そのうえ、それぞれの性能は独立であったり、はたまた相関したり(トレードオフであることが典型的ですが)、総合的に使えるか、という判断を難しくします。
そして、取得する条件が一定でないこともよくある話です。

ここでまたもう一つの問題があります。材料を性能評価のために試作しようと思ったら、非常に工程が複雑であることが多い、ということです。
引き続き排ガス触媒の例を持ち出せば、ハニカムは何か適当に決めるとして、触媒の機能を主に決定づける貴金属と担体を調製し、スラリー(液体と粉の混ざりもの)とし、ハニカムに塗る方法があります。
様々な性能を実現するため、様々な層がハニカムへ塗布されることもままあります。
上記の材料のパラメータを実現するために、工程の条件を調整することになるわけですが、各工程におけるいわゆる「条件出し」もそう簡単ではなく、試験の回数をそう多くこなせるわけではないことは想像に難くありません。
そして、上述もしましたが、試験におけるデータを取得する条件が一定でないこともよくある話です。

もちろん、ケモ・インフォマティクスで化合物を合成するのも複雑で面倒なこともあるじゃないか、という批判はその通りです、しかし、材料の厄介なところは、化合物は構造を決めれば物性がある程度一意に決まるのに対し、材料はその工程による影響が無視できない点です。むしろ工程だけで物性が大きく変化してしまうことも良くあります*4
材料は、化合物によって構成されるより高次元のものであるといえますので、そのようなことは起こって当然です*5

以上より、MIでは以下の3つ点に困難があると考えています*6

  1. 材料側のパラメータ(説明変数)が多すぎる
  2. 機能のパラメータ(目的変数)が多すぎる*7
  3. 解析に必要なデータを揃えることが難しい

ではどうすればよいか、ということについては、様々な方が取り組まれていると認識しています。
例えば、ということで以下にリンクを掲載いたします。

| 情報統合型物質・材料開発イニシアティブ
マテリアルキュレーション―材料情報を俯瞰して分野横断的に活用する―
TARO HITOSUGI (一杉 太郎)
共同発表:高分子太陽電池、人工知能で性能予測~1,200個の実験データから有効性を実証~
従来型製造業に限界、三菱ケミやブリヂストンが帰納的アプローチのAIに活路 | 日経クロステック(xTECH)

MIでは何ができるか?

2年前の記事でも、材料の開発には使えるだろう、という趣旨のことが書かれていますが、そのことについて言及します。

まず、一口にMIといっても、説明変数と目的変数によって大きく2つに分類すべきと考えています。

  • 説明変数が工程、目的変数が材料モジュールの機能:

用いる素材や原料、工程の条件から材料モジュールの機能を予測しよう、また、所望の機能を発現する工程の条件はこれというパターンです。ここでいう材料モジュールは、複数の材料が組み合わさってできるものをいい、例えば、排ガス触媒のように比較的複雑な系を想定しています。

  • 説明変数が工程、目的変数が材料の機能や状態:

上記でいうところの中間材料、つまりモジュールを構成する材料単体の機能や状態が目的変数となる場合です。例えば、排ガス触媒の例でいえば、触媒粒子の粒径などがこれにあたります。

上記分類のうち、おそらく前者が狭義のMIだと思っていて、後者は広義のMIに含まれるもので、もっといえばプロセス・インフォマティクス(PI)にあたるものだと思っています。
2年前の記事では、PIはもうできるんじゃないか、ということをちらっと言っています。

これはその通りだと今でも思っています。PIは、かなり定式化されている、いわゆる「実験計画法」を含むような概念であると思っています。
例えば、とある中間材料に求められる性能を決めておき、例えば工程の条件を振ってみて、最適条件を導き出す、というものがあり得ます。
この最適条件を導き出すにあたり、例えば統計的な解析方法*8をうまく使ってやることをPIと呼んでいるのだと思います。
ただし、これをいざ実践しようと思うと、扱う対象やその製造方法について理解が深く、つまり、化学や材料科学、機械工学について理解していて、かつ、統計的な処理についても理解がある人(またはチーム)でなくては、うまく結果を導き出せないでしょう。これについては次回のテーマで詳述します。

また、狭義のMIについては、PIで得られた中間材料の性能を説明変数として、材料モジュールの性能を目的変数にするような方式をとれば、実現できるものと思っています。
工程が非常に長い場合、2段階の解析ではうまくいかず、多段階の解析になることもありうると思います。
ここで、本当の意味で狭義のMIを実現しようと思った場合、データプラットフォームの設計や、自動で実験してくれる機構の導入が必要になってくるでしょう。
例えば、優れた機能の材料モジュールを得るための工程の条件を決めたい、という開発の場合を考えます。このとき、多段階の解析に供することができるような、すなわち、複数の材料の工程のデータをうまく統合できるデータプラットフォームである必要があるでしょう。また、データをいちいち人の手で取るのは非現実的ですから、自動でデータを収集できる状態であることが望ましいでしょう。

さて、本題に戻ると、MI(PIを含む)では何ができるか、ということについては、材料の開発には既に適用できるんじゃないかという前提で話を進めていきます。
MIでは何ができるか、ということに対する直接的な答えは、「材料開発にかかるコストを削減できる」ことだと思っています。
材料開発のコストとは、時間や人的リソース、資金が含まれます。
ただ、強調しておきたいのは、「MIを用いれば高性能な材料が開発できるわけではない」ということです。MIは開発をアシストしてくれるツールである、ともいえます。

あくまで、材料開発において、設定した条件の中で最適な条件を素早く導き出せるだけであって、その設定した範囲を超えて最適な条件を導き出してくれることはないと考えています*9
つまり、設定した範囲に所望の性能を満たすものがないのであれば、当然、MIを適用したところで所望の性能を満たすものができるはずがありません。
この場合、MIを適用すると、その範囲に解がなさそうだ、ということが通常よりも低コストで判明する、という効果は得られるといえます。
次回詳しく述べますが、範囲設定、すなわち、大まかな方針に誤りがあれば、その一連の開発からはいいものが出てこないことになります。これは、仮に人がやっても、機械がやっても同じことです。
センスのない開発からは、いくら素早く遂行しても、いいものが出てくるわけではないのです。

上段で、「材料開発にかかるコストを削減できる」のコストには、時間や人的リソース、資金が含まれる、と書きましたが、なかでも、時間と人的リソースが削減できるのは大きなメリットになり得ます。
特に、時間の削減は、市場にいち早く参入して利益を最大化するという観点からは非常に重要です。
また、実験をするだけの人員に関するリソースは、自動で実験を行ってくれる機構(ロボットなど)の導入により、理想的には不要になります。少なくとも、効率のよい実験により、開発者が実験の遂行に使わざるを得ない時間は削減できます。
開発を継続して行っていく観点で、資金的な意義だけでなく、開発者が開発の大まかな方針に集中できるという意義も大きいと考えます。つまり、浮いた時間で、論文を読むなり、学会に出るなり、戦略を考えるなりして、次の種を探したり、開発の方向性をより良い方向にしたりするような活動に充てる、つまり種々のセンスを磨くことが理想的であると考えています。

さて、材料の「開発」については上で述べましたが、材料の「研究」についても、MIは導入できるものと考えています。
例えば、一通りデータをとってみたが、説明変数(実験条件など)と目的変数(性能など)の関係がどうもわからん、次に何をしてみたらいいかちょっと解析しかねる、という場合に適用できると思っています。
つまり、性能などに寄与しているパラメータが何であるか、解析してみて、次の実験または解析方針に関するヒントを得る、という使われ方はあるんじゃないかと思います。
実際、パラメータが3つ以上ある場合、単純に性能をプロットすることがまず困難ですし、仮にプロットができるとしても、人間が理解できるものになりません。ここで、統計学的な処理によって相関を見つけてもらう、ということには大きな意味を見出すことができます*10
これも、膨大な組み合わせやありうる機序の中から、データに基づいた方針を定め、試行回数を最小限にするという意味で、コストの削減に寄与するものではないでしょうか。

以上より、MIでは何ができるか?という問いに対する答えは、「材料開発にかかるコストを削減できる」であるといえます。
ただし、MIを適用したからといっていいものができるとは限らず、MI活用する際も、そもそもの開発に必要な種々のセンスが不必要になることはないと考えています。

小括

MIは、データを集める時点で困難があり、解析も一筋縄ではいかないため、難しい部分があることを述べました。
一方で、MIは材料開発にかかるコストを削減することができることも述べました。ただし、MIは決して万能のツールではなく、開発には従来通りセンスが必要であることには変わりないことを強調しました。
データベースと、研究者・開発者としてのインフォマティクスに対する考え方については次回に譲ります。

追記
後編を書きました。
piroriblog.hatenablog.com

*1:化学のこと。決してそういった性癖ではない

*2:可能な限り挙げようと思ったのですが多すぎて途中で諦めました

*3:もうゴールしてもいいよね……?

*4:金属に関して、ミクロな組織が硬さに影響することは過去の記事でも少しふれました。金属のしわ寄せ - ぴろりのくせになまいきだ。

*5:決して化学が材料科学に比して劣っているとかそういうことではありません

*6:これは完全に私見ですが、マーケティング等の分析よりも複雑性が高い可能性すらあります

*7:付随してデータが揃いにくく、いわゆる「次元の呪い」に陥りやすい

*8:好ましい表現ではないと思いますが、いわゆる機械学習またはAIでもよいでしょう

*9:これができるようになるのが強化学習の類だと考えています

*10:ただし、本当の意味での新規な発見そのものはできず、あくまでもアシストするものだとは思います