ぴろりのくせになまいきだ。

世間に平和はおとずれなぁい

The Witness 感想と考察

"The Witness"というゲームを、やっているのを横で眺めたり、自分で操作したりしながら一通り最後までやったので、感想と考察を残しておきます。
途中からネタバレ込みの感想と考察となるので、プレイ前の方でネタバレを気にされる方はご注意ください。なお、ネタバレが含まれ得る部分の前には注意喚起を付します。

最初にネタバレしない範囲で感想と考察をまとめておくと、
「これ、研究に携わる人が体験するアレだ」
です。
『研究に携わる人』には、任意の属性が入っても良いです。
ある意味で人を狂わせるゲームであるのは間違いないと思います。見える世界が変わってしまう、そんなゲームです。

ということで、以下、詳細を書いていきます。

ゲーム紹介

開発元・販売元はThekla, Inc.で、プロデューサーはジョナサン・ブローです。
初出は2016年です。

このゲーム、SIEの「Play At Home」で無料配信されていたゲームタイトルのうちの一つなので、購入済みとなっている方もいるのではないでしょうか。
SIE、『Horizon Zero Dawn』など計10作品を外出自粛の支援で無料配布へ。『ABZU』『サブノーティカ』『Enter the Gungeon』などの良作が期間限定でPSからダウンロードできる(電ファミニコゲーマー) - Yahoo!ニュース
Steamで配信もされていますし、箱でも遊べるようです。

ゲームのジャンルは、「パズル+オープンワールド」というのが妥当でしょうか。
Steamに紹介文があったので、以下は一部を引用しました。

目が覚めてみると、あなたはたった独りで謎に満ちた奇妙な島にいます。驚きと挑戦が待ちうける島に。

自分が誰なのか、どうしてここにいるのかも分からないまま、あなたは探検を始めます。謎解きの手がかりを見つけ、記憶を呼び起こし、無事に家に帰れることを願いながら。

もう少し詳しく言うと、一人称視点で島のあちこちにある一筆書きパズルを解いていくゲームです。
特に攻略順は設定されておらず、自由に島を探索できます。

ゲームシステム的な観点からいうと、レベルデザインが良くできていて、「なんだこれ→わかった!」という体験が数多く得られます。
ただ、本当に何の説明もなされない(テキストによる説明が一切ない)ので、プレイヤーがルールを「理解する」しかありません。
そういった意味では、人を選ぶかもしれませんが、少なくとも脱出ゲームが好きな人は問題ないでしょう。
試行錯誤する場面は多くあるかもしれませんが、必ずヒントが提示されており、解けないことはありません。解けないとしたら、その解き方をまだ知らないだけです。

とはいえ、パズルの難易度はそれなりに高く、全く攻略を見ずに一人でやると50時間くらいかかるかもしれません。
二人でやっていたので、それなりに早く終えることはできました(おそらく30~40時間)。

また、ミニマルながら美しい風景が多くあり、ただ島を探索しているだけでもそれなりに楽しめます。

ネタバレなしの感想

個人的にパズル自体は好きなので、楽しく解くことができました。
ただ、一人でやっていると行き詰まったときにイライラするかもしれません。可能ならば、何らかの形で複数人でやるほうが良いかもしれません。ゲーム体験自体は何ら損なわれないと思います。
むしろ、ああでもない、こうでもないとやりながらのほうが楽しいかもしれません。

パズルそのものは比較的単純なのですが、一定の「ルール」があり、無数の解が存在し得るときは「ヒント」に従って特定の解を選択することになります。
この「ルール」はチュートリアル的なものが存在するので、無理なく理解することができました。
「ヒント」は、注意深く観察する必要があり、また、一人称視点であることもよく活かされていて感心しました*1
(ちなみに、そのままの設定だと少し酔い、設定をいじると解消されました。)

また、「ヒント」は多くの場合隠されていたり、抽象化されていたり、多少の論理的な導出が必要だったりするので、環境に対して非常に注意深くならざるを得ず、環境の些細な点に対しても疑念を抱くようになります。
さらに、あちこちに「意味がありそうでなさそうなもの」がたくさんあります。『謎に満ちた奇妙な島』と称しているくらいですから、それは文字通りではありますが。
ある意味で人を狂わせるゲーム、というのは、この点からくるとも言えます(詳しくはネタバレありのほうで述べます。)。

プレイ中、プレイ後には、普段の生活においても、ついつい疑い深くなってしまい、「見えなかったはずのものが見えるようになる」ミーム汚染が引き起こされるのは間違いないでしょう。
少なくともわたしは「見える」ようになってしまいました。ある意味で、「世界の見え方が変わるゲーム」です。

ちなみに、あちこちに音声やムービーがあり、結構お勉強になります。制作陣の教養が垣間見えました。


もしプレイ中の方でここを読んでいるとしたら、スタッフロールのようなものをまだ見ていないのであれば、まだ見ていないエンディングがあるよ、とだけ言っておきます。
頑張って探せと言われても難しいでしょうから、ヒントを書いておきます。
「ゲームが終わった後、もう一度ゲームを始めて少し進めると、あなたは見えなかったものが見えるようになっているはず。」

ということで以下、そのエンディングまで見た人用の感想です。ご注意ください。
いや上のヒントでもわからん!という人向けに、一応もう少し踏み込んだヒントも最初に書いておきます。










ネタバレありの感想と考察

*1:一見VRゲーにもできそうですが、おそらくそれはできないでしょう

続きを読む

材料屋から見たインフォマティクス2021(後編)

前回の記事はこちらです。
piroriblog.hatenablog.com

前回の記事では、以下のテーマを掲げ、そのうち、「MIは何が難しいのか」「MIでは何ができるか?」について取り上げました。

MIは何が難しいのか

MIでは何ができるか?

データはどこから?

インフォマティクスが当たり前になった場合の研究開発

後編では、「データはどこから?」「インフォマティクスが当たり前になった場合の研究開発」について書いていきたいと思います。
前回の記事に引き続いて、マテリアルズインフォマティクスのことは「MI」と省略します。

データはどこから?

まず、大前提として、MIをはじめとしたインフォマティクスの類は、データを必要とします。
そしてそのデータは解析可能でなければならず、そのデータが意味のあるものである必要があります。

何を言っているかというと、MIは優れた結果が勝手に出てくる打ち出の小槌のようなツールではない、ということであって、優れた結果を出すためには優れたインプットが必要である、ということです。
さらに言えば、データがあっても、形式がまちまちであったり、電子データでなかったり、適用しようとしている分野に全く関係がなかったりするものは、(少なくともそのままでは)データとしての価値がありません。
もし、うちは長くやってるからデータが蓄積されているはずで、MIのツールを導入すれば効率が上がる、と思っている人は考えを改めてください。

以下、インプットに用いられるデータと、その使われ方について説明します。
また、インプットに用いられるデータは、「実験データ」、「計算データ」、および、「文献データ」の3種類に分類し、説明します。

  • 実験データ

この記事では、「実験データ」は、実際に実験を行って得られたデータを指すものとします。さらに、「実験データ」はその組織内でのみ扱われるクローズドなデータを指すこととします。したがって、実験データについては、実験条件などが比較的詳細に記録されているものとします。

MIのインプットに用いるデータは、当然、実験データであることができます。
前回も述べたように、MIは材料開発を加速するツールであると考えています。MIの一つの側面として、適切な実験を行い、得られたデータについて分析を行い、さらに次の実験を行う、またさらに得られたデータについて分析を行い……という実験のループを素早く、また、効率よく回していくツールであると言ってしまっても良いかもしれません。
また、様々な説明変数(実験条件など)を絡めて解析することができますので、小さな差によって大きな結果の違いを生んでいることに気づいたり、工程の改善に用いたりすることができると考えています。
後述する計算データを用いるものよりは、どちらかというとプロセス寄りな手法になるかもしれません。

ただし、上述したように、解析可能な形でデータが記録されていないと意味がありません。
過去のデータがあっても、形式が全然違うとか、エクセルで管理しているけど1つのセルに複数の情報が入っているとか、人によって書き方が違うとか、そもそも紙であるとか、そういったものは、少なくともそのままでは実験データとしては解析できません。
そのあたりのリテラシーをどうしていくか、ということも課題になってくると思います。このあたりについては、後段のテーマで詳述します。

データの必要数については、どのような解析をするかによって変化すると考えています。
場合によっては十数個でもよいかもしれませんし、数百個が必要な場合もあると思います。解析の手法等に関しては正直詳しくないので、他を参照ください。

ここで、実験をロボット等で完全に自動で行うことができれば、実験のにおける人間の出番は、試薬の補充とロボットのメンテナンスくらいになるかもしれません。
ただ、前回も述べたように、実験の範囲そのものや実験の思想は、人間が考えて決めなければならないと思っています。これについても後段のテーマで詳述します。

  • 計算データ

「計算データ」とは、実験を直接的に行わず、計算によって得られたデータを指します。
実験の代わりに計算でデータを生成してしまおう、という考え方になります。
この方法は、材料探索時に使用されることが多い印象です。
例えば、特定の用途において既に研究されている材料のパラメータを計算し、特定の用途において必要なパラメータと、材料のパラメータとの相関関係を見出し、適切な材料を選択する、というものがあると思っています。
もちろん、適切な材料を導き出した後は、実際に実験してみて、主に相関関係を見出す段におけるパラメータを修正するようなフィードバックを行う流れになると思います。

計算の手法は、何であっても良いと思いますが、第一原理計算で物性を予測するパターンを多く見かける気がします。
ただし、例えば第一原理計算のように計算コストが大きいと、そもそも計算に時間がかかるので、その計算を行っていく順番も統計的に最適にしてやろう、という話もあります*1

ただ、この計算データは、世の中に入手可能で、統一的なデータベースがないので計算しているに過ぎないことは注意が必要かと思います。
つまり、材料に関するデータがすでに計算されていて、データベース化されているならば、それを利用すればよいわけです。
利益が絡んできたりもするので何とも言えませんが、もしある範囲(例えば、企業、業界、国など)で協力してデータベースをこしらえるようなことができるのであれば、それに越したことはないと思います。もし、実験データも紐づけられるならば、より価値があると思います*2

  • 文献データ

「文献データ」は、文字通り、文献から収集したデータを指します。
既にやってる人たちはいるのだからそこからデータを収集してしまおう、という考え方になります。
この手法も、材料探索時に用いられることが多い印象です。
文献は、主に論文になると思います。
例えば、論文から、願わくば自動で、場合によっては手動で*3データを抽出し、記載されているパラメータとの関係性をもとに、材料を探索していきます。
機械学習の進歩により、論文から自動でデータを収集できるようになる日はそう遠くないとは思っています。

ここで、「実験データ」および「計算データ」と性格の異なる点は、自分で方向性を決めて取得したデータでないものがもとになる、という点です。
論文のデータは、もちろん自分のものが含まれていても良いですが、他人のものが大半になると思います。
そうなると、データの取得状況が異なるので、同一のデータベースにそのまま突っ込んでよいのか、という懸念が生じます。そもそもそのデータは信頼できるのかという話もあり、うまく選別する必要もありそうです。
また、各論文おいて、特定の用途の性能以外のデータが同じである、ということもほぼないでしょう。したがって得られるのは歯抜けのデータとなるため、解析にはひと工夫が必要となるかもしれません。

ここで、種々の材料パラメータは計算で、実際の実験コストは高いので既報のデータを用いるという方式もありうると思います。
逆に、既に文献にある材料パラメータを抽出し、特定の用途における特性は実験する、という手もありうると思います。

ただし、文献データを収集する際は、材料開発において、どの材料を用いるかという点以外に、その材料の状態が物性に大きな影響を及ぼしうることで、材料の状態は工程によって変化する、ということに留意しなければなりません。
この点は、そもそもMIを難しくしている要因であることは前回の記事でも述べましたが、データ収集の際にも、この点は意識されなければなりません。さもないと、不適切な文献に記載されたデータを参照する可能性があるためです。


以上、3つのデータに関することを述べました。
冒頭でも述べたように、MIはデータがないと始まりません。
いかに質の良いデータを集めてくるかが、MIではじき出される結果のクオリティを左右します。
そして、少なくとも現状ではデータから内挿的に結果をはじき出すので、データを収集する範囲を見誤ると目的の材料はいつまでたっても得られないことになります。

また、解析についてはあまり触れませんでしたが、万能な解析方法はなく、ケースバイケースである、という認識を持っています。
どういったデータを収集し、どのように解析すればよいかについては、材料の知識とともに情報科学の知識も必要になってくるので、どちらかの専門家が、もう一方を習得する必要があるでしょう。これについては次のテーマで述べます。

インフォマティクスが当たり前になった場合の研究開発

研究開発は、もはやインフォマティクスが当たり前と言っても過言ではない時代に突入していると考えています。
おそらく、ケモ・インフォマティクスの範疇と思われる製薬についてはもうインフォマティクスが当たり前であると認識しています*4。その流れは間違いなく材料の分野にも来ることでしょう。
材料分野の研究開発者、またその関係者は、まずその認識を持つ必要があると考えます。
ここでは、インフォマティクスを適用した研究開発が当たり前になった場合の心構えについて述べます。
私は材料屋なので、情報屋の方々に偉そうなことは言えませんが、情報科学の立場の人がMIをやろうと思ったときの心構えについても、お願いの形で言及します。

インフォマティクスが当たり前になったときの研究開発者の心構え(理解すべきこと)としては、以下の3つがあると考えています。

  • MIのスキームの理解
  • 材料が性能を発現する機序の理解
  • 誰でも材料が開発できることに対する理解

以下、それぞれの項目について説明していきます。

  • MIのスキームの理解

MIのスキームを理解していないと、どのようなデータが必要か、どのような形式でデータを残せばよいか、どのような実験を行うのが効率が良いか、などについて効果的な案を出すことができません。当たり前ですが、仮にツールが導入されたとしても、使いこなすことができません。
MIのスキームの理解には、少なくとも統計学の知識が必要になるでしょう。そもそも研究開発はデータを扱うのですから、統計学の知識は必須級です。

また、スキームの理解には、できることとできないことの理解も含まれると考えています。できないことをやろうとしても原理上できるわけがなく、どうしたらMIができることに持っていけるか、という課題設定を行えるようになるべきではないかと考えます。
さらに、スキームの理解は、いわゆる(?)「手段の目的化」を防ぐために有効であると考えています。つまり、MIを導入することが目的とならないようにしつつ、何を達成したいからMIを導入するのだ、という思考のためにスキームの理解が有効であると思います。
もっとも、これはMIの導入に限った話ではないのですが。

もっと言えば、これはMIの導入初期にも関係する話ですが、MIを適用した研究開発を円滑に進めるための土壌を醸成するためにも、スキームの理解は必要であると思っています。
なぜならば、実際にデータを取得する人は自分だけではなく、ほかの人に何かをお願いすることが多々あり、その際になぜそのようなお願いをしてるか、を説明する必要があると考えているためです。何かやり方を変える場合、たいていの人は嫌がるため、その説得にはもっともらしい理由が必要でしょう。
もっとも、これもMIの導入に限った話ではなく、人に何かをやってもらう上で、意図を伝えるのは当然行われるべきだとは思うのですが。

  • 材料が性能を発現する機序の理解

実際にMIを用いて開発を行っていく上では、開発者が機能を発現する機序を理解していることが重要と考えます。
これは今もそうかもしれませんが、要するにお勉強しなさいよ、ということです。雰囲気で材料開発をやっているじゃあありません。

原理上、こうすればうまくいくとは思うんだけど、あまりにパラメータの組み合わせが多すぎてとても実験できない、というパターンにおいては、MIは非常に有効でしょう。
一方、所望の性能は決まっているのだけど、どうやって達成したらよいか見当もつかない、という場合はMIもお手上げです。前回も述べたように、MIはあくまで開発を加速するツールですので、筋の悪い開発からは筋の悪いものしか出てきません。ローカルミニマムに落ちるだけです*5
少なくとも、所望の物性に関連する材料側のパラメータを列挙できるようにしておかないと、有効な実験もできませんし、データの解析も難しくなります。データの解析まで自分でやるならばまだしも、ほかの人にお願いするのであれば、少なくともどういう機序が想定されるかについては説明できるべきと考えます。
全体としては、方向性は人間が決めてあげて、最適化をMIにやってもらう、という流れになるでしょう。

また、上で述べたお勉強には、材料そのものに関するものだけでなく、その使われ方なども含まれます。材料はどこかで使う人がいて初めて価値が生まれますので、誰も使わない材料を開発しても仕方がありません。

逆に、情報科学側の方々に対するお願いとしては、材料の物性に関係するパラメータは多くあり、同じ配合でも作り方によっても物性は左右されうることを頭に入れておいてほしい、ということです。
そのうえで、モデルを構築したり、データの収集を行ったりする際には、適切なフレームワークで行われているかを都度確認してほしい、と考えています。
ただ、何らかの理由があって物性が変化していることは間違いないので、それを解明することは可能であると信じています。そういった部分に興味がある方は、ぜひ材料の世界にも足を踏み入れてみていただけると幸いです。

  • 誰でも材料が開発できることに対する理解

この「誰でも」には二つの意味が含まれます。
一つは「正しいアイデアを持つ人なら」という意味で、もう一方は「どの企業でも」という意味です。

「正しいアイデアを持つ人なら」というのは、例えば若い人があり得ます。職級は高くないけど現場にいる目利きの人、であっても良いでしょう。
仮に、全自動で実験をしてくれる環境があるならば、その設定が全てであるといえます。多くの人を動かせなかったとしても、アイデアさえ正しければ、良いアウトプットが出てくるはずです。
逆に言えば、研究開発において管理だけしてるような人は不要になるでしょう。その分野における専門知識がより重要になっていくはずで、勉強をしない人は研究開発の現場から退場するほうが皆のためになる、と言われても不思議ではありません*6

「どの企業でも」というのは、例えば、競合他社が自社の材料を簡単に模倣できるようになるかもしれないし、取引先が内製するようになるかもしれない、ということが挙げられます。
仮に、とある材料の製造に際して、ノウハウとして製造方法や鼻薬のようなものを秘匿していたとして、その材料が入手可能であれば、MIを用いて同じ材料を製造できる可能性がある、ということです。設備投資云々のバランスが許せば、これは誰でも行いうることになります。
そうなってくると、材料を作る立場としては、完成品に近いものを作っている立場のメーカーと共同して市場の開拓をし、そこに必要な材料を供給するという姿勢をとるか、または、設備投資の面で他には作らせないだけの規模にしてしまうか、といったものが挙げられます。

また、どの企業でも比較的短期間で材料が開発できるとなれば、知財戦略もそれに適応したものにしなければならないでしょう。
ノウハウとして秘匿できるものであるのか、特許出願して参入障壁を築くのか、その判断をより厳密にしていくべきと考えます。
また、特許化するとしても、どのような権利範囲を取得しにいくかはよく考えねばなりません。発明の本質が何であって、同じ特性を達成しようと思ったらどのような方法がありうるか、ということを今まで以上によく考えねばならないでしょう。

小括

MIではデータが必要であり、質の良いデータを集める必要性があることを述べました。集めるデータは、目的に応じて適切な範囲のものを収集する必要があることも言及しました。
また、材料の研究開発においてMIが当たり前になったとき、MIのスキームと、研究開発対象となる材料に対する理解が重要であることを述べました。
ここで、MIが当たり前となると、ビジネスの考え方、知財戦略の考え方にも変化が起こりうること指摘しました。

まとめ

MIについて、何ができるか、何に気を付けるべきか、何をしていくべきか、どのような変化をもたらしうるか、について書いたつもりです。
簡単にまとめるなら、MIは材料開発をアシストするツールであり、開発そのものの方向性は開発者が決めなければならず、開発者はMIの特性を理解したうえでデータの収集と実験を行う必要がある、となると思います。

本来であれば、出典をきちんと書いて言及すべき内容が多いですが、諸般の事情によりできない部分が多くあり、このような形となっていること、ご容赦ください。
また、必ずしも正確でない内容がありますので、実際に何かを進めていく際には、成書等を参考にされることを強くお勧めします。

前後編にわたってずいぶん長くなってしまいましたが、以上としたいと思います。
皆様のMIに関する解像度が少しでも向上したならば幸いです。

*1:マシンパワーの増強でこういう話は徐々になくなっていくかもしれませんが……

*2:材料立国を目指すのであればうまいことやってほしいものですが……

*3:学生がやってくれた旨の話を何回も聞きました

*4:その業界の方がいたら詳しく教えてください

*5:とはいえ、失敗からの発見はもちろんありますので、いろいろ試してみるのは悪いことではないと思っています

*6:でも結局若手にチャンスはそうそうめぐってこないんだろうなあという諦念があります

材料屋から見たインフォマティクス2021

みなもすなる「いんふぉまてぃくす」といふものを、ということで、もう現場を離れてしまったのですが、ちょっとかじろうとした人が思ったことを書いておきます。

あらかじめ断っておきますが、一つの論旨に基づいて書かれる形式ではなく、各テーマについて思うところを書いていこうと思います。
まとまりがなくて申し訳ありませんがご容赦ください。
また、個人の見解も多く含みますので、その点はご容赦ください。何か間違いなどがありましたら、ご指摘いただけると大変ありがたいです。

マテリアルズ・インフォマティクスと書いていると毎回長いので、以下では「MI」と省略します。

今回のテーマ

MIは何が難しいのか

MIでは何ができるか?

データはどこから?

インフォマティクスが当たり前になった場合の研究開発

それでは、各テーマについて書いていきたいと思います。
1つの記事にするには少々長くなりそうですので、「データはどこから?」と「インフォマティクスが当たり前になった場合の研究開発」については分割して別の記事としたいと思います。

MIは何が難しいか

そもそも、MIが何か、という話から始めます。
MIとは、材料科学(マテリアルサイエンス)に対して、情報に関連する分野(インフォマティクス)の知見や手法を適用し、両者を融合していこう、という分野だと捉えています。
これに関しては、2年程前に書いた記事も参考になると思います。このころは情報収集を始めてすぐでしたが、おおよそ間違っていないと思われます。
piroriblog.hatenablog.com

さて、2年前の記事にもありますが、インフォマティクスと他分野の融合は、バイオ・インフォマティクス、ケモ*1インフォマティクス、といった分野において先行して行われていたようです。
バイオ・インフォマティクスでは、遺伝子に対してどのような形質が発現するか、ということをインフォマティクス的に分析しよう、という取り組みが主であると理解しています。
また、ケモ・インフォマティクスでは、化合物の情報(例えば、官能基の種類、側鎖の長さなど)から、物性を分析しよう、ということが行われていると理解しています。
両者は、ある程度の成功をおさめ、遺伝子、化合物の情報から、それぞれ形質、物性を予測することができるようになってきていると思っています。また、逆に所望の形質を発現する遺伝子、所望の物性を具備する化合物を求めること(逆問題を解く)ことも可能であると思っています。

一方で、MIは、上記のようなことを何とかやろうとしているが、なかなか苦労している、というフェーズであるとみています。
なぜ苦労しているか、ということに関して一言で表現すると、「あまりに材料に関するパラメータが多すぎる」であると考えます。
詳しくいうと、材料の物性を決める「材料側の」パラメータがあまりに多すぎて、しかも、材料の「機能を決める」パラメータもまた多い、ということです。

材料というと、ある程度の形を持っていて、何かしらの機能を発現することになります。機能には、その材料が何であるかにもよるのですが、構造材料であれば強度、防食性、対候性などが挙げられ、磁性材料では、磁力(正確な表現ではないが)、キュリー点などが挙げられる、といった具合です。

具体例として、わたしは触媒が少し得意なので触媒で説明します。
例えば排ガス触媒を例にとると、触媒のシステム全体から触媒のハニカム部分を抜き出したとき、材料側のパラメータとして以下のものが(ごく一部ですが)挙げられます*2

  • ハニカムに関するパラメータ
  • 触媒層に関するパラメータ
    • 触媒層の厚さ
    • 触媒層の空隙率
    • 触媒層の貴金属(金属種、合金状態、表面状態、粒径など)
    • 触媒層の担体(種類、粒径、添加剤など)

……*3

細かいものまで挙げ始めると本当にキリがありません。

一方で、機能のパラメータとしては、例えば、浄化性能、耐久性が挙げられます(これもまた一部です。)。
この機能のパラメータの種類が多くあることもまずそうなのですが、さらに、それぞれの性能に関して、取得する条件によってその性能の値が変化し、掛け算するととんでもない組み合わせの数になります。そのうえ、それぞれの性能は独立であったり、はたまた相関したり(トレードオフであることが典型的ですが)、総合的に使えるか、という判断を難しくします。
そして、取得する条件が一定でないこともよくある話です。

ここでまたもう一つの問題があります。材料を性能評価のために試作しようと思ったら、非常に工程が複雑であることが多い、ということです。
引き続き排ガス触媒の例を持ち出せば、ハニカムは何か適当に決めるとして、触媒の機能を主に決定づける貴金属と担体を調製し、スラリー(液体と粉の混ざりもの)とし、ハニカムに塗る方法があります。
様々な性能を実現するため、様々な層がハニカムへ塗布されることもままあります。
上記の材料のパラメータを実現するために、工程の条件を調整することになるわけですが、各工程におけるいわゆる「条件出し」もそう簡単ではなく、試験の回数をそう多くこなせるわけではないことは想像に難くありません。
そして、上述もしましたが、試験におけるデータを取得する条件が一定でないこともよくある話です。

もちろん、ケモ・インフォマティクスで化合物を合成するのも複雑で面倒なこともあるじゃないか、という批判はその通りです、しかし、材料の厄介なところは、化合物は構造を決めれば物性がある程度一意に決まるのに対し、材料はその工程による影響が無視できない点です。むしろ工程だけで物性が大きく変化してしまうことも良くあります*4
材料は、化合物によって構成されるより高次元のものであるといえますので、そのようなことは起こって当然です*5

以上より、MIでは以下の3つ点に困難があると考えています*6

  1. 材料側のパラメータ(説明変数)が多すぎる
  2. 機能のパラメータ(目的変数)が多すぎる*7
  3. 解析に必要なデータを揃えることが難しい

ではどうすればよいか、ということについては、様々な方が取り組まれていると認識しています。
例えば、ということで以下にリンクを掲載いたします。

| 情報統合型物質・材料開発イニシアティブ
マテリアルキュレーション―材料情報を俯瞰して分野横断的に活用する―
TARO HITOSUGI (一杉 太郎)
共同発表:高分子太陽電池、人工知能で性能予測~1,200個の実験データから有効性を実証~
従来型製造業に限界、三菱ケミやブリヂストンが帰納的アプローチのAIに活路 | 日経クロステック(xTECH)

MIでは何ができるか?

2年前の記事でも、材料の開発には使えるだろう、という趣旨のことが書かれていますが、そのことについて言及します。

まず、一口にMIといっても、説明変数と目的変数によって大きく2つに分類すべきと考えています。

  • 説明変数が工程、目的変数が材料モジュールの機能:

用いる素材や原料、工程の条件から材料モジュールの機能を予測しよう、また、所望の機能を発現する工程の条件はこれというパターンです。ここでいう材料モジュールは、複数の材料が組み合わさってできるものをいい、例えば、排ガス触媒のように比較的複雑な系を想定しています。

  • 説明変数が工程、目的変数が材料の機能や状態:

上記でいうところの中間材料、つまりモジュールを構成する材料単体の機能や状態が目的変数となる場合です。例えば、排ガス触媒の例でいえば、触媒粒子の粒径などがこれにあたります。

上記分類のうち、おそらく前者が狭義のMIだと思っていて、後者は広義のMIに含まれるもので、もっといえばプロセス・インフォマティクス(PI)にあたるものだと思っています。
2年前の記事では、PIはもうできるんじゃないか、ということをちらっと言っています。

これはその通りだと今でも思っています。PIは、かなり定式化されている、いわゆる「実験計画法」を含むような概念であると思っています。
例えば、とある中間材料に求められる性能を決めておき、例えば工程の条件を振ってみて、最適条件を導き出す、というものがあり得ます。
この最適条件を導き出すにあたり、例えば統計的な解析方法*8をうまく使ってやることをPIと呼んでいるのだと思います。
ただし、これをいざ実践しようと思うと、扱う対象やその製造方法について理解が深く、つまり、化学や材料科学、機械工学について理解していて、かつ、統計的な処理についても理解がある人(またはチーム)でなくては、うまく結果を導き出せないでしょう。これについては次回のテーマで詳述します。

また、狭義のMIについては、PIで得られた中間材料の性能を説明変数として、材料モジュールの性能を目的変数にするような方式をとれば、実現できるものと思っています。
工程が非常に長い場合、2段階の解析ではうまくいかず、多段階の解析になることもありうると思います。
ここで、本当の意味で狭義のMIを実現しようと思った場合、データプラットフォームの設計や、自動で実験してくれる機構の導入が必要になってくるでしょう。
例えば、優れた機能の材料モジュールを得るための工程の条件を決めたい、という開発の場合を考えます。このとき、多段階の解析に供することができるような、すなわち、複数の材料の工程のデータをうまく統合できるデータプラットフォームである必要があるでしょう。また、データをいちいち人の手で取るのは非現実的ですから、自動でデータを収集できる状態であることが望ましいでしょう。

さて、本題に戻ると、MI(PIを含む)では何ができるか、ということについては、材料の開発には既に適用できるんじゃないかという前提で話を進めていきます。
MIでは何ができるか、ということに対する直接的な答えは、「材料開発にかかるコストを削減できる」ことだと思っています。
材料開発のコストとは、時間や人的リソース、資金が含まれます。
ただ、強調しておきたいのは、「MIを用いれば高性能な材料が開発できるわけではない」ということです。MIは開発をアシストしてくれるツールである、ともいえます。

あくまで、材料開発において、設定した条件の中で最適な条件を素早く導き出せるだけであって、その設定した範囲を超えて最適な条件を導き出してくれることはないと考えています*9
つまり、設定した範囲に所望の性能を満たすものがないのであれば、当然、MIを適用したところで所望の性能を満たすものができるはずがありません。
この場合、MIを適用すると、その範囲に解がなさそうだ、ということが通常よりも低コストで判明する、という効果は得られるといえます。
次回詳しく述べますが、範囲設定、すなわち、大まかな方針に誤りがあれば、その一連の開発からはいいものが出てこないことになります。これは、仮に人がやっても、機械がやっても同じことです。
センスのない開発からは、いくら素早く遂行しても、いいものが出てくるわけではないのです。

上段で、「材料開発にかかるコストを削減できる」のコストには、時間や人的リソース、資金が含まれる、と書きましたが、なかでも、時間と人的リソースが削減できるのは大きなメリットになり得ます。
特に、時間の削減は、市場にいち早く参入して利益を最大化するという観点からは非常に重要です。
また、実験をするだけの人員に関するリソースは、自動で実験を行ってくれる機構(ロボットなど)の導入により、理想的には不要になります。少なくとも、効率のよい実験により、開発者が実験の遂行に使わざるを得ない時間は削減できます。
開発を継続して行っていく観点で、資金的な意義だけでなく、開発者が開発の大まかな方針に集中できるという意義も大きいと考えます。つまり、浮いた時間で、論文を読むなり、学会に出るなり、戦略を考えるなりして、次の種を探したり、開発の方向性をより良い方向にしたりするような活動に充てる、つまり種々のセンスを磨くことが理想的であると考えています。

さて、材料の「開発」については上で述べましたが、材料の「研究」についても、MIは導入できるものと考えています。
例えば、一通りデータをとってみたが、説明変数(実験条件など)と目的変数(性能など)の関係がどうもわからん、次に何をしてみたらいいかちょっと解析しかねる、という場合に適用できると思っています。
つまり、性能などに寄与しているパラメータが何であるか、解析してみて、次の実験または解析方針に関するヒントを得る、という使われ方はあるんじゃないかと思います。
実際、パラメータが3つ以上ある場合、単純に性能をプロットすることがまず困難ですし、仮にプロットができるとしても、人間が理解できるものになりません。ここで、統計学的な処理によって相関を見つけてもらう、ということには大きな意味を見出すことができます*10
これも、膨大な組み合わせやありうる機序の中から、データに基づいた方針を定め、試行回数を最小限にするという意味で、コストの削減に寄与するものではないでしょうか。

以上より、MIでは何ができるか?という問いに対する答えは、「材料開発にかかるコストを削減できる」であるといえます。
ただし、MIを適用したからといっていいものができるとは限らず、MI活用する際も、そもそもの開発に必要な種々のセンスが不必要になることはないと考えています。

小括

MIは、データを集める時点で困難があり、解析も一筋縄ではいかないため、難しい部分があることを述べました。
一方で、MIは材料開発にかかるコストを削減することができることも述べました。ただし、MIは決して万能のツールではなく、開発には従来通りセンスが必要であることには変わりないことを強調しました。
データベースと、研究者・開発者としてのインフォマティクスに対する考え方については次回に譲ります。

追記
後編を書きました。
piroriblog.hatenablog.com

*1:化学のこと。決してそういった性癖ではない

*2:可能な限り挙げようと思ったのですが多すぎて途中で諦めました

*3:もうゴールしてもいいよね……?

*4:金属に関して、ミクロな組織が硬さに影響することは過去の記事でも少しふれました。金属のしわ寄せ - ぴろりのくせになまいきだ。

*5:決して化学が材料科学に比して劣っているとかそういうことではありません

*6:これは完全に私見ですが、マーケティング等の分析よりも複雑性が高い可能性すらあります

*7:付随してデータが揃いにくく、いわゆる「次元の呪い」に陥りやすい

*8:好ましい表現ではないと思いますが、いわゆる機械学習またはAIでもよいでしょう

*9:これができるようになるのが強化学習の類だと考えています

*10:ただし、本当の意味での新規な発見そのものはできず、あくまでもアシストするものだとは思います