ゲノムから身体的特徴を推測するAI登場...”生命科学界の異端児”クレイグ・ヴェンター氏が研究

ロボティア編集部2017年12月6日(水曜日)

その研究結果とは、人間のゲノムを分析して得たデータを使い、顔、肌の色、身長、体重、年齢など、身体的特性を推測できる人工知能プログラムを開発したというもの。研究を牽引したのは、米ヒューマン・ロンジェビティ(Human Longevity.Inc)。“生命科学界の異端児”と呼ばれるクレイグ・ヴェンター氏が、2013年に設立した会社だ。

今回、研究者たちは米サンディエゴに住む1061人の全ゲノムを分析。研究対象は、アフリカ系黒人569人、ヨーロッパ系白人273人、中南米系63人、東アジア系63人、南アジア系18人、その他75名。平均年齢は36歳で、年齢帯は18歳から82歳までとなった。

収集したゲノムデータを分析した研究者たちは、続いて、そのゲノムから身体特性を“逆”に推測する人工知能プログラムを開発。推測結果からモンタージュを作成した。その結果、遺伝的に単純な特性、例えば目(虹彩)の色、肌の色、性別などを正確に予測することに成功したという。一方、顔立ちや声のような複雑な特性については精度が落ちた。が、これはある程度予想された結果だったという。

最も気になるのは顔全体の再現度だが、研究者らは水平、垂直、深さなど三次元に顔を区分し、ゲノム解析による予測精度が高い領域を明かしている。それによると、水平方向では鼻と唇の幅、垂直方向では顔の上下、深さでは額下部と鼻、唇の突出具合がかなり正確に推測できたという。一方、声については高さ(ピッチ)をとりわけ正確に推測できたが、他の領域はランダムに近かい結果になったという。

Photo by Human Longevity.Inc HP

背(身長)の場合は“推測力”が高いことが実証され、その平均的な絶対誤差は4.9㎝に過ぎなかった。一方、体重は精度が低く、平均絶対誤差が15.6㎏となった。肥満には環境が大きな影響を及ぼすと考えると、ある意味、合理的な結果だという。次いで、年齢の場合、平均絶対誤差は8年だった。年齢は、テロメア(染色体の末端部にある構造)の長さと、X染色体(女性)またはY染色体(男性)の損失程度を分析・推測した。年齢を重ねるほどテロメアが短くなり、性染色体の損失部位が多くなるからだ。

研究者はまた、ゲノムデータによって当該人物を発見できる確率も調査した。AIプログラムに当該人物が含まれた10名の身体データを提示した際、言い当てる確率は74%だったそうだ。サンプル数を10倍に増やし100人のデータを人工知能に提示した際も、正解率が30%と高い数値を示したという。

研究者らは論文で「1061人という『小さな』データサイズによる統計分析能力の制限にもかかわらず、かなり良い予測力を見せた(中略)より多くのデータが蓄積され分析手法が向上すれば、予測精度がさらに高くなるだろう」と、研究の将来性について見通しを語っている。

今後、ゲノム解析とAIという先端テクノロジーが掛け合わさった時、どのようなイノベーションが生まれてくるのだろうか!?

参照サイト

Photo by pnas.org