SMILES記法 SMILES記法の概要

SMILES記法

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/08/20 17:56 UTC 版)

ナビゲーションに移動 検索に移動

SMILES表記は1980年代の終わりにDavid Weiningerにより開発され、その後に多数の人の手で変更あるいは拡張がなされてきた。中でもDaylight Chemical Information Systems社の貢献が大きい。他の線形な同様な表記法としてはWiswesser Line Notation (WLN), ROSDAL そして SLN (Tripos社)が挙げられる。

グラフ理論に基づいた記法の定義

グラフ理論に基づくコンピュータ処理の観点では、SMILESは分子グラフ英語版深さ優先で走査して、節点原子)と結合)を表現する文字列である。分子グラフの構築では、まず系の水素原子を取り除き(ただし不斉中心を除く)、環を形成しているところは切り開いて全域木spanning tree)に変換する。環を開いたところには数字でラベル付け(後置)して、つながっていた節点同士を示す。丸括弧parenthesis, ())はが分枝している場所を表すのに使用する。

原子は角括弧bracket, [])でくくられるが、organic subset、すなわち B, C, N, O, P, S, F, Cl, Br, I のいずれかで、形式電荷を持たず、同位体を陽に指定する必要がなく、かつ不斉中心でない場合は[]を省略してもよい。この場合は原子価に基づいて水素が暗黙的に付加しているものとみなされる。たとえばONはそれぞれアンモニアである(水素を陽に書くと[H]O[H]などになるが、このように書かれることはほとんどない)。形式電荷を持っている場合は+-と数字を後置する(たとえばアンモニウムイオン[NH4+] (II) は[Fe+2])。同位体を陽に指定する場合は質量数を整数で前置する(たとえば炭素14[14C])。不斉中心については後述する。

結合は一重から順に-=#で、芳香環(1.5重結合)では:で表される(ただし一重結合-は通常省略される)。OpenSMILES 拡張で四重結合は$ である。二重結合=につながっている一重結合の向きを/\で表すことでシス-トランス異性体を区別する。たとえばC/C=C\CC/C=C/Cはそれぞれシス・トランス2-ブテンである。結合がないことは.で表現される(たとえば過酸化水素OOに対しO.Oは水2分子)。

環構造ではつながっている原子の後ろに数字でラベル付けする。たとえばプロパンシクロプロパンをSMILESで表すとそれぞれCCCC1CC1となる。 ラベルの数字は1つの原子に1つが原則だが、あるラベルがすでに2箇所に現れ、その2箇所のペアが同一の原子であることを示す役目を終えた場合は、その数字を別のペアのために再利用してもよい。 ラベルは一桁の数字とみなされ、たとえばC12はラベル12につながっている炭素である。二桁のラベルを表すには%を前置する(たとえばC%12はラベル12)。

芳香環を構成する原子(炭素窒素酸素リン硫黄ヒ素セレン;OpenSMILES 拡張ではさらにホウ素)は小文字にする。例えばシクロヘキサンC1CCCCC1に対しベンゼンc1ccccc1である。芳香環の結合を一重・二重結合で表すこと(ベンゼンを1,3,5-シクロヘキサトリエンのようにC1=CC=CC=C1)をケクレ化 (英語: kekulization) とよぶことがある。

不斉中心には@または@@を後置し、の方向から見てそれぞれ左回り・右回りに後続の原子団が並んでいることを表す(@が左回りのため)。たとえばS-アラニンのSMILESは、アミノ基を根にするとN[C@@H](C)C(=O)Oである(N[C@@]([H])(C)C(=O)Oのように書いてもよい)。

ある系についてのSMILESは必ずしも一意に定まらず、たとえばS-アラニンは上記のSMILESだけでなく、C[C@H](N)C(=O)OC[C@@H](C(=O)O)NOC(=O)[C@H](C)Nなどでも表すことができる。そのため、あるアルゴリズムに基づいて系に対し一意になるよう変換したものを、正規化された(canonical)SMILESと呼ぶ。ただし、データベースやプログラムによってはアルゴリズムが違うことがある。

化学反応は原系>>生成系または原系>触媒など>生成系で表される。たとえばプロペンに水が付加してプロパン-2-オールができる反応はCC=C.O>>CC(O)Cである。

詳細については[1][2]を参照すること。

発展

SMARTS[3]は部分構造検索ができるようにSMILESを拡張したものであり、化学データベース検索プログラムなどで使用される。原子ならびに結合についてのクエリが追加されており、たとえば[C,c]は任意の(脂肪族または芳香族の)炭素にマッチする。

SMIRKS[4]はSMILESとSMARTSのハイブリッドで、一般的な化学反応を記述する。




「SMILES記法」の続きの解説一覧




SMILES記法と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「SMILES記法」の関連用語

SMILES記法のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



SMILES記法のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのSMILES記法 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS