特許公開公報文章からの化学物質名の抽出 [Published online J. Comput. Chem. Jpn., 21, 1-9, by J-STAGE]

[Published online Journal of Computer Chemistry, Japan Vol.21, 1-9, by J-STAGE]
<Title:> 特許公開公報文章からの化学物質名の抽出
<Author(s):> 田中 るみ子, 中山 伸一
<Corresponding author E-Mill:> pbb00275(at)nifty.ne.jp
<Abstract:> 化学知識を有効活用するには,化学物質名とその構造,機能,製造方法,化学反応,用途などを効率よく抽出,整理,蓄積することが必要であるが,それには多大な時間と労力を伴う.英文からの化学物質名抽出については多くの研究が行われ,一定の成果が得られている.一方日本語文の場合,英文のように単語が空白や記号によって区切られていないため,化学物質名を単語として扱うには,最初に形態素解析を行って単語に区切り,細かく分離された単語をひとかたまりの単語として連結する必要がある.しかしながら,連結により,不要な部分が化学物質名についてしまう場合もある.本論文では,特許公開公報に化学物質名をタグ付けしたコーパスを作り,化学物質名の文字種,配置,前後の関係,文脈などに着目した単語切り出しとWord2Vecによるベクトル化を行い,コーパスを学習データとした機械学習モデルによる日本語文からの化学物質名抽出の可能性について検討する.
<Keywords:> chemical substance name, compound name, patent publication, machine learning, Word2Vec, binary classification
<URL:> https://www.jstage.jst.go.jp/article/jccj/21/1/21_2021-0047/_article/-char/ja/

準結晶ペンローズタイルクラスタにおける周辺構造修飾と中心局在相 [Published online J. Comput. Chem. Jpn., 21, 10-19, by J-STAGE]

[Published online Journal of Computer Chemistry, Japan Vol.21, 10-19, by J-STAGE]
<Title:> 準結晶ペンローズタイルクラスタにおける周辺構造修飾と中心局在相
<Author(s):> 金崎 翼, 石井  楽士, 武田 京三郎
<Corresponding author E-Mill:> takeda(at)waseda.jp
<Abstract:> 準結晶格子は短距離秩序と長距離非周期性という新たな構造的特質を有する.本研究ではこの格子の幾何的特質に依って生じ得る電子構造の特徴の抽出を試みた.具体的には典型的準結晶二次元格子であるペンローズタイル(PT)模様を想定し,そのクラスター化により対象系の簡素化を図った.さらに1格子原子1電子近似を行い,Harrison法とSlater-Koster法を組み合わせた強結合近似を用いて,当該系の電子構造を算出し,その体系化を行った. その結果,PTが有する5回回転対称短距離秩序と長距離非周期性により,クラスタ中心部位に強く局在する準位が発現する可能性を見出した.この準位はその中心局在性により,PTC外周辺部位に対し”構造鈍感”である.従って5回対称性を保持するように当該PTC類の周辺構造修飾(原子団の除去及び付加)を行えば,其れに伴う電子数の可変により,同準位のSOMO化が可能となる.こうして,短距離秩序と長距離非周期性という準結晶の幾何的特徴により,中心部位に局在かつ露出化された電子スピン状態の創出が期待できる事が明らかとなった.
<Keywords:> Penrose tile, clusters, quasicrystal, peripheral modification, central localization
<URL:> https://www.jstage.jst.go.jp/article/jccj/21/1/21_2022-0006/_article/-char/ja/

モチーフコドン縮約表現に基づいた動的計画 (DP) 法によるゲノム機能部位推定システムの開発 [Published online J. Comput. Chem. Jpn., 21, 20-32, by J-STAGE]

[Published online Journal of Computer Chemistry, Japan Vol.21, 20-32, by J-STAGE]
<Title:> モチーフコドン縮約表現に基づいた動的計画 (DP) 法によるゲノム機能部位推定システムの開発
<Author(s):> 大友 将宏, 小林 貴史, 加藤 博明
<Corresponding author E-Mill:> ohtomo(at)kuicr.kyoto-u.ac.jp
<Abstract:> 高等生物のゲノム配列にはタンパク質に翻訳されるエクソン領域とそれ以外のイントロン領域が存在し,その複雑な構造の中から機能部位を推定するのは一つの大きな課題である.一方,タンパク質アミノ酸配列にはその機能と密接な関係がある特徴的な配列パターンであるモチーフが保存され,遺伝子配列にもよく保存されていると考えられる.本研究ではコドン縮約表現とその近似表現を用いた,動的計画 (DP) 法によるゲノム機能部位推定システムを開発した.さらに,公共データベースのモチーフ辞書PROSITEのアミノ酸配列モチーフに対応する遺伝子配列を定量的に表現したコドン重み行列を基にした,モチーフコドン縮約表現を提案した.はじめに,HumanのTNNC1ゲノム配列に対してタンパク質のコーディング配列 (CDS) の推定実験を行った.次に,Humanをはじめとするいくつかのモデル生物種のTNNC1とHPCAゲノム配列に対してEF-handモチーフの推定実験を行い,システムの有用性を示した.
<Keywords:> codon reduced representation, dynamic programming, functional site estimation, PROSITE, protein-gene motif
<URL:> https://www.jstage.jst.go.jp/article/jccj/21/1/21_2022-0005/_article/-char/ja/