阿部 貴志(あべ・たかし)
Takashi Abe
職位:助教
学位:博士(理学)(総合研究大学院大学)
●山形大学大学院理工学研究科博士前期課程電子情報工学専攻修了
●協和発酵(株)、(株)ザナジェン研究員、大学共同利用機構法人情報・システム研究機構、国立遺伝子研究所、生命情報・DDBJセンター助教、総合研究大学院大学助教を経て本学へ
専門分野
ゲノムインフォマティクス、環境ゲノム科学
研究テーマ
2008年以降、次世代シーケンサーの登場により膨大な量のゲノム配列が解読されている。従来のゲノム解析で用いられてきた情報学的手法では膨大な解析時間が掛かるだけでなく、適確な知識発見も困難になっている。全く異なった原理に基づく、超大規模データ解析技術の確立が求められている。そこで、大規模データから視覚的に理解し易い形式で特徴抽出が可能な自己組織化マップ(SOM)に着目し、超大量ゲノム配列の特徴を俯瞰的に理解することを可能とする一括学習型SOM(BLSOM)を開発した。公的研究機関が所有する、我が国の最高性能スーパーコンピュータを用いたBLSOM解析で以下の研究を行っている[1.3-5]。
(1)BLSOMを用いた比較ゲノム解析
ゲノム配列が解読されている約36,000種を対象に、遺伝子のコドン頻度やゲノム配列の連続塩基頻度に着目した比較ゲノム解析を実施し、生物種固有の連続塩基の存在、および生物種ごとに高精度な分類が可能なことを明らかにした [5]。ゲノム個性に寄与する連続塩基の生物学的意味を探索することで、大量のゲノム配列情報から生物学的機能の特徴も把握できる。
(2)多様な環境より取得されたメタゲノム配列に対する系統推定法の開発と生物多様性の解明
多様な地球環境で生育する微生物類の99%は培養困難であるが、この未開拓なゲノム資源の活用を目指したメタゲノム解析が数多く実施されている。メタゲノム解析は、環境に生息する生物種の全体像の把握や有用遺伝子群の探索を可能にする。しかし、新規性の高い遺伝子配列ほど、配列相同性検索が適用できず、生物系統やタンパク質機能の推定は難しい。そこで、ゲノム配列が持つ塩基組成の類似性に着目するアラインメントフリーな手法であるBLSOMを適用し、我が国の最高機能水準のスーパーコンピュータを用いて、連続塩基頻度に基づく系統推定法[3.4]や、連続アミノ酸頻度に基づくタンパク質機能推定法[1]を開発した。環境中に生息する微生物群集が持つ代謝システムの概要を知ることができる。
(3)エキスパートがキュレートしたtRNAデータベース:tRNADB-CE
エキスパートが精査を加えた世界的に最も精度が高いtRNA遺伝子データベースを公開している(http://trna.nagahama-i-bio.ac.jp)[2]。シニア世代研究者の専門知識の活用と若手研究者や学生への知識継承の一つのモデルケースとして、実施している。

Topics of research
It is one of the most important tasks of life science to unveil unknown basic knowledge from a large amount of accumulated information of genomic sequences. With the increasing amount of available sequences, novel tools are needed for comprehensive analyses of species-specific sequence characteristics for a wide range of genomes. Self-Organizing Map (SOM) is an effective tool for clustering and visualizing high-dimensional complex data on a two-dimensional map. We developed a modified SOM (BLSOM) for genome informatics [1.3-5].
I analyzed the following research topics using BLSOM.
1. Comparative genome analyses for unveiling genome signature
We found that BLSOM could classify genomic sequence fragments according to species without any information other than oligonucleotide frequencies in a wide range of genomes [5]. BLSOM recognized, in most sequence fragments, species-specific characteristics of oligonucleotide frequencies, permitting species-specific classification of sequences without any information regarding species. The BLSOM, which can systematically characterize species-specific genome signature of all prokaryotes and eukaryotes analyzable, proves a new powerful bioinformatics strategy to study biodiversity and molecular evolution.
2. A novel bioinformatics strategy for unveiling microbial diversity and protein functions of metagenome sequences
Metagenomic approach, which is the genome analysis on a mixture of uncultured microorganisms, has been recently developed to search for novel and industrially useful genes and to study microbial diversity in a wide variety of environments. Using a BLSOM for tetranucleotide composition in 1-kb sequence fragments, most of the sequences obtained by metagenomic studies were classified (self-organized) according to phylotypes without any phylogenetic information. Because the BLSOM is a powerful tool for phylogenetic classification of genomic fragments, we could predict phylotypes of a large number of published environmental sequences [3.4].
Using a BLSOM for oligopeptide composition, we developed a system to enable separation (self-organization) of proteins by function [1]. The BLSOM was applied to predict protein functions for a massive amount of genomic sequence fragments derived from environment samples.
BLSOM could provide a new systematic strategy for revealing basic knowledge obtained from uncultured microorganisms including viruses in a wide variety of environmental samples.
主な業績論文等
- Abe T., Kanaya S., Uehara H. and Ikemura T., A novel bioinformatics strategy for function prediction of poorly-characterized protein genes obtained from metagenome analyses. DNA Res., 16: 287-298. (2009)
- Abe T., Ikemura T., Ohara Y., Uehara H., Kinouchi M., Kanaya S., Yamada Y., Muto A. and Inokuchi H., tRNADB-CE: tRNA gene database curated manually by experts. Nucleic Acids Res., 37: D163-D168. (2009)
- Uchiyama T., Abe T., Ikemura T. and Watanabe K., Substrate-induced gene-expression screening of environmental metagenome libraries for isolation of catabolic genes. Nature Biotech., 23: 88-93 .(2005)
- Abe T., Sugawara H., Kinouchi M., Kanaya S. and Ikemura T., Novel Phylogenetic Studies of Genomic Sequence Fragments Derived from Uncultured Microbe Mixtures in Environmental and Clinical Samples. DNA Res., 12: 281-290. (2005)
- Abe T., Kanaya S., Kinouchi M., Ichiba Y., Kozuki T. and Ikemura T., Informatics for unveiling hidden genome signatures. Genome Res., 13: 693-702.(2003)


